• 热门行业
  • 装修建材
  • 家居生活
  • 餐饮食品
  • 母婴教育
  • 电脑办公
  • 服装首饰
  • 汽车工具
  • 家电数码
  • 机械化工
  • 休闲美容
返回上一页
专利状态
表格识别方法和装置
有效
专利申请进度
申请
2019-11-25
申请公布
2020-04-24
授权
2023-08-25
预估到期
2039-11-25
专利基础信息
申请号 CN201911164515.4 申请日 2019-11-25
申请公布号 CN111062259A 申请公布日 2020-04-24
授权公布号 CN111062259B 授权公告日 2023-08-25
分类号 G06V30/412;G06F40/289;G06V30/416;G06V30/19;G06F18/23213
分类 计算;推算;计数;
申请人名称 泰康保险集团股份有限公司
申请人地址 北京市西城区复兴门内大街156号泰康人寿大厦
专利法律状态
  • 2023-08-25
    授权
    状态信息
    授权
  • 2020-04-24
    公布
    状态信息
    公布
摘要
本发明公开了一种表格识别方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:识别待检测图像中的字符,将识别出的字符根据字符的纵向位置信息生成文本行;对文本行进行分词处理,依据分词结果确定文本行在表格行属性维度和/或表格内容维度所属的类别,利用确定的文本行类别获取属于同一表格的多个文本行;确定所述多个文本行共有的列分隔线以实现表格识别。该实施方式能够准确识别出表格的版式结构以及单元格中的文本数据。