• 热门行业
  • 装修建材
  • 家居生活
  • 餐饮食品
  • 母婴教育
  • 电脑办公
  • 服装首饰
  • 汽车工具
  • 家电数码
  • 机械化工
  • 休闲美容
返回上一页
专利状态
文本识别方法、装置、电子设备以及存储介质
有效
专利申请进度
申请
2019-05-22
申请公布
2019-08-16
授权
2022-03-08
预估到期
2039-05-22
专利基础信息
申请号 CN201910431256.0 申请日 2019-05-22
申请公布号 CN110134792A 申请公布日 2019-08-16
授权公布号 CN110134792B 授权公告日 2022-03-08
分类号 G06F16/35;G06F16/36;G06F40/216
分类 计算;推算;计数;
申请人名称 北京金山数字娱乐科技有限公司
申请人地址 北京市海淀区小营西路33号金山软件大厦2层西区
专利法律状态
  • 2022-03-08
    授权
    状态信息
    授权
  • 2019-08-16
    公布
    状态信息
    公布
摘要
本说明书提供文本识别方法、装置、电子设备以及存储介质,其中所述文本识别方法包括:获取多个文本的文本集;提取文本集中文本的主题关键词,并获取从文本集中至少一个文本中提取的实际主题关键词;确定主题关键词在文本集中每个文本的第一分布,以及实际主题关键词在文本集中每个文本的第二分布;将携带第一分布和第二分布的文本集中文本输入分类器进行识别,获得文本集中文本的关键句和非关键句;通过文本识别方法,能够快速准确的获取文本的关键句和非关键句,通过对文本的非关键句进行清洗,方便了对文本的关键句进行标注,提高了知识图谱的构建效率,并通过保留文本的关键句,方便了用户在查阅文本时能够快速的了解文本的主要内容。