• 热门行业
  • 装修建材
  • 家居生活
  • 餐饮食品
  • 母婴教育
  • 电脑办公
  • 服装首饰
  • 汽车工具
  • 家电数码
  • 机械化工
  • 休闲美容
返回上一页
专利状态
信息抽取方法及装置
有效
专利申请进度
申请
2018-04-28
申请公布
2018-10-12
授权
2022-04-19
预估到期
2038-04-28
专利基础信息
申请号 CN201810401030.1 申请日 2018-04-28
申请公布号 CN108647194A 申请公布日 2018-10-12
授权公布号 CN108647194B 授权公告日 2022-04-19
分类号 G06F40/131;G06F40/143;G06F40/30;G06F40/295
分类 计算;推算;计数;
申请人名称 北京神州泰岳软件股份有限公司
申请人地址 北京市海淀区海淀大街34号8层818室
专利法律状态
  • 2022-04-19
    授权
    状态信息
    授权
  • 2020-10-13
    著录事项变更
    状态信息
    著录事项变更;IPC(主分类):G06F17/22;变更事项:申请人;变更前:北京神州泰岳软件股份有限公司;变更后:北京神州泰岳软件股份有限公司;变更事项:地址;变更前:100089 北京市海淀区万泉庄路28号万柳新贵大厦A座601室;变更后:100080 北京市海淀区海淀大街34号8层818室
  • 2019-12-20
    专利实施许可合同备案的生效、变更及注销
    状态信息
    专利实施许可合同备案的生效;IPC(主分类):G06F17/22;合同备案号:X2019990000214;让与人:北京神州泰岳软件股份有限公司;受让人:中科鼎富(北京)科技发展有限公司;发明名称:信息抽取方法及装置;申请日:20180428;申请公布日:20181012;许可种类:排他许可;备案日期:20191127
  • 2018-11-06
    实质审查的生效
    状态信息
    实质审查的生效;IPC(主分类):G06F17/22;申请日:20180428
  • 2018-10-12
    公布
    状态信息
    公布
摘要
本发明实施例公开一种信息抽取方法及装置,该方法包括:获取待抽取信息的文本和抽取表达式,所述抽取表达式包括区域确定规则和信息抽取规则,所述区域确定规则中包含统计算子,所述统计算子表征用于识别文本中的命名实体和/或依存成分的统计模型;利用统计模型识别所述文本中的命名实体和/或依存成分,为识别出的命名实体和/或依存成分分别标记对应的识别标签;利用所述识别标签比对所述区域确定规则和所述文本,确定所述文本中的有效抽取区域;从所述有效抽取区域中抽取出与所述信息抽取规则匹配的字符串。上述方法以规则的方式来调用统计模型,方便灵活,同时扩大了识别词汇的范围,减少规则构建,更加准确地抽取出用户需要的信息。