• 热门行业
  • 装修建材
  • 家居生活
  • 餐饮食品
  • 母婴教育
  • 电脑办公
  • 服装首饰
  • 汽车工具
  • 家电数码
  • 机械化工
  • 休闲美容
返回上一页
专利状态
计算机可读存储介质及词典更新方法
有效
专利申请进度
申请
2015-10-27
申请公布
2018-11-09
授权
2020-05-19
预估到期
2035-10-27
专利基础信息
申请号 CN201810676967.X 申请日 2015-10-27
申请公布号 CN108776709A 申请公布日 2018-11-09
授权公布号 CN108776709B 授权公告日 2020-05-19
分类号 G06F16/33;G06F16/335
分类 计算;推算;计数;
申请人名称 上海智臻智能网络科技股份有限公司
申请人地址 上海市嘉定区金沙江西路1555弄398号7层
专利法律状态
  • 2020-05-19
    授权
    状态信息
    授权
  • 2018-12-04
    实质审查的生效
    状态信息
    实质审查的生效IPC(主分类):G06F 17/30
  • 2018-11-09
    公布
    状态信息
    公开
摘要
一种计算机可读存储介质及词典更新方法,所述方法包括:对接收到的语料进行预处理,以得到文本数据;对所述文本数据进行分行处理,得到语句数据;依照基础词典中包含的单独词对所述语句数据进行分词处理,以得到分词后的词语数据;对相邻的所述分词后的词语数据进行组合处理,以生成候选数据串;判断所述候选数据串是否为特定候选数据串,所述特定候选数据串包括基础名词,且位于所述基础名词的特定相对位置的词语为名词或形容词;对所述候选数据串进行判断处理,以发现新词;在发现新词时,将该新词加入词典,以更新后的词典再次进行分词处理、组合处理和发现新词的过程,直至未发现新词为止。本发明可以提升新词发现的准确率。