• 热门行业
  • 装修建材
  • 家居生活
  • 餐饮食品
  • 母婴教育
  • 电脑办公
  • 服装首饰
  • 汽车工具
  • 家电数码
  • 机械化工
  • 休闲美容
返回上一页
专利状态
一种同义词挖掘方法和装置
有效
专利申请进度
申请
2016-12-28
申请公布
2017-05-10
授权
2022-12-06
预估到期
2036-12-28
专利基础信息
申请号 CN201611233743.9 申请日 2016-12-28
申请公布号 CN106649783A 申请公布日 2017-05-10
授权公布号 CN106649783B 授权公告日 2022-12-06
分类号 G06F16/33;G06F16/35;G06F40/247;G06F40/279;G06F40/30
分类 计算;推算;计数;
申请人名称 上海智臻智能网络科技股份有限公司
申请人地址 上海市嘉定区金沙江西路1555弄398号7层
专利法律状态
  • 2022-12-06
    授权
    状态信息
    授权
  • 2017-05-10
    公布
    状态信息
    公布
摘要
本发明公开了一种同义词挖掘方法和装置,所述方法包括:对获取的语料数据进行分词处理,得到多个单独词;计算所述单独词的词向量;根据所述词向量对所述单独词进行聚类处理,得到同义词集。本发明使用词向量的方法来表征词的含义,然后,利用聚类算法对得到的词向量进行语义聚类,能够有效的实现广义同义词集的挖掘,为自然语言处理中解决同义词挖掘的难题提供新的思路和方法。并且,当将挖掘的同义词集应用于自然语言处理领域时,可以提高知识点过滤任务、关键词提取任务、文本分类任务、语义聚类任务等的准确性。