• 热门行业
  • 装修建材
  • 家居生活
  • 餐饮食品
  • 母婴教育
  • 电脑办公
  • 服装首饰
  • 汽车工具
  • 家电数码
  • 机械化工
  • 休闲美容
返回上一页
专利状态
一种复合词识别方法及相关装置
有效
专利申请进度
申请
2018-12-26
申请公布
2019-12-13
授权
2022-12-09
预估到期
2038-12-26
专利基础信息
申请号 CN201811603067.9 申请日 2018-12-26
申请公布号 CN110569498A 申请公布日 2019-12-13
授权公布号 CN110569498B 授权公告日 2022-12-09
分类号 G06F40/284
分类 计算;推算;计数;
申请人名称 东软集团股份有限公司
申请人地址 辽宁省沈阳市浑南新区新秀街2号
专利法律状态
  • 2022-12-09
    授权
    状态信息
    授权
  • 2019-12-13
    公布
    状态信息
    公布
摘要
本申请提供了一种复合词识别方法及相关装置,所述方法包括:获得原始文本中至少两个相邻词;获得所述至少两个相邻词的词向量之和,作为第一向量;根据所述至少两个相邻词在原始文本中的位置,获得所述至少两个相邻词的合并词;获得所述合并词的词向量,作为第二向量;若所述第一向量和所述第二向量之间的关系与预设关系模型匹配,确定所述合并词属于复合词;其中,所述预设关系模型用于表示复合词的分词的词向量之和与复合词的词向量之间的关系。可见,本申请实施例通过将词向量之间的关系,与预设关系模型进行匹配,实现了一种对复合词进行识别的方式,进一步解决了在分词处理等情况中对复合词不合理拆分的问题。