• 热门行业
  • 装修建材
  • 家居生活
  • 餐饮食品
  • 母婴教育
  • 电脑办公
  • 服装首饰
  • 汽车工具
  • 家电数码
  • 机械化工
  • 休闲美容
返回上一页
专利状态
一种词嵌入表示方法、装置及设备
有效
专利申请进度
申请
2019-12-23
申请公布
2020-06-02
授权
2023-04-28
预估到期
2039-12-23
专利基础信息
申请号 CN201911336859.9 申请日 2019-12-23
申请公布号 CN111222327A 申请公布日 2020-06-02
授权公布号 CN111222327B 授权公告日 2023-04-28
分类号 G06F40/284;G06F40/216;G06N3/042;G06N3/08
分类 计算;推算;计数;
申请人名称 东软集团股份有限公司
申请人地址 辽宁省沈阳市浑南新区新秀街2号
专利法律状态
  • 2023-04-28
    授权
    状态信息
    授权
  • 2020-06-02
    公布
    状态信息
    公布
摘要
本申请公开一种词嵌入表示方法、装置及设备,所述方法包括:对待处理文本进行分词处理,得到分词结果;其中,所述分词结果中包括待表示词语;将所述待表示词语输入至word2vec模型中,经过所述word2vec模型的处理后,得到所述待表示词语的第一词向量;其中,所述word2vec模型为利用与所述待处理文本属于同领域的数据样本训练得到;以及,将所述待表示词语输入至Bert模型中,经过所述Bert模型的处理后,得到所述待表示词语的第二词向量;其中,所述Bert模型为利用不限领域的数据样本训练得到;结合所述第一词向量和所述第二词向量,确定所述待表示词语的词向量,以实现所述待表示词语的词嵌入表示。本申请结合word2vec模型输出的第一向量和Bert模型输出的第二向量,为待表示词语确定词向量,能够最大化的提高词嵌入表示效果。