• 热门行业
  • 装修建材
  • 家居生活
  • 餐饮食品
  • 母婴教育
  • 电脑办公
  • 服装首饰
  • 汽车工具
  • 家电数码
  • 机械化工
  • 休闲美容
返回上一页
专利状态
用于专业领域的分词方法、装置、存储介质及电子设备
有效
专利申请进度
申请
2019-12-03
申请公布
2020-04-10
授权
2024-01-19
预估到期
2039-12-03
专利基础信息
申请号 CN201911222118.8 申请日 2019-12-03
申请公布号 CN110991182A 申请公布日 2020-04-10
授权公布号 CN110991182B 授权公告日 2024-01-19
分类号 G06F40/289;G06F18/214
分类 计算;推算;计数;
申请人名称 东软集团股份有限公司
申请人地址 辽宁省沈阳市浑南新区新秀街2号
专利法律状态
  • 2024-01-19
    授权
    状态信息
    授权
  • 2020-05-05
    实质审查的生效
    状态信息
    实质审查的生效;IPC(主分类):G06F40/289;申请日:20191203
  • 2020-04-10
    公布
    状态信息
    公布
摘要
本公开涉及一种用于专业领域的分词方法、装置、存储介质及电子设备。方法包括:获取待分词文本中各第一字符的第一字向量;针对待分词文本中的每个第一字符,将第一字符的第一字向量以及多个第一邻近字符的第一字向量共同作为该第一字符的第一特征向量;将第一特征向量输入至预设的多任务学习模型中的、与第一字符对应的子模型中,得到该第一字符的切分预测值;根据多个切分预测值,对待分词文本进行分词。该方法综合考虑了各字符的独特性和关联性,可有效地提升分词的精度。另外,多任务学习模型比单任务学习,放松了部分训练数据与当前学习任务之间的关系,隐式增加了训练数据,有效解决专业领域数据量不足的问题,从而保证专业领域的分词精度。