• 热门行业
  • 装修建材
  • 家居生活
  • 餐饮食品
  • 母婴教育
  • 电脑办公
  • 服装首饰
  • 汽车工具
  • 家电数码
  • 机械化工
  • 休闲美容
返回上一页
专利状态
一种语言模型的训练方法及装置
有效
专利申请进度
申请
2019-01-29
申请公布
2019-05-24
授权
2023-06-20
预估到期
2039-01-29
专利基础信息
申请号 CN201910086877.X 申请日 2019-01-29
申请公布号 CN109800435A 申请公布日 2019-05-24
授权公布号 CN109800435B 授权公告日 2023-06-20
分类号 G06F16/35;G06F40/289;G06F40/216;G06N20/00
分类 计算;推算;计数;
申请人名称 北京金山数字娱乐科技有限公司
申请人地址 北京市海淀区小营西路33号金山软件大厦2层西区
专利法律状态
  • 2023-06-20
    授权
    状态信息
    授权
  • 2019-06-18
    实质审查的生效
    状态信息
    实质审查的生效;IPC(主分类):G06F17/27;申请日:20190129
  • 2019-05-24
    公布
    状态信息
    公布
摘要
本申请公开了一种语言模型的训练方法及装置,所述方法包括:在获取到包括大量样本文本的语言模型训练数据后,可以将这些样本文本进行分词处理,以得到每一分词的分词标签,其中,分词标签包括对应分词中的每一字在对应分词中的位置信息,接着,可以根据这些样本文本中每一分词的分词标签,对语言模型进行训练。可见,本申请将样本文本的分词标签作为训练数据对语言模型进行训练,使得训练语言模型所使用的数据更为全面,从而能够降低语言模型的PPL值,提升了语言模型的效果。