• 热门行业
  • 装修建材
  • 家居生活
  • 餐饮食品
  • 母婴教育
  • 电脑办公
  • 服装首饰
  • 汽车工具
  • 家电数码
  • 机械化工
  • 休闲美容
返回上一页
专利状态
标点符号标注模型及其训练方法、设备、存储介质
有效
专利申请进度
申请
2019-09-27
申请公布
2020-01-10
授权
2024-01-02
预估到期
2039-09-27
专利基础信息
申请号 CN201910925881.0 申请日 2019-09-27
申请公布号 CN110674629A 申请公布日 2020-01-10
授权公布号 CN110674629B 授权公告日 2024-01-02
分类号 G06F40/20;G06F40/284;G06F40/289;G06F40/166;G06N3/08
分类 计算;推算;计数;
申请人名称 上海智臻智能网络科技股份有限公司
申请人地址 上海市嘉定区金沙江西路1555弄398号7层
专利法律状态
  • 2024-01-02
    授权
    状态信息
    授权
  • 2020-02-11
    实质审查的生效
    状态信息
    实质审查的生效;IPC(主分类):G06F40/20;申请日:20190927
  • 2020-01-10
    公布
    状态信息
    公布
摘要
标点符号标注模型及其训练方法、设备、存储介质,所述方法包括:获取包含标点符号的第一训练语料;将第一训练语料输入预设的具有时间序列的神经网络模型进行预训练,获得预训练的语言子模型;获取包含标点符号的第二训练语料,将第二训练语料去除标点符号,并在已去除的标点符号的前后分词单元处标注相应的标签组合,得到第三训练语料;将第三训练语料输入初始的标点符号标注模型进行迁移学习训练,得到训练好的标点符号标注模型,其中,标点符号标注模型包括预训练的语言子模型,第三训练语料包括无标点文本集合和标签序列集合。上述方案无需人工标注大量的训练数据,提高召回率,获得的标点符号标注模型具有较好的泛化能力及通用性。