• 热门行业
  • 装修建材
  • 家居生活
  • 餐饮食品
  • 母婴教育
  • 电脑办公
  • 服装首饰
  • 汽车工具
  • 家电数码
  • 机械化工
  • 休闲美容
返回上一页
专利状态
一种自动拓增语料的语音合成模型训练方法和系统
有效
专利申请进度
申请
2019-08-07
申请公布
2019-10-29
授权
2022-01-11
预估到期
2039-08-07
专利基础信息
申请号 CN201910726585.8 申请日 2019-08-07
申请公布号 CN110390928A 申请公布日 2019-10-29
授权公布号 CN110390928B 授权公告日 2022-01-11
分类号 G10L13/02;G10L13/047;G10L13/08
分类 乐器;声学;
申请人名称 广州多益网络股份有限公司
申请人地址 广东省广州市萝岗区伴河路90号自编一栋301房
专利法律状态
  • 2022-01-11
    授权
    状态信息
    授权
  • 2019-10-29
    公布
    状态信息
    公布
摘要
本发明公开了一种自动拓增语料的语音合成模型训练方法和系统,收集文本‑语音平行语料,记为原始语料;将每个语音、文本样本按照语音停顿分割成若干语音、文本片段,汇集语音、文本片段记为片段语料;构建语音合成模型;从原始语料中随机选择m个样本,将文本、语音样本分别拼接构成新的语料样本,记为原始构造语料;从片段语料中随机选择n个样本,将文本、语音片段分别拼接构成新的语料样本为片段构造语料;使用原始构造语料和片段构造语料训练语音合成模型;使用原始语料、片段语料和原始构造语料继续训练,直至得到能够稳定合成语音的语音合成模型。本发明提高语音合成模型的泛化能力和稳健程度,使得能够合成各种状况下的文本。