• 热门行业
  • 装修建材
  • 家居生活
  • 餐饮食品
  • 母婴教育
  • 电脑办公
  • 服装首饰
  • 汽车工具
  • 家电数码
  • 机械化工
  • 休闲美容
返回上一页
专利状态
语音合成模型训练方法和语音合成方法
有效
专利申请进度
申请
2020-12-10
申请公布
2021-04-09
授权
2022-09-02
预估到期
2040-12-10
专利基础信息
申请号 CN202011454223.7 申请日 2020-12-10
申请公布号 CN112634856A 申请公布日 2021-04-09
授权公布号 CN112634856B 授权公告日 2022-09-02
分类号 G10L13/02;G10L13/08;G10L19/16;G10L25/30
分类 乐器;声学;
申请人名称 思必驰科技股份有限公司
申请人地址 江苏省苏州市苏州工业园区新平街388号腾飞创新园14栋
专利法律状态
  • 2022-09-02
    授权
    状态信息
    授权
  • 2021-05-25
    著录事项变更
    状态信息
    著录事项变更;IPC(主分类):G10L13/02;变更事项:申请人;变更前:苏州思必驰信息科技有限公司;变更后:思必驰科技股份有限公司;变更事项:地址;变更前:215123 江苏省苏州市苏州工业园区新平街388号腾飞创新园14栋;变更后:215123 江苏省苏州市苏州工业园区新平街388号腾飞创新园14栋
  • 2021-04-27
    实质审查的生效
    状态信息
    实质审查的生效;IPC(主分类):G10L13/02;申请日:20201210
  • 2021-04-09
    公布
    状态信息
    公布
摘要
本发明公开一种语音合成模型训练方法,所述语音合成模型包括:编码器、说话人嵌入预测网络、时长拓展模块和解码器;该方法包括:对训练数据进行预处理以得到样本训练数据集和目标说话人数据集;基于样本训练数据集训练语音合成模型;基于目标说话人数据集对说话人嵌入预测网络进行自适应训练,以用于基于待合成文本预测说话人嵌入预测值。本发明实施例首先基于样本训练数据对语音合成模型整体进行训练得到通用语音合成模型,进一步基于目标说话人数据集对训练得到的通用语音合成模型中的说话人嵌入预测网络进行自适应训练,以使得说话人嵌入预测网络能够学习到目标说话人的音色特征,从而在语音合成时合成更加贴近目标说话人的音频信号。