• 热门行业
  • 装修建材
  • 家居生活
  • 餐饮食品
  • 母婴教育
  • 电脑办公
  • 服装首饰
  • 汽车工具
  • 家电数码
  • 机械化工
  • 休闲美容
返回上一页
专利状态
语音合成模型的改进方法和语音合成方法及装置
有效
专利申请进度
申请
2020-07-24
申请公布
2020-10-30
授权
2022-09-27
预估到期
2040-07-24
专利基础信息
申请号 CN202010721985.2 申请日 2020-07-24
申请公布号 CN111862934A 申请公布日 2020-10-30
授权公布号 CN111862934B 授权公告日 2022-09-27
分类号 G10L13/02;G10L13/04
分类 乐器;声学;
申请人名称 思必驰科技股份有限公司
申请人地址 江苏省苏州市苏州工业园区新平街388号腾飞创新园14栋
专利法律状态
  • 2022-09-27
    授权
    状态信息
    授权
  • 2020-10-30
    公布
    状态信息
    公布
摘要
本发明公开语音合成模型的改进方法和语音合成方法及装置,其中,一种语音合成模型的改进方法,包括:语音合成模型的改进方法,其中,所述语音合成模型包括受x‑vector控制的LSTM模块,所述方法包括:将经由x‑vector提取器提取的说话人嵌入作为所述语音合成模型的额外输入;利用所述说话人嵌入在受x‑vector控制的LSTM模块中,使用控制层来预测对应的控制变量的缩放和偏移。本申请的方法和装置提供的方案通过在引入x‑vector控制的模型参数的无监督自适应方法,合成未见过的说话人音频上,相较有监督自适应方法获得更好的自然度,相交基于说话人嵌入的无监督自适应方法获得更好的相似度。