• 热门行业
  • 装修建材
  • 家居生活
  • 餐饮食品
  • 母婴教育
  • 电脑办公
  • 服装首饰
  • 汽车工具
  • 家电数码
  • 机械化工
  • 休闲美容
返回上一页
专利状态
用于语音合成的音频数据生成方法及系统
有效
专利申请进度
申请
2018-07-19
申请公布
2018-12-18
授权
2020-12-18
预估到期
2038-07-19
专利基础信息
申请号 CN201810796789.4 申请日 2018-07-19
申请公布号 CN109036371A 申请公布日 2018-12-18
授权公布号 CN109036371B 授权公告日 2020-12-18
分类号 G10L13/02
分类 乐器;声学;
申请人名称 北京光年无限科技有限公司
申请人地址 北京市石景山区石景山路3号玉泉大厦四层常青藤青年创业工作室193号
专利法律状态
  • 2020-12-18
    授权
    状态信息
    授权
  • 2019-01-15
    著录事项变更
    状态信息
    著录事项变更
  • 2019-01-11
    实质审查的生效
    状态信息
    实质审查的生效
  • 2018-12-18
    公布
    状态信息
    公布
摘要
本发明提供的用于语音合成的音频数据生成方法,其包含以下步骤:对文本数据中的文本特征进行提取,得到文本特征数据;通过神经网络结构对文本特征数据进行加速转化处理,将文本特征数据转化为声学特征数据;根据声学特征数据进行声音合成或选择拼接,得到音频数据。本发明,由于采用了特殊的反卷积结构,在不包含任何auto‑regressive结构,且使用极少的参数的前提下也能达到很好的语音合成效果,能够通过神经网络结构在保证声学特征预测精度的同时,减少计算延迟,减少计算资源需求,提高并发量,提升语音合成的速度,为改善人机交互体验做出贡献。