• 热门行业
  • 装修建材
  • 家居生活
  • 餐饮食品
  • 母婴教育
  • 电脑办公
  • 服装首饰
  • 汽车工具
  • 家电数码
  • 机械化工
  • 休闲美容
返回上一页
专利状态
一种基于音素的中文语音合成系统
有效
专利申请进度
申请
2018-08-17
申请公布
2018-11-27
授权
2020-07-03
预估到期
2038-08-17
专利基础信息
申请号 CN201810938392.4 申请日 2018-08-17
申请公布号 CN108899009A 申请公布日 2018-11-27
授权公布号 CN108899009B 授权公告日 2020-07-03
分类号 G10L13/08;G10L13/10;G10L13/047
分类 乐器;声学;
申请人名称 百卓网络科技有限公司
申请人地址 江苏省南京市江北新区惠达路6号北斗大厦2号楼70室
专利法律状态
  • 2020-07-03
    授权
    状态信息
    授权
  • 2018-12-21
    实质审查的生效
    状态信息
    实质审查的生效IPC(主分类):G10L 13/08
  • 2018-11-27
    公布
    状态信息
    公开
摘要
本发明公开了一种基于音素的中文语音合成方法,其特征在于,包括如下步骤:步骤1,对文本与音频进行预处理;步骤2,构造音素集;步骤3,利用one‑hot将音素序列转化为字ID,训练生成转词向量,通过基于encoder‑decoder的Seq2Seq的结构生成频谱序列特征;步骤4,结合频谱序列与音频的语音信息,由声码器合成语音;步骤5,合成的音频分别去除尾部静音,按一定顺序将音频进行拼接。本方法合成的语音更加贴近于真人发音,以及在区分多音字与确定停顿位置上较传统的都有很大提升,最主要的是合成的准确率可以达到95%以上。