• 热门行业
  • 装修建材
  • 家居生活
  • 餐饮食品
  • 母婴教育
  • 电脑办公
  • 服装首饰
  • 汽车工具
  • 家电数码
  • 机械化工
  • 休闲美容
返回上一页
专利状态
一种多采样率语音识别方法、装置、系统及存储介质
有效
专利申请进度
申请
2019-12-26
申请公布
2020-05-05
授权
2022-10-18
预估到期
2039-12-26
专利基础信息
申请号 CN201911363288.8 申请日 2019-12-26
申请公布号 CN111105786A 申请公布日 2020-05-05
授权公布号 CN111105786B 授权公告日 2022-10-18
分类号 G10L15/02;G10L15/06;G10L15/16
分类 乐器;声学;
申请人名称 思必驰科技股份有限公司
申请人地址 江苏省苏州市工业园区新平街388号腾飞创新园14号楼
专利法律状态
  • 2022-10-18
    授权
    状态信息
    授权
  • 2020-05-05
    公布
    状态信息
    公布
摘要
本发明公开了一种多采样率语音识别方法、装置、系统及存储介质。首先,在不改变音频采样率的条件下,根据采样率不同进行相应配置的方式对不同采样率的音频进行特征提取,并利用所提取到的音频对神经网络模型进行训练。该神经网络模型除了具有一般的语音识别标签之外,还添加了采样率分类标签,并在训练该神经网络模型时会使用梯度置反的方法对采样率分类标签进行对抗训练,从而使训练得到的多采样率语音识别模型能够自主适应不同采样率的音频。之后,就可以使用上述方法训练得到的多采样率语音识别模型进行语音识别,实现用同一语音识别模型统一处理多种采样率的音频输入的目标。