• 热门行业
  • 装修建材
  • 家居生活
  • 餐饮食品
  • 母婴教育
  • 电脑办公
  • 服装首饰
  • 汽车工具
  • 家电数码
  • 机械化工
  • 休闲美容
返回上一页
专利状态
多任务语音识别模型训练方法、多任务语音识别方法
有效
专利申请进度
申请
2020-11-24
申请公布
2021-02-05
授权
2023-01-13
预估到期
2040-11-24
专利基础信息
申请号 CN202011327809.7 申请日 2020-11-24
申请公布号 CN112331187A 申请公布日 2021-02-05
授权公布号 CN112331187B 授权公告日 2023-01-13
分类号 G10L15/02;G10L15/06
分类 乐器;声学;
申请人名称 思必驰科技股份有限公司
申请人地址 江苏省苏州市苏州工业园区新平街388号腾飞创新园14栋
专利法律状态
  • 2023-01-13
    授权
    状态信息
    授权
  • 2021-02-05
    公布
    状态信息
    公布
摘要
本发明公开一种多任务语音识别模型训练方法,其中多任务语音识别模型包括卷积层、最大池化层、线性变换层、映射层和多个子任务线性分类层,该方法包括:根据样本音频获取样本音频频谱特征;将样本音频频谱特征输入至卷积层进行卷积处理;通过最大池化层对卷积处理后的所述样本音频频谱特征进行最大池化操作以获得对应于样本音频的句子级别表征信息;通过线性池化层对句子级别表征信息进行线性变化;通过映射层根据线性变化结果对多个子任务线性分类层的参数进行更新。本发明在保证各个子任务性能的前提下,一个模型解决了语音中所包含的多种副信息识别问题,减少了服务端占用的内存和计算量,更加方便的服务用户,满足用户不同的需求。