• 热门行业
  • 装修建材
  • 家居生活
  • 餐饮食品
  • 母婴教育
  • 电脑办公
  • 服装首饰
  • 汽车工具
  • 家电数码
  • 机械化工
  • 休闲美容
返回上一页
专利状态
针对多口音语音识别的方法和装置
有效
专利申请进度
申请
2021-05-28
申请公布
2021-11-02
授权
2023-07-14
预估到期
2041-05-28
专利基础信息
申请号 CN202110594476.2 申请日 2021-05-28
申请公布号 CN113593534A 申请公布日 2021-11-02
授权公布号 CN113593534B 授权公告日 2023-07-14
分类号 G10L15/07;G10L15/16;G10L15/22;G10L15/26
分类 乐器;声学;
申请人名称 思必驰科技股份有限公司
申请人地址 江苏省苏州市苏州工业园区新平街388号腾飞创新园14栋
专利法律状态
  • 2023-07-14
    授权
    状态信息
    授权
  • 2021-11-19
    实质审查的生效
    状态信息
    实质审查的生效;IPC(主分类):G10L15/07;申请日:20210528
  • 2021-11-02
    公布
    状态信息
    公布
摘要
本发明公开针对多口音语音识别的方法和装置,其中,一种针对多口音语音识别的方法,其中,对于单语音识别系统,在编码阶段添加自适应层用于学习与口音有关的特征信息,包括:对于每个编码器块将口音表征向量作为一个指导信息,输入到所述自适应层中,用于指导所述自适应层中的转换函数,其中,一个编码器有多个串联的编码器块;将口音无关特征也同时输入到所述自适应层中;以及将所述口音无关特征和所述口音表征向量混合形成口音相关特征。本申请实施例进一步探讨了适应层的注入位置、口音基数和不同类型的口音基数,以实现更好的口音适应。