• 热门行业
  • 装修建材
  • 家居生活
  • 餐饮食品
  • 母婴教育
  • 电脑办公
  • 服装首饰
  • 汽车工具
  • 家电数码
  • 机械化工
  • 休闲美容
返回上一页
专利状态
上下文信息预测模型的训练方法及系统
有效
专利申请进度
申请
2020-07-15
申请公布
2020-10-30
授权
2022-07-26
预估到期
2040-07-15
专利基础信息
申请号 CN202010680298.0 申请日 2020-07-15
申请公布号 CN111863009A 申请公布日 2020-10-30
授权公布号 CN111863009B 授权公告日 2022-07-26
分类号 G10L21/0208;G10L15/02;G10L15/06;G10L15/16;G10L15/183
分类 乐器;声学;
申请人名称 思必驰科技股份有限公司
申请人地址 江苏省苏州市苏州工业园区新平街388号腾飞创新园14栋
专利法律状态
  • 2022-07-26
    授权
    状态信息
    授权
  • 2020-10-30
    公布
    状态信息
    公布
摘要
本发明实施例提供一种上下文信息预测模型的训练方法。该方法包括:通过单说话人的端到端语音识别编码器提取第一说话人的第一干净音频以及第二说话人的第二干净音频中的第一理想上下文特征以及第二理想上下文特征,确定为上下文信息预测模型的训练标签;将由第一干净音频以及第二干净音频生成的混合音频的幅度谱作为上下文信息预测模型的输入,输出第一预测上下文特征以及第二预测上下文特征;对上下文信息预测模型进行置换不变性训练。本发明实施例还提供一种上下文信息预测模型的训练系统。本发明实施例直接从混合语音中提取每个目标说话者的上下文语言信息。然后将提取的上下文嵌入合并到单声道语音分离系统中,以获得更好的性能。