• 热门行业
  • 装修建材
  • 家居生活
  • 餐饮食品
  • 母婴教育
  • 电脑办公
  • 服装首饰
  • 汽车工具
  • 家电数码
  • 机械化工
  • 休闲美容
返回上一页
专利状态
说话人相关的端到端语音端点检测方法和装置
有效
专利申请进度
申请
2019-06-14
申请公布
2019-08-16
授权
2022-08-16
预估到期
2039-06-14
专利基础信息
申请号 CN201910517374.3 申请日 2019-06-14
申请公布号 CN110136749A 申请公布日 2019-08-16
授权公布号 CN110136749B 授权公告日 2022-08-16
分类号 G10L25/87;G10L15/02;G10L15/16
分类 乐器;声学;
申请人名称 思必驰科技股份有限公司
申请人地址 江苏省苏州市苏州工业园区新平街388号腾飞创新园14栋
专利法律状态
  • 2022-08-16
    授权
    状态信息
    授权
  • 2019-08-16
    公布
    状态信息
    公布
摘要
本发明公开说话人相关的端到端语音端点检测方法和装置,其中,一种说话人相关的端到端语音端点检测方法,包括:提取待检测语音的声学特征;将所述声学特征与i‑vector特征进行拼接以作为新的输入特征;将新的输入特征输入至神经网络中进行训练并输出所述待检测语音是否为目标说话人语音的检测结果。本申请的方法和装置通过在传统的语音端点检测系统的训练过程中加入了说话人相关的信息(i‑vector),并将深度神经网络(DNN)和长短时记忆神经网络(LSTM)应用到语音端点检测中,实现了端到端的说话人相关的端点检测系统,通过单个网络就可以直接输出目标说话人的语音部分,去除音频中其他的静音段和非目标说话人的语音。