• 热门行业
  • 装修建材
  • 家居生活
  • 餐饮食品
  • 母婴教育
  • 电脑办公
  • 服装首饰
  • 汽车工具
  • 家电数码
  • 机械化工
  • 休闲美容
返回上一页
专利状态
基于有监督机器学习的语音端点检测方法及装置
有效
专利申请进度
申请
2017-10-16
申请公布
2018-03-13
授权
2020-10-16
预估到期
2037-10-16
专利基础信息
申请号 CN201710957669.3 申请日 2017-10-16
申请公布号 CN107799126A 申请公布日 2018-03-13
授权公布号 CN107799126B 授权公告日 2020-10-16
分类号 G10L25/87;G10L15/04
分类 乐器;声学;
申请人名称 苏州狗尾草智能科技有限公司
申请人地址 江苏省苏州市姑苏区人民路239号39幢301室
专利法律状态
  • 2022-03-29
    专利权的保全及其解除
    状态信息
    专利权的保全;IPC(主分类):G10L 25/87;专利号:ZL2017109576693;申请日:20171016;授权公告日:20201016;登记生效日:20220228;解除日:
  • 2020-10-16
    授权
    状态信息
    授权
  • 2019-07-09
    著录事项变更
    状态信息
    著录事项变更;IPC(主分类):G10L 25/87;专利申请号:2017109576693;变更事项:申请人;变更前:深圳狗尾草智能科技有限公司;变更后:苏州狗尾草智能科技有限公司;变更事项:地址;变更前:518000 广东省深圳市南山区粤海街道科苑路16号东方科技大厦1307-09;变更后:215000 江苏省苏州市姑苏区人民路239号39幢301室;变更事项:申请人;变更前:上海瓦歌智能科技有限公司;变更后:上海瓦歌智能科技有限公司
  • 2018-04-06
    实质审查的生效
    状态信息
    实质审查的生效;IPC(主分类):G10L 25/87;专利申请号:2017109576693;申请日:20171016
  • 2018-03-13
    发明专利申请公布
    状态信息
    公布
摘要
本发明涉及一种基于有监督机器学习的语音端点检测方法及装置,所述方法包括:从获取的音频中检测出静音段、过度段和结束段;将静音段和结束段输入预先构建的背景噪声模型,识别所述音频所属的当前场景;将待识别语音段用向量表示,其中,待识别语音段为除去所述静音段、所述过度段和所述结束段的音频;将识别的所述当前场景和向量化后的待识别语音段输入预先构建的RNN模型,识别语音端点,其中,语音端点包括语音段的起始点、语音段的终点。本发明提供的一种基于有监督机器学习的语音端点检测方法及装置,通过判断当前所处的场景,将场景作为RNN模型的输入参数之一,提升RNN模型的判断的准确性,提高了语音端点检测的准确性和效率。