• 热门行业
  • 装修建材
  • 家居生活
  • 餐饮食品
  • 母婴教育
  • 电脑办公
  • 服装首饰
  • 汽车工具
  • 家电数码
  • 机械化工
  • 休闲美容
返回上一页
专利状态
使用弱监督数据训练VAD的方法及装置
有效
专利申请进度
申请
2020-12-25
申请公布
2021-05-11
授权
2022-07-26
预估到期
2040-12-25
专利基础信息
申请号 CN202011561510.8 申请日 2020-12-25
申请公布号 CN112786029A 申请公布日 2021-05-11
授权公布号 CN112786029B 授权公告日 2022-07-26
分类号 G10L15/16;G10L15/02;G06K9/62;G06N3/08
分类 乐器;声学;
申请人名称 思必驰科技股份有限公司
申请人地址 江苏省苏州市苏州工业园区新平街388号腾飞创新园14栋
专利法律状态
  • 2022-07-26
    授权
    状态信息
    授权
  • 2021-05-11
    公布
    状态信息
    公布
摘要
本发明公开了一种使用弱监督数据训练VAD的方法及装置,方法包括:判断所述模型是否已经经过训练;若所述模型未经过训练,获取待训练音频,从所述待训练音频中提取声学信号特征;将所述声学信号特征中的帧级别预测标签整合,得到句子级别预测标签;将所述句子级别预测标签输入所述模型中,训练所述模型使得所述模型的输出的计算结果基本等于所述待训练音频的人工标记结果,本发明使用神经网络模型直接训练句子级别标签的数据,在训练过程中将帧级别的预测整合到句子级别的预测标签,然后与标注的句子级别的标签进行loss的计算,通过模型去调优。