首页
品牌
排行
问答
专题
特惠
资讯
展会
百科
热门行业
装修建材
家居生活
餐饮食品
母婴教育
电脑办公
服装首饰
汽车工具
家电数码
机械化工
休闲美容
热门行业
教育培训
板材
地板
涂料
家纺
集成吊顶
美缝剂
木门
硅藻泥
管材
指纹锁
橱柜
衣柜
床垫
电热水器
集成灶
暖气片
净水器
酒店
卫浴
装修建材
卫浴洁具
板材
地板
建筑陶瓷
天花板
涂料
瓷砖泥瓦
水电管材
火锅
快餐
生活用品
软装
装饰装潢
灯具
家纺
干洗服务
内衣
男装
女装
幼教
整体卫浴
地板砖
阻燃板
铝材
集成吊顶
美缝剂
硅藻泥
管材
烤鱼
汉堡
叶酸
婴儿用品
婴儿床
指纹锁
品牌首页
品牌资讯
企业信息
商标信息
专利信息
返回上一页
专利状态
使用弱监督数据训练VAD的方法及装置
有效
专利申请进度
申请
2020-12-25
申请公布
2021-05-11
授权
2022-07-26
预估到期
2040-12-25
专利基础信息
申请号
CN202011561510.8
申请日
2020-12-25
申请公布号
CN112786029A
申请公布日
2021-05-11
授权公布号
CN112786029B
授权公告日
2022-07-26
分类号
G10L15/16;G10L15/02;G06K9/62;G06N3/08
分类
乐器;声学;
申请人名称
思必驰科技股份有限公司
申请人地址
江苏省苏州市苏州工业园区新平街388号腾飞创新园14栋
专利法律状态
2022-07-26
授权
状态信息
授权
2021-05-11
公布
状态信息
公布
摘要
本发明公开了一种使用弱监督数据训练VAD的方法及装置,方法包括:判断所述模型是否已经经过训练;若所述模型未经过训练,获取待训练音频,从所述待训练音频中提取声学信号特征;将所述声学信号特征中的帧级别预测标签整合,得到句子级别预测标签;将所述句子级别预测标签输入所述模型中,训练所述模型使得所述模型的输出的计算结果基本等于所述待训练音频的人工标记结果,本发明使用神经网络模型直接训练句子级别标签的数据,在训练过程中将帧级别的预测整合到句子级别的预测标签,然后与标注的句子级别的标签进行loss的计算,通过模型去调优。
更多专利
1
一种多采样率语音识别方法、装置、系统及存储介质
2
问题生成模型训练方法、问题生成方法
3
一种语音识别方法和装置
4
对语词向量生成方法、对语生成模型训练方法
5
一种命令词识别方法和装置
6
用于设备的组网方法及系统
7
提取说话人嵌入特征的神经网络的训练方法和装置
8
使用弱监督数据训练VAD的方法及装置
9
访问管理方法及装置、终端、服务器和访问管理系统
10
义原预测方法及系统
11
用于多轮对话长连接服务的升级方法及系统
12
用于语音合成的内存优化方法及系统
13
多模型联合学习的问题匹配方法及系统
14
饮水机的语音控制方法及装置
15
声音分离的增强方法及系统
16
会话系统知识模型的构建和使用方法及装置
17
敏感信息检测方法和装置
18
针对多口音语音识别的方法和装置
19
语音识别模型自训练方法及系统
20
连续唤醒识别功能的优化方法和装置
全国服务热线:
在线客服
1211389656
咨询
商务合作
85926368
咨询
媒体合作
921888730
咨询
在线客服
客服微信号
品牌网官方客服微信
打开微信扫一扫
客服微信
商务合作微信
商务合作详谈
打开微信扫一扫
商务合作
回到顶部