• 热门行业
  • 装修建材
  • 家居生活
  • 餐饮食品
  • 母婴教育
  • 电脑办公
  • 服装首饰
  • 汽车工具
  • 家电数码
  • 机械化工
  • 休闲美容
返回上一页
专利状态
提取说话人嵌入特征的神经网络的训练方法和装置
有效
专利申请进度
申请
2019-12-30
申请公布
2020-05-22
授权
2022-07-15
预估到期
2039-12-30
专利基础信息
申请号 CN201911391244.6 申请日 2019-12-30
申请公布号 CN111191787A 申请公布日 2020-05-22
授权公布号 CN111191787B 授权公告日 2022-07-15
分类号 G06N3/08;G06N3/04;G06K9/62;G06F21/32
分类 计算;推算;计数;
申请人名称 思必驰科技股份有限公司
申请人地址 江苏省苏州市苏州工业园区新平街388号腾飞创新园14栋
专利法律状态
  • 2022-07-15
    授权
    状态信息
    授权
  • 2021-05-14
    著录事项变更
    状态信息
    著录事项变更;IPC(主分类):G06N3/08;变更事项:申请人;变更前:苏州思必驰信息科技有限公司;变更后:思必驰科技股份有限公司;变更事项:地址;变更前:215123 江苏省苏州市苏州工业园区新平街388号腾飞创新园14栋;变更后:215123 江苏省苏州市苏州工业园区新平街388号腾飞创新园14栋
  • 2020-06-16
    实质审查的生效
    状态信息
    实质审查的生效;IPC(主分类):G06N3/08;申请日:20191230
  • 2020-05-22
    公布
    状态信息
    公布
摘要
本发明公开提取说话人嵌入特征的神经网络的训练方法和装置,其中,神经网络包括多个帧级层、统计池化层和多个段级层,方法包括:经由多个帧级层接收并处理输入的音频片段;经由统计池化层将帧级频谱特征聚合为段级频谱特征;在统计池化层的基础上再拆分出第一多层线性层以用于计算段级频谱特征的第一信道损失;经由多个段级层将段级频谱特征合并成话语级频谱特征,并计算话语级频谱特征的说话人损失;在多个段级层的基础上再拆分出第二多层线性层以用于计算话语级频谱特征的第二信道损失;以及通过控制第一信道损失、第二信道损失和说话人损失的和值训练神经网络。通过本申请的方案训练的神经网络可以提取出信道无关的说话人嵌入特征。