• 热门行业
  • 装修建材
  • 家居生活
  • 餐饮食品
  • 母婴教育
  • 电脑办公
  • 服装首饰
  • 汽车工具
  • 家电数码
  • 机械化工
  • 休闲美容
返回上一页
专利状态
说话者嵌入学习方法、说话者识别方法及系统
有效
专利申请进度
申请
2020-07-22
申请公布
2020-10-23
授权
2022-08-26
预估到期
2040-07-22
专利基础信息
申请号 CN202010710651.5 申请日 2020-07-22
申请公布号 CN111816167A 申请公布日 2020-10-23
授权公布号 CN111816167B 授权公告日 2022-08-26
分类号 G10L15/02;G10L15/16
分类 乐器;声学;
申请人名称 思必驰科技股份有限公司
申请人地址 江苏省苏州市苏州工业园区新平街388号腾飞创新园14栋
专利法律状态
  • 2022-08-26
    授权
    状态信息
    授权
  • 2020-10-23
    公布
    状态信息
    公布
摘要
本发明公开一种说话者嵌入学习方法,包括:对说话者语音段进行帧级别特征提取,得到多个帧级别深度特征;对所述多个帧级别深度特征进行二阶池化处理得到段级别深度特征;采用仿射层将所述段级别深度特征转换为段级别说话者嵌入。本发明实施例在将帧级别深度特征转化为段级别深度特征时采用了二阶池化处理的方式,从而不仅考虑了帧级别的说话者特征,同时还兼顾了语音片段中的动态信息,使得最终学习到的说话者嵌入能够更加准确的反应说话者特征,提升了说话者嵌入特征的质量,也将有助于基于此所进行的说话者识别任务的准确性与可靠性。