• 热门行业
  • 装修建材
  • 家居生活
  • 餐饮食品
  • 母婴教育
  • 电脑办公
  • 服装首饰
  • 汽车工具
  • 家电数码
  • 机械化工
  • 休闲美容
返回上一页
专利状态
自动音频摘要生成方法和装置
有效
专利申请进度
申请
2020-12-31
申请公布
2021-05-11
授权
2022-07-08
预估到期
2040-12-31
专利基础信息
申请号 CN202011623119.6 申请日 2020-12-31
申请公布号 CN112784094A 申请公布日 2021-05-11
授权公布号 CN112784094B 授权公告日 2022-07-08
分类号 G06F16/64;G06F16/683;G06K9/62
分类 计算;推算;计数;
申请人名称 思必驰科技股份有限公司
申请人地址 江苏省苏州市苏州工业园区新平街388号腾飞创新园14栋
专利法律状态
  • 2022-07-08
    授权
    状态信息
    授权
  • 2021-05-11
    公布
    状态信息
    公布
摘要
本发明公开自动音频摘要生成方法和装置,其中,一种自动音频摘要生成方法,包括:预训练声音事件检测模型,其中,所述声音事件检测模型包括音频特征提取部分和输出部分;将所述音频特征提取部分作为音频摘要自动生成模型的音频编码器;端到端地训练所述音频摘要自动生成模型。本申请实施例的方案通过声音事件检测任务上的预训练和迁移学习得到更好的音频编码器,从而生成更加准确的音频摘要描述,进而能够对任何新的音频生成对应的文本描述,自动地建立起音频—文本数据库,能够支持类似基于不限形式的自然语言的音频检索引擎的实际应用。