• 热门行业
  • 装修建材
  • 家居生活
  • 餐饮食品
  • 母婴教育
  • 电脑办公
  • 服装首饰
  • 汽车工具
  • 家电数码
  • 机械化工
  • 休闲美容
返回上一页
专利状态
语音识别校正方法及其相应的装置、设备、介质
有效
专利申请进度
申请
2021-07-28
申请公布
2021-10-22
授权
2023-04-25
预估到期
2041-07-28
专利基础信息
申请号 CN202110857039.5 申请日 2021-07-28
申请公布号 CN113539241A 申请公布日 2021-10-22
授权公布号 CN113539241B 授权公告日 2023-04-25
分类号 G10L15/01;G10L15/06;G10L15/16;G10L15/18;G10L15/26
分类 乐器;声学;
申请人名称 广州华多网络科技有限公司
申请人地址 广东省广州市番禺区南村镇万达广场B1栋24层
专利法律状态
  • 2023-04-25
    授权
    状态信息
    授权
  • 2021-10-22
    公布
    状态信息
    公布
摘要
本申请公开一种语音识别校正方法及其相应的装置、设备、介质,该方法包括:获取选定的声学模型从原始音频数据中识别出的初步音频文本及置信度数据;将初步音频文本中置信度低于预设阈值的字词替换为空洞标记,获得标记音频文本;根据与原始音频数据的原始音频文本对所述标记音频文本实施文本对齐,使标记音频文本中的空洞标记根据原始音频文本获得对应补全,以获得订正音频文本;将所述原始音频数据标记为训练样本,将所述订正音频文本标记为该原始音频数据的监督标签,存储于声学模型训练所需的样本库中。本申请能够对关联于相同语音内容的音频文本和音频数据所构成的脏数据进行高效地清洗,从而制备出声学模型训练所需的训练数据。