• 热门行业
  • 装修建材
  • 家居生活
  • 餐饮食品
  • 母婴教育
  • 电脑办公
  • 服装首饰
  • 汽车工具
  • 家电数码
  • 机械化工
  • 休闲美容
返回上一页
专利状态
基于语音的三维人脸模型驱动方法及相关装置
有效
专利申请进度
申请
2023-04-27
申请公布
2023-05-30
授权
2023-10-13
预估到期
2043-04-27
专利基础信息
申请号 CN202310472056.6 申请日 2023-04-27
申请公布号 CN116188649A 申请公布日 2023-05-30
授权公布号 CN116188649B 授权公告日 2023-10-13
分类号 G06T13/40;G10L25/57
分类 计算;推算;计数;
申请人名称 科大讯飞股份有限公司
申请人地址 安徽省合肥市高新开发区望江西路666号
专利法律状态
  • 2023-10-13
    授权
    状态信息
    授权
  • 2023-06-16
    实质审查的生效
    状态信息
    实质审查的生效;IPC(主分类):G06T13/40;申请日:20230427
  • 2023-05-30
    公布
    状态信息
    公布
摘要
本申请提出一种基于语音的三维人脸模型驱动方法及相关装置,基于目标语音的语音特征和目标情绪特征,按照偏移预测参数,进行三维模型顶点偏移预测,按照预测得到的三维模型顶点偏移数据,驱动三维基础模型,得到目标语音对应的三维人脸动画。偏移预测参数是通过样本视频对应的4D合成数据、音频特征和情绪特征,进行三维模型顶点偏移预测处理而确定的;4D合成数据是将样本视频的每帧图像对应的三维重建人脸模型,按照样本视频的帧率合成的数据。本方案将样本视频的每帧图像重建为三维人脸模型得到的4D合成数据作为确定偏移预测参数的样本数据,提高了样本数据的数据量和情绪多样性,从而提高了语音驱动三维人脸模型的准确度和情绪化效果。