• 热门行业
  • 装修建材
  • 家居生活
  • 餐饮食品
  • 母婴教育
  • 电脑办公
  • 服装首饰
  • 汽车工具
  • 家电数码
  • 机械化工
  • 休闲美容
返回上一页
专利状态
说话头视频合成方法、装置、终端设备及可读存储介质
有效
专利申请进度
申请
2022-05-31
申请公布
2022-08-23
授权
2023-09-22
预估到期
2042-05-31
专利基础信息
申请号 CN202210612090.4 申请日 2022-05-31
申请公布号 CN114938476A 申请公布日 2022-08-23
授权公布号 CN114938476B 授权公告日 2023-09-22
分类号 H04N21/81;G10L13/08;G10L13/02;G06V40/20;G06V40/16;G06V20/40
分类 电通信技术;
申请人名称 深圳市优必选科技股份有限公司
申请人地址 广东省深圳市南山区学苑大道1001号南山智园C1栋16、22楼
专利法律状态
  • 2023-09-22
    授权
    状态信息
    授权
  • 2022-09-09
    实质审查的生效
    状态信息
    实质审查的生效;IPC(主分类):H04N21/81;申请日:20220531
  • 2022-08-23
    公布
    状态信息
    公布
摘要
本申请适用于终端技术领域,尤其涉及一种说话头视频合成方法、装置、终端设备及计算机可读存储介质。该方法在获取目标文本和目标图像后,确定目标文本对应的目标音素序列;根据目标音素序列,获取目标文本对应的声学特征,并根据声学特征,得到目标文本对应的合成语音;根据目标音素序列,确定目标文本对应的第一目标嘴部动作序列,并根据声学特征,确定目标文本对应的第二目标嘴部动作序列;根据第一目标嘴部动作序列、第二目标嘴部动作序列和目标图像,得到目标用户对应的脸部动作视频;对合成语音和脸部动作视频进行同步处理,得到目标用户对应的说话头视频,以通过文本和文本对应的声学特征来预设嘴部动作,降低嘴部动作预测的复杂度。