平安科技申请音频驱动数字人生成专利,能够生成音唇同步的数字人视频
金融界2024年12月5日消息,国家知识产权局信息显示,平安科技(深圳)有限公司申请一项名为“音频驱动数字人生成方法和装置、电子设备及存储介质”的专利,公开号 CN 119071591 A,申请日期为2024年8月。
专利摘要显示,本申请实施例提供了一种音频驱动数字人生成方法和装置、电子设备及存储介质,属于金融科技技术领域。该方法包括:获取用户输入的音频信号和目标人脸视频;对音频信号进行特征提取,得到音频特征;将音频特征转化为音唇同步的面部动作序列;采用流形映射算法对面部动作序列进行处理,得到多个面部动作的线性组合;根据多个面部动作的线性组合生成面部运动的视频帧;采用目标人脸渲染器对面部运动的视频帧进行渲染,生成目标数字人视频。基于此,本申请实施例能够生成音唇同步的数字人视频,具有高保真度,在金融场景下,生成高保真度的数字人视频可以提升客户观感,提高客户的信赖度,有助于提高金融服务质量,从而提升金融企业的竞争力。
本文源自:金融界
作者:情报员