视源股份申请二维人像视频生成方法、装置、计算机设备及介质专利,简单快捷,成本低

金融界2024年6月25日消息,天眼查知识产权信息显示,广州视源电子科技股份有限公司申请一项名为“二维人像视频生成方法、装置、计算机设备及介质“,公开号CN202211656724.2,申请日期为2022年12月。

专利摘要显示,本发明属于虚拟数字人领域,公开了一种二维人像视频生成方法、装置、计算机设备及介质,包括:获取用户的模板视频;根据模板视频中的图像,计算全脸表情系数;根据模板视频中的图像、音频和全脸表情系数对第一图像神经网络模型和第一口型神经网络模型进行训练;获取用户的语音文件,并将语音文件输入第二口型神经网络模型中得到口型表情系数;根据全脸表情系数和口型表情系数得到二维人像;合成二维人像和语音文件,得到二维人像视频。本发明将第一人脸渲染图像和模板视频中的图像进行融合,这样就保留了原始图像中难以通过图像生成方式生成的细节部分。本发明通过训练从特征到图像映射的模型来实现二维人像视频的可控生成,简单快捷,成本低。

本文源自:金融界

作者:情报员