华为云计算技术申请视频生成方法、装置及集群专利,生成帧间一致性高的视频

金融界2024年11月15日消息,国家知识产权局信息显示,华为云计算技术有限公司申请一项名为“视频生成方法、装置及集群”的专利,公开号 CN 118945442 A,申请日期为2023年7月。

专利摘要显示,一种视频生成方法、装置及集群。该方法包括:获取目标视频的文本描述信息和多个结构信息,多个结构信息和多个噪声样本一一对应;在第一时间步中,获取多个噪声样本中的第一噪声样本,第一噪声样本用于生成目标视频中的第一视频帧;利用预训练的扩散模型,基于文本描述信息和第一噪声样本对应的结构信息,去除第一噪声样本的噪声,得到第一噪声样本对应的第一中间样本;以及,更新第一噪声样本对应的第一中间样本的特征,得到第一噪声样本对应的第一输出样本;其中,第一噪声样本的第一输出样本用作第一时间步的下一个时间步的噪声样本,或者第一视频帧。该方法可以在无需训练模型的情况下,生成帧间一致性高的视频。

本文源自:金融界

作者:情报员