Google推新版影片生成工具Veo 2、圖像生成工具Imagen 3 供更多創作可能

继今年5月公布影片生成工具Veo之后，Google DeepMind稍早公布新版影片生成工具Veo 2，并且推出新版图像生成工具Imagen 3，另外也推出新一波实验计划。

Veo 2主要提高生成结果更符合真实世界的物理作动，以及人类运动时的肢体表现，以及表情细微呈现，借此增加生成影像的真实性。

此外，Veo 2也加入电影摄影特殊用语，例如可要求生成以低角度平移追踪镜位产生影片，或是依照使用者输入18mm焦段镜头产生相应拍摄影像，甚至也能依照浅景深效果产生背景模糊、让视觉焦点聚焦在人物的画面。

目前Veo 2最高可生成4K解析度影片，长度最长可达2分钟，几乎是OpenAI提出Sora对应最高解析度的四倍，时间长度更超过6倍，另外也能确实遵循使用者所输入指示，并且依照真实物理表现产生影片，更标榜能减少幻觉产生比例。

[video width="3840" height="2160" mp4="https://mashdigi.com/wp-content/uploads/Veo2_animation.mp4"][/video]

而此次同步推出的新版Imagen 3，则可生成更具构图感、生成更明亮的影像，更可依照指示产生写实、印象、抽象或动漫风格等的艺术风格，同时在细节与质感表现更为突出。

Google将从即日起透过Google Labs开放加入等候Veo 2存取权限，预计明年开始应用在YouTube Shorts短影片等服务，而新版Imagen 3则已经在超过100个国家地区布署，并且透过Google Labs提供图片生成工具ImageFX使用。

Google Labs也同步推出名为Whisk的新实验工具，标榜能产生更具表达张力的图片，其中整合Imagen 3与新版Gemini模型，可透过电脑视觉分析理解方式产生指令描述，并且由Imagen 3产生全新图像，目前已经在美国境内提供使用。

《原文刊登于合作媒体mashdigi，联合新闻网获授权转载。》

相关资讯