Google推新版影片生成工具Veo 2、圖像生成工具Imagen 3 供更多創作可能

继今年5月公布影片生成工具Veo之后,Google DeepMind稍早公布新版影片生成工具Veo 2,并且推出新版图像生成工具Imagen 3,另外也推出新一波实验计划。

Veo 2主要提高生成结果更符合真实世界的物理作动,以及人类运动时的肢体表现,以及表情细微呈现,借此增加生成影像的真实性。

此外,Veo 2也加入电影摄影特殊用语,例如可要求生成以低角度平移追踪镜位产生影片,或是依照使用者输入18mm焦段镜头产生相应拍摄影像,甚至也能依照浅景深效果产生背景模糊、让视觉焦点聚焦在人物的画面。

目前Veo 2最高可生成4K解析度影片,长度最长可达2分钟,几乎是OpenAI提出Sora对应最高解析度的四倍,时间长度更超过6倍,另外也能确实遵循使用者所输入指示,并且依照真实物理表现产生影片,更标榜能减少幻觉产生比例。

[video width="3840" height="2160" mp4="https://mashdigi.com/wp-content/uploads/Veo2_animation.mp4"][/video]

而此次同步推出的新版Imagen 3,则可生成更具构图感、生成更明亮的影像,更可依照指示产生写实、印象、抽象或动漫风格等的艺术风格,同时在细节与质感表现更为突出。

Google将从即日起透过Google Labs开放加入等候Veo 2存取权限,预计明年开始应用在YouTube Shorts短影片等服务,而新版Imagen 3则已经在超过100个国家地区布署,并且透过Google Labs提供图片生成工具ImageFX使用。

Google Labs也同步推出名为Whisk的新实验工具,标榜能产生更具表达张力的图片,其中整合Imagen 3与新版Gemini模型,可透过电脑视觉分析理解方式产生指令描述,并且由Imagen 3产生全新图像,目前已经在美国境内提供使用。

《原文刊登于合作媒体mashdigi,联合新闻网获授权转载。》