一句话变影片 OpenAI再进化

微软资助的AI新创公司OpenAI又有进军「影片生成」的创举,15日宣布开发出新AI模型Sora,可根据文字提示生成长达一分钟的短影片。图/美联社

推出生成式聊天机器人ChatGPT一战成名后,微软资助的AI新创公司OpenAI又有进军「影片生成」的创举,15日宣布开发出新AI模型Sora,可根据文字提示生成长达一分钟的短影片。

OpenAI透过部落格贴文声明指出,Sora目前用于抓出系统潜在风险的红队演练(Red Teaming),协助辨识AI系统缺陷,也供视觉艺术家、设计师和电影制作人使用,以获取他们对Sora模型的反馈。

声明说:「Sora能生成复杂场景,有多重角色、特定类型动态画面、精确详尽的主题与背景。」Sora除了可以从文字提示生成影片外,还能够将静态图像制成动画。

Sora依扩散模型(diffusion model)运作的原理,与OpenAI现今最强大的图像生成AI工具Dall-E 3很类似。

不过OpenAI也提到,Sora模型尚未完成,仍有几项缺陷尚待克服,包括对文字提示的空间细节产生混淆、无法准确模拟复杂场景的物理现象、难以厘清因果关系、依循特定的运镜轨迹也有困难。

举例来说,Sora生成影片中的主角咬了一口饼干,饼干却未见咬痕,或是跑步机上的人跑错方向。

OpenAI执行长奥特曼(Sam Altman)在社群平台X上发文写道,Sora模型初时只提供给「限量的创作者」。OpenAI同时授权一专家团队,在将Sora导入该公司产品之前,负责评估该模型的安全性。

脸书母公司Meta、Alphabet旗下谷歌、Runway AI等,老早就开发文字转影音的生成器。谷歌今年元月发表影片生成模型 Lumiere;Meta去年9月底推出AI图像生成模型Emu,为该社群媒体巨头首款生成式AI产品,可由文本提示编辑生成影像。

影片生成技术虽加快创作过程,但也引发AI 影响艺术家生计及散播假讯息的疑虑,特别今年适逢关键选举年。OpenAI正另外开发工具,用以辨别影片是否由Sora模型生成。