☰

一句话变影片 OpenAI再进化

微软资助的AI新创公司OpenAI又有进军「影片生成」的创举，15日宣布开发出新AI模型Sora，可根据文字提示生成长达一分钟的短影片。图／美联社

推出生成式聊天机器人ChatGPT一战成名后，微软资助的AI新创公司OpenAI又有进军「影片生成」的创举，15日宣布开发出新AI模型Sora，可根据文字提示生成长达一分钟的短影片。

OpenAI透过部落格贴文声明指出，Sora目前用于抓出系统潜在风险的红队演练（Red Teaming），协助辨识AI系统缺陷，也供视觉艺术家、设计师和电影制作人使用，以获取他们对Sora模型的反馈。

声明说：「Sora能生成复杂场景，有多重角色、特定类型动态画面、精确详尽的主题与背景。」Sora除了可以从文字提示生成影片外，还能够将静态图像制成动画。

Sora依扩散模型（diffusion model）运作的原理，与OpenAI现今最强大的图像生成AI工具Dall-E 3很类似。

不过OpenAI也提到，Sora模型尚未完成，仍有几项缺陷尚待克服，包括对文字提示的空间细节产生混淆、无法准确模拟复杂场景的物理现象、难以厘清因果关系、依循特定的运镜轨迹也有困难。

举例来说，Sora生成影片中的主角咬了一口饼干，饼干却未见咬痕，或是跑步机上的人跑错方向。

OpenAI执行长奥特曼（Sam Altman）在社群平台X上发文写道，Sora模型初时只提供给「限量的创作者」。OpenAI同时授权一专家团队，在将Sora导入该公司产品之前，负责评估该模型的安全性。

脸书母公司Meta、Alphabet旗下谷歌、Runway AI等，老早就开发文字转影音的生成器。谷歌今年元月发表影片生成模型 Lumiere；Meta去年9月底推出AI图像生成模型Emu，为该社群媒体巨头首款生成式AI产品，可由文本提示编辑生成影像。

影片生成技术虽加快创作过程，但也引发AI 影响艺术家生计及散播假讯息的疑虑，特别今年适逢关键选举年。OpenAI正另外开发工具，用以辨别影片是否由Sora模型生成。

相关资讯