OpenAI測試文本轉影片模型Sora 開放部分用戶嘗鮮

OpenAI执行长阿特曼。路透社

创造聊天机器人ChatGPT和图像生成器DALL-E的科技公司OpenAI表示，公司正在测试一款由文本转为影片的模型Sora，能让用户透过简单的指令创造出逼真的影片。

法新社报导，这间获微软（Microsoft）支持的公司指出，这个新平台目前正在进行测试，不过释出了几段OpenAI称已经可行的影片，附上生成影片的文字输入指令。

OpenAI在部落格贴文中表示：「Sora能生成长达1分钟的影片，同时维持视觉品质，并符合用户的指令。」

OpenAI还说，这款模型也能从既有的静态图片生成影片。

OpenAI执行长阿特曼（Sam Altman）在社群媒体X上表示，公司在测试阶段「向数量有限的创作者提供存取权限」。

他也邀请用户在X上提出指令建议，几分钟后在这个平台上张贴颇具说服力的影片生成结果，其中包括两只黄金猎犬在山上开串流Podcast、老奶奶在厨房教烹饪、动物在海上骑脚踏车，以及珠光宝气的动物园等。

还有另一支影片显示「半鸭半龙的生物飞驰在美丽的暮色中，背上骑着一只身着探险装备的仓鼠」。

不过这间总部位于旧金山的新创公司警告说，「目前的模型存有弱点」，像是左右不分，或未能在整段影片中维持视觉连贯性。

OpenAI声明指出，安全性会是一大关键，还说Sora会面临对抗性资安测试，也就是所谓的红队演练（red-teaming），期间特定用户会试图让平台失灵，产生不恰当的内容或出毛病。

OpenAI指出：「我们会接洽全球政策制定者、教育家和艺术家，以了解他们的顾虑，并找出这种新技术的正面使用案例。」

脸书母公司Meta、谷歌（Google）和Runway AI也在研发文本转文影片人工智慧（AI）技术，已经公布类似的工作样本。

相关资讯