OpenAI測試文本轉影片模型Sora 開放部分用戶嘗鮮
OpenAI执行长阿特曼。 路透社
创造聊天机器人ChatGPT和图像生成器DALL-E的科技公司OpenAI表示,公司正在测试一款由文本转为影片的模型Sora,能让用户透过简单的指令创造出逼真的影片。
法新社报导,这间获微软(Microsoft)支持的公司指出,这个新平台目前正在进行测试,不过释出了几段OpenAI称已经可行的影片,附上生成影片的文字输入指令。
OpenAI在部落格贴文中表示:「Sora能生成长达1分钟的影片,同时维持视觉品质,并符合用户的指令。」
OpenAI还说,这款模型也能从既有的静态图片生成影片。
OpenAI执行长阿特曼(Sam Altman)在社群媒体X上表示,公司在测试阶段「向数量有限的创作者提供存取权限」。
他也邀请用户在X上提出指令建议,几分钟后在这个平台上张贴颇具说服力的影片生成结果,其中包括两只黄金猎犬在山上开串流Podcast、老奶奶在厨房教烹饪、动物在海上骑脚踏车,以及珠光宝气的动物园等。
还有另一支影片显示「半鸭半龙的生物飞驰在美丽的暮色中,背上骑着一只身着探险装备的仓鼠」。
不过这间总部位于旧金山的新创公司警告说,「目前的模型存有弱点」,像是左右不分,或未能在整段影片中维持视觉连贯性。
OpenAI声明指出,安全性会是一大关键,还说Sora会面临对抗性资安测试,也就是所谓的红队演练(red-teaming),期间特定用户会试图让平台失灵,产生不恰当的内容或出毛病。
OpenAI指出:「我们会接洽全球政策制定者、教育家和艺术家,以了解他们的顾虑,并找出这种新技术的正面使用案例。」
脸书母公司Meta、谷歌(Google)和Runway AI也在研发文本转文影片人工智慧(AI)技术,已经公布类似的工作样本。