恒小花:AI文生视频如何改变未来

美国人工智能公司OpenAI于16日又发布了全新的生成式人工智能模型Sora,它能够通过文本指令创建最长达60秒的视频,其逼真的视觉效果让它在一夜之间“刷屏”,全球诸多媒体都对其冠以“颠覆性”的美名,甚至有网友感叹“视频行业全都要被洗牌了”。相关专家17日接受《环球时报》记者采访时表示,短期来看,Sora确实会对影视等行业带来显著影响,但我们也不应神化其作用,长期来看,需要用心制作的作品,依旧很难仅用“芯”完成。

“人类愿赌服输”

目前OpenAI还没有发布Sora的公开使用版本,但已经发布的40多个演示视频中包含有细节拉满的场景、复杂的摄像机运镜以及多个充满情感的角色。OpenAI宣称,Sora可以理解物体在物理世界中如何存在,并准确地解释道具并生成引人注目的角色来表达充满活力的情感。例如它可以根据文字描述“在东京街头,一名时髦女士穿梭在充满温暖霓虹灯光和动感城市标志的街道上”,生成一段包含有多镜头的高清晰视频,包括从大街景切入对女士脸部表情的特写,以及潮湿的街道地面反射霓虹灯的光影效果。这些视频的真实度令人为之惊叹,就连特斯拉CEO马斯克也在社交媒体上对此表示“人类愿赌服输”。

Sora的出现也引发了国内许多业界人士的担忧,“中美AI领域差距进一步拉大”成为Sora问世后的伴生话题。360集团创始人周鸿祎认为,“OpenAI训练的Sora应该会阅读大量视频。一幅图胜过千言万语,而视频传递的信息量又远远超过一幅图”,因此Sora的出现可能意味着通用人工智能“真的就不远了”,“不是10年20年的问题,可能一两年很快就可以实现”。他表示,尽管国内大模型发展水平表面看已经接近GPT3.5,但实际上跟4.0比还有一年半的差距。从现在来看,OpenAI手上除了GPT5之外,可能还有一些“秘密武器”没有亮出来。“中国和美国的AI差距可能不但没有缩小,反而在加大。”

此外,在人机协同和人机融合领域,中美技术能力旗鼓相当。“这也是美国三番五次与中国开展人工智能技术对话的原因之一,双方实力相当,才有对话的意愿,美国方面也很担心我们在人机协同上实现重大突破,从而占据领先地位。”