追赶Sora难在算力 或再现“百模大战”

2024开年,OpenAI就给了科技圈一个惊喜——文生视频大模型Sora于2月16日“横空出世”,它能直接以文生图,并将图片转为生动逼真的动态视频。作为科技圈“大佬”,360集团创始人周鸿祎多次针对该大模型发表看法。

日前,在接受南都记者采访时,周鸿祎表示,Sora最令人震撼的是制作出了逼真的、符合人们认知常识的内容,这意味着它能深入学习和了解这个世界很多元素之间的互动关系。他推测,此后国内也会有多家企业推出类似文生视频工具,很可能再次出现“百模大战”的情形。

发展垂直化企业化大模型能更好满足企业需求

南都:今年两会,你带来了一份关于深化人工智能多场景应用,支持大模型向垂直化、产业化方向发展的提案。2024年被认为是大模型应用场景元年,我国大模型发展之路该走向何方?

周鸿祎:现在企业对AI普遍都很向往,但是不知道从何切入,尤其非IT企业对AI还是比较陌生。中国在通用大模型核心技术上赶超美国还需要时间,但在大模型应用方面,中国完全可以走出一条具有中国特色的大模型发展之路。

我在今年的提案中提到,通用大模型在企业级场景中无法直接应用,发展垂直化和企业化的大模型可以更好地满足企业的个性化需求,提高生产效率和服务质量,促进产业升级。

南都:具体应该怎么做?

周鸿祎:我认为应该分三步走。一是场景。大模型在垂直领域大有可为,建议政府、央国企率先提供更多应用场景,聚焦“小切口,大纵深”,推动大模型垂直化、产业化落地。企业用大模型不能冒进,而是要用AI逐步改造业务,循序渐进,积小胜为大胜。在实践中要拆分场景具体分析,在业务流程上找准切入点,选择与大模型成熟能力匹配的业务环节切入。切入点虽小,但纵深推进,对业务影响很大,改造收效更大。

二是知识。企业在做AI之前,要先解决好基础设施问题,其中最重要的就是在定制AI前,做好知识管理,将企业大数据平台升级为企业知识平台。大模型的数据、知识只是人类知识的冰山一角,企业还有大量的“暗知识”,如战略规划、产品设计图等企业具有的独特知识,只存在于特定企业中,在互联网上难以找到。建议鼓励企业构建知识平台,将“暗知识”汇总起来,打造企业专属知识库,做好管理。在此基础上,通过垂直训练,深入企业级场景,满足企业需求。

三是业务融合。建议鼓励和引导企业将大模型与数字化业务系统深度结合,同业务流程相结合,充分发挥大模型价值。大模型像发动机,不是用来秀的,而是要与业务相结合,特别是传统制造业,大模型是推动数转智改的利器。

人不会被AI淘汰,但可能被用AI的人淘汰

南都:Sora对行业的影响会有多大?是否还会出现类似于之前“百模大战”的竞争格局?

周鸿祎:Sora的技术原理现在国外讨论的也非常多,最近stable diffusion发布了一个类似架构开源的东西。我经常讲,人家一开源,我们的科技就进步。国内AI可能在原始创新、从“0”到“1”这方面表现得弱一点,不过一旦OpenAI宣布了这个技术方向,宣布了相关产品,国内的学习就会很快跟上。所以,肯定会有很多家推出类似的文生视频工具,我认为会出现“百模大战”这种情况。

南都:Sora的出现进一步引发了人们对AI“取代论”的担忧,你怎么看?

周鸿祎:对这个问题,我有两个观点想要分享。一是AI科普目前在中国变得非常关键,发现大家谈论AI同时也有恐惧,比如担忧AI会导致大规模失业、带来行业崩溃等。

在我看来,AI是有史以来发明的人类最好的朋友,也是最好的工具,它可以帮助人们“解锁”画画、拍视频等更多技能。特别是对年轻人而言,这项技术能让他们从一个资浅的人,很快和有经验的人站在同一个起跑线上。

进一步来讲,我一直认为AI并不会导致某些行业的颠覆或崩溃,反而会给短视频行业、影视工业、广告业等带来正向的推动,只有那些不用AI的人才会被用AI的人淘汰。AI科普能帮助大家知道怎么去更好地拥抱AI,进而避免AI恐惧论或者AI万能论,这两者都是偏颇的。

南都:国内大模型企业如何才能追赶Sora?有哪些难点?

周鸿祎:在追赶Sora方面,算力可能会是一个难点。网上有人指出Sora的参数规模不大,约为30亿,这是错误的理解。事实上,视频参数和文本参数是不能简单做对比的,比如文本有10万字,视频只有640×480,但二者所占存储量完全不在一个数量级,Sora参数规模很可能超过30亿。退一步讲,就算Sora参数规模是30亿,其对算力的消耗应该也远远超过一个千亿模型。

Sora为什么只能做一分钟的视频?我猜测,因为它与四秒、六秒时长的视频存在本质差别。四秒、六秒时长的视频可以全部通过像素生成,无需掌握更多知识。而Sora能生成时长一分钟的视频,就意味着它还能做时长十分钟甚至六十分钟的视频,而现在不做的原因是算力和成本的限制。

对于国内而言,同样的困扰也在发生。如何才能将算力集中起来值得重视,这也是我反复强调AI科普重要性的原因。Sora不仅仅是一款文生视频工具,Sora实际上预示着AGI的一个关键节点,所以我觉得这件事对国家而言很重要。

大模型红利期尚未到,至少持续十年以上

南都:2024年,中国在AI发展领域有哪些独特优势值得拓展?你如何看待今年AI的发展方向和前景?

周鸿祎:我认为中国的AI发展是有优势的,尽管原创技术方面,面对美国我们处于落后状态,但这种落后不像光刻机和芯片的差距那么大。一旦方向确定了,以国内公司的学习和模仿能力,很快就能追赶上去。目前的差距大概用一到两年时间是可以解决的。

2024年,中国在AI领域的发展主线可能有两条,一是做Sora和GPT4这类超级通用大模型,另一条是推进大模型的应用落地。目前来看,大家对GPT用途的感受主要是写诗、解奥数题、聊天等,离运用在工作学习中还太远。

此外,2024年大模型在企业方面的垂直领域也是大有可为的。大模型会真正产生一场工业革命,它一定要进入到百行千业,与很多企业的业务流程或产品功能相结合。我很赞同不需要做千亿、万亿的垂直模型,只要做百亿的模型就足够的观点,这样很多企业也能负担相应的成本。

南都:大模型的红利期到来了吗?能持续多久?

周鸿祎:我认为大模型的红利期还没开始。现在唯一能赚到钱的就是英伟达,国外最挣钱的也是英伟达,此外微软、OpenAI都没挣到钱,所以还没有进入红利期。我预计亚马逊能挣钱,云厂商和硬件厂商今后也能率先挣钱。这是一场工业革命级别的革命,大模型的红利期至少有十年以上。

采写/摄影:南都记者 樊文扬 王子黎 杨博雯