“百模大战”下一站:小切口、大纵深垂直场景成未来方向

21世纪经济报道记者张梓桐 实习生 陈归辞 上海报道

自ChatGPT问世引发国产AI大模型研发热潮以来,过去一年多的时间里,在激烈的中美竞逐和国内竞争之下,中国已经有包括智谱AI ChatGLM、讯飞星火、百度文心、阿里云义通千问、商汤日日新等等在内的几百个大模型陆续发布。

如果说2023年被视为AI大模型的元年,那么到了2024年,行业的焦点则更多地转向了大模型的应用和商业化落地。

5月15日,在第四届上海数字创新大会上,中国科学院院士、华科智谷人工智能研究院院长何积丰在会议上指出,大模型必须有企业去做,作为我们的技术基础,但不是每家企业都值得做。

360集团创始人、董事长周鸿祎在发言中更是称要把大模型“拉下神坛”。他认为,走开源大模型,专家小模型,以及走“专业化、场景化、垂直化”之路是行业当前和未来的三个趋势。

他以“锤子”和“钉子”的比喻形象地解释道,“我们不能有了一个特强的大模型,就拿着锤子到处找钉子”。客户很多时候购买的不是技术,而是技术带来的实际效用。因此,应当小切口、大纵深,在垂直场景做专业大模型,而找到“明星场景”就显得尤其重要。

专家们指出,应在新业态和垂直场景中,探索大模型的融合应用。而训练出“智能”大模型的关键,在于提高数据管理的效力。

挖掘明星场景

就在几天前,李开复在零一万物的发布会上主张行业应共同避免“ofo 式流血烧钱打法”。而早在去年11月,百度董事长李彦宏就已经在一次论坛上给大模型热泼下冷水,称“我们不需要100个大模型”。

一方面,算力紧缺、巨量数据要求及高昂成本,使行业开始逐渐意识到“卷”大模型并非所有公司值得做和能做。另一方面,“AI+”所展现出的广阔发展空间和潜在价值,使得探索大模型的应用和商业化总体而言更具现实前景。

毕竟,大模型本身只是一种技术基础,在追求这种基础的突破之外,重复开发并无太大意义。与其“卷”大模型,不如寻求大模型在多元场景中的应用,使“智能”真正在生产和生活的各个领域涌现出价值。

从大模型的开发转向应用,如何找到大模型的落地场景成为行业新的核心关切。对此,周鸿祎表示“关键的顺序是要找到明星场景,根据场景来设计功能,再根据功能再来训练专业的模型。”

如何找到“明星场景”呢?周鸿祎表示,明星场景就是能最大程度打动用户、抓住用户的痛点和刚需的场景。企业和政府要自上而下、自内而外地梳理自身的业务场景,寻找这样的场景。例如,在产品服务、内部管理流程、员工效率等方面,寻求实现“四个10倍原则”,即提高10倍效率,提高10倍的用户体验,降低10倍的成本,或者降低10倍的人力。

进一步放宽视野,至新一轮信息技术革命所召出的数智产业和经济的未来图景,大模型如何落地的问题,也应在探索数字经济的新业态和发展空间中创新求解。

何积丰院士指出,数字经济催生出众多新业态,包括数据经济、服务经济、物联经济、智能经济等。他特别提出,服务贸易是中国数字经济里一个很具前景的发展空间。在国内方面,2023年,我国服务经济总量已占全国经济总量的55%,这证明国内服务业的发展空间已经非常大。在全球方面,全球服务贸易占全球货物与服务贸易总量的40%,而我国的服务外贸仅占货物与服务外贸总量的12%。这说明,在服务贸易领域,我国还有很大的发展空间。

另一方面,数字技术极大地推动了服务经济的转型和升级,这使得服务经济作为数字经济里的新业态,显示出广阔的前景,而我国具备相关技术实力。因此,服务贸易领域的数字服务是一个生长点。

另外,他还强调了“工业软件是数字经济的灵魂”。他认为,在工业软件制造上的发展趋势是让工序帮人自动生成代码,从而更多的人能够自己创造自己需要的东西,而不是依靠软件公司来做。

“智能”的关键在数据管理

在大模型落地中,另一个突出的困难在于数据的缺乏。

周鸿祎指出,许多政府部门和企业在大模型的落地过程中,找到了应用场景,却巧妇难为无米之炊,没有数据的积累和知识的沉淀,来训练大模型。

而正如何积丰院士所言,大模型之所以“智能”,是因为它有数据和知识,能把数据组织得很好,很容易地找到需要的数据。因此,对数据的组织是核心问题。对此,他指出有三类技术起着尤为重要的基础支撑作用:建设知识中国化,建设向量数据库,以及数据编制和数据网格。对于“数据中心不够”的质疑,何积丰院士认为更关键的问题应是如何提高数据管理的效力。

周鸿祎也总结了大模型落地中大家犯过的几个错误。

一个错误是认为大模型可以取代原来的IT系统。“原来IT系统还是非常重要的,它会变成大模型的手和脚,而大模型永远就是一个大脑的作用。”他表示,“大模型要和业务深度融合,这样才能在业务流中发挥作用。”

另一个错误是“迷信”聊天机器人。他指出,在企业内部使用聊天机器人,实际上效果非常差。它要求学会提示词,这是很多人使用中的最大障碍。所以,还是需要一套工作流业务系统框架,把专业大模型与企业传统的用户界面融合在一起,把组织与业务系统连接在一起,这样才会产生更好的效果。

在他看来,从根本上说,技术的生命在于应用,“智能化”的目标就在于更好地服务于人的生存。“百模大战”的下一站,行业应该共同努力探索新业态和多元化场景,提高数据管理的效力,踏实、创新地推动大模型技术的融合应用。