大模型到底如何真正落地?阿里云与数十位创业者围炉畅谈

人工智能正在开启新一轮产业变革,所有行业都希望能在AI的加持下重塑格局。然而,AI的应用并非易事,需要有强大的算力、海量的数据、优秀的模型和场景的匹配。如何利用大模型解决实际问题,提升企业的竞争力和创新力,是许多创业者和开发者面临的挑战和机遇。

为此,阿里云联合创业邦发起阿里云创业者社群MeetUp–大模型场景落地研讨会,并于12月14日在上海成功举行,与创业邦100未来独角兽大会暨创业邦年会同期同地。

本次研讨会邀请阿里云大模型专家、创业邦100未来独角兽企业代表等共同探讨大模型的技术原理、应用场景、商业价值和未来趋势。研讨会通过案例分享,课题讨论等多种形式,为参会者提供了深入的交流和学习机会。

阿里云市场部总裁刘湘雯在开场致辞中表示,作为国内最早发展云计算的巨头,阿里云自2009年创办以来享受了云计算时代浪潮的红利,但也始终在创业的路上。在过去的一年里,阿里云处于不断调回正确路上的一个过程。在这个过程中,阿里云会与客户连接的更加紧密,提供更加有利于客户的产品价值。

“我们深刻地认识到,业界对于这一波人工智能浪潮充满了无限的期待,阿里云也会将大量研发资源投资其中,与大模型产业各方紧密地连接起来,更好地服务于最终客户。”

她指出,目前,大模型仍然面临着产品服务形态、供应等问题。例如,企业原来可以将云计算进行私有化部署,但大模型因其成本高昂则较难实现,因此未来到底应该提供怎样的产品形态仍然值得探讨。基于此,阿里云希望与产业各方有更多的交流和连接,帮助客户能够更加轻松高效地搭建大模型,未来可以成长为更大的business。

作为联合主办方,创业邦创始人兼CEO南立新表示,无论是工业视觉、物流机器人、RPA还是其他赛道的创业者,在新一波人工智能浪潮下都会迎来新的机会和新的挑战。

“尽管有人认为一些RPA公司会遇到很大的挑战,但我们看到的机遇远大于挑战。”她谈到,创业邦从15年前就开始举办创投活动,也希望能够在阿里云的支持下为创业者提供更多更好的交流平台,以及在共同走向未来成功的路上可以结交更多好的伙伴一起向前走,可以走得更快、走得更好。

据悉,目前中国一半大模型公司跑在阿里云上,百川智能、智谱AI、零一万物、昆仑万维、vivo、复旦大学等大批头部企业及机构均在阿里云上训练大模型。

阿里云也已成为中国大模型的公共AI算力底座。截至目前,中国众多头部主流大模型都已通过阿里云对外提供API服务,包括通义系列、Baichuan系列、智谱AI ChatGLM系列、姜子牙通用大模型等。

此次研讨会,主办方特别邀请了来自智谱AI专家团队的周积平,并作了题为《大模型的最新技术发展和行业落地应用分享》的主题分享。

他指出,ChatGPT只用了两个月就创造了用户破亿的神话,这也表明了ChatGPT与以往是技术或行业不同,它与生俱来就是落地的,直接就可以看到产生价值的场景,然后再去找到更多的应用场景,而并不像元宇宙要先定义行业再找落地方式。

他进一步说到,早期的AI时代,也叫AI0.5的时代,其方式是单个算法匹配单个模型。随着神经网络的出现,变成了算法是统一的,不同的业务场景对应不同的模型。Transformer技术架构出现以后,算法和模型都变成统一的模式,大模型从此把AI代入到2.0时代。

“这也是从小模型到大模型时代,AI的应用可能会创造一些变革性的价值,以往AI的应用场景会被切割的很细。直到大模型出来之后,会把整个业务实现All in one的模式,整体能力可能会创造出一些全新的业务。”

从智谱千亿模型的发展过程来看,主要会面临三大挑战:1、算法挑战:千亿模型非常之不稳定,并且调试非常困难,很容易出现不收敛的现象;2、算力挑战:以GPT-3为例,其训练成本达到了1200万美金,智谱AI的GLM-130B第一代产品也超过了一个亿;3、数据挑战:大模型训练不光要有大规模的数据,并且对于数据的质量要求也非常高,这中间还会涉及到一些数据清洗等问题;最后一个比较大的挑战就是人才。

据介绍,基于智谱从上百个商业落地案例中沉淀下来的观察,在汽车场景主要有智能座舱、辅助驾驶、销售与导购三大场景;在生产制造业,TCL通过引入大模型作为专家系统,产线员工可以24小时向专家问答系统提问,甚至包括每一个生产工艺中需要的温度、湿度等专业问题,大模型也可以给出专业准确的回复。

在大模型合作模式的探索上,周积平表示,智谱AI一方面采用开放平台的模式,通过调用API的使用次数进行计费;另一种则是云端私有化,其中GPO由智谱AI提供,智谱AI则是跑在阿里云上。智谱AI会为客户打造专属模型,客户传输数据后,智谱团队会配合进行一定的微调,这样既能保证较低的硬件成本,也能保证数据安全性。

在随后的分组研讨中,与会嘉宾也围绕自身场景中对目前大模型的应用、遇到的挑战、落地方式以及在技术、工程与资源等方面需要做的准备等方面进行了深入讨论。同时,现场还特别设置了大模型落地应用实操环节。

最终,现场三组嘉宾分别设计了物流和货代行业的订单自动化、企业知识库以及大模型如何更好地提升驾驶员体验三大应用场景的落地产品或业务流程,为云技术如何与大模型结合进一步推动真正落地提供了新的思路和启发。

当前,千行百业都想借助大模型实现生产和服务方式的变革,但大模型使用的高门槛把大部分人挡在了技术浪潮之外。不论是定制专属大模型,还是基于大模型构建创新应用,都有很高的人才、技术、资金要求。阿里云与创业邦也希望借助此次研讨会能够赋能更多创业者,共同构建一个开放、繁荣的AI生态。