阿里云的开源算盘

不久前,IDEA研究院创院理事长沈向洋提出,第一名毫无疑问会闭源、第二名会纠结开源还是闭源,第三名一定会开源。

12月1日,阿里云CTO周靖人听到这个观点时微笑着回应:"Harry(沈向洋)是有点玩笑话,过去十年以来,整个开源社区已经蓬勃发展起来。"

当天,通义千问开源了多个大模型,实现全尺寸开源,这一场景就发生在通义千问发布会后。4月,通义千问启动邀测,8月以来开源了Qwen-14B和视觉理解模型Qwen-V,10月底发布通义千问2.0版闭源模型。大模型竞赛大半年,开源闭源之争常谈常新,不时还会以Android和iOS系统类比。现实是,百度的文心大模型目前尚未开源,OpenAI在开源闭源之间横跳。差异化的路线反映了企业的不同策略,对阿里云而言,开源大模型不光牵扯到社区、生态,或许还关系到放缓的营收和整个阿里系的未来。

从1.8B到72B

12月1日,阿里云通义千问720亿参数模型Qwen-72B开源。该模型可以处理最多32k的长文本输入,在长文本理解测试集LEval上取得了超越ChatGPT-3.5-16k的效果。研发团队优化了Qwen-72B的指令遵循、工具使用等技能,能更好地被下游应用集成。比如,Qwen-72B搭载了强大的系统指令能力,用户只用一句提示词就可定制AI助手,要求大模型扮演某个角色或者执行特定的回复任务。

通义千问还开源了18亿参数模型Qwen-1.8B和音频大模型Qwen-Audio。截至目前,通义千问共开源18亿、70亿、140亿、720亿参数的4款大语言模型,以及视觉理解、音频理解两款多模态大模型,实现"全尺寸、全模态"开源。

"我们希望把各种模型的参数、所消耗的资源、拥有的能力等清晰地展示给开发者、企业,让它们根据自己的场景做更好的选择",谈到为何推出720亿参数大模型时,周婧人说。

据不完全统计,目前国内市场已发布约200多个大模型。易观分析高级分析师陈晨告诉北京商报记者,"国内主流大模型的竞争领域主要集中在百亿级别以上参数档,几家头部厂商的大模型参数量达到千亿级以上,在工业制造、医疗、金融、智慧城市领域,需要借助AI进行大量的识别分析、计算和推理任务,能充分发挥超大规模模型的性能。目前百亿级别以下的模型相对较少,这类模型在计算资源有限的情况下,比如在移动端、边缘设备的应用场景下有很好的表现"。

不光为生态

"这段时间,已经有不少硬件厂商在跟我们洽淡,我们的心态是非常开放的",周靖人透露。他还多次表示,开源生态对促进中国大模型的技术进步与应用落地至关重要,通义千问将持续投入开源,希望成为"AI时代最开放的大模型"。

大模型开源社区创新平台魔搭是阿里云频繁提及的另一个词。根据阿里集团创始人、董事长蔡崇信一个月前披露的数据,魔搭汇聚了280万开发者、2300多个优质模型,模型下载量超过1亿。

在陈晨看来,开源有利于大模型厂商形成更开放的生态,吸引更多研究者或开发者来丰富基于这些模型的应用和服务,也能推动模型持续地优化迭代,"尽管大模型本身是开源的,但仍然可以在这个基础上提供多种形式的服务,包括定制开发、技术支持、培训等。大模型的原始开发者在模型理解、技术细节、创新能力、可持续性上都更具优势,能够更有效提供定制化解决方案,这也就为开源大模型厂商带来了更多的商业化机会"。

2023年三季度,阿里云营收276.48亿元,同比增长2%,经调整EBITA利润14.09亿元。对于这份业绩,阿里云的评价是:"我们通过减少利润率较低的项目制合约类收入,以持续提升收入质量。与此同时,本季度公共云产品及服务收入增长,带动盈利能力的优化。"

第一名不开源?

文渊智库创始人王超也提到了通义千问开源和阿里云商业化的关系,"大模型开源还是封闭,最大的考虑是商业考虑和自身优势,绝不仅仅出于公益目的"。

"大模型开源仅是算法开源。即便开源,其他开发者和公司想要复制,难如登天,它们既没有大规模算力,更缺乏所需要的数据。阿里云拥有足够的算力,即便开源也能保证很多用户最终会回到阿里云体系,开源也能带来社区和生态,对吸引新的阿里云用户,巩固原有的阿里云客户,都是不无裨益的",他进一步补充。

不过,并非所有企业都选择同一路经,如同当年Android和iOS之争。2007年,第一代苹果手机改变了科技史,封闭的iOS系统横空出世。后来,谷歌等研发改良的Android系统,用开源打法,几乎垄断了iOS系统以外的全部市场。

当下的大模型竞赛,与当年有相似之处,不过闭源的大模型不止一家。提到第一名不开源的观点,周婧人笑称,"站的角度不一样,我们要让更多人参与进来,开源是最佳也是唯一的途径"。

王超则将阿里云的选择上升了一个高度,"阿里虽然不以技术强出身,但大模型天然跟云计算强关联,算法、算力和数据都依赖云计算。阿里云作为中国最大公有云公司,是发展大模型的绝佳底座。拼多多即便在电商方面有出色表现,但业务单一,在技术和其他业务储备不足,阿里云号称要用大模型把所有产品重做一遍,阿里云+大模型就是整个阿里系最大的希望,没有之一"。

北京商报记者 魏蔚