沉淀、追赶、爆发,时代浪潮中的中国AI企业

最近结束的联合国大会上,马斯克与近期热点人物、以色列总理内塔尼亚胡谈笑风生时,再度盛赞了中国的AI实力:

“至于你说的哪些国家将在人工智能领域处于领先地位?中国肯定是其中之一,是顶尖国家之一,并且有潜力成为第一。”

虽然马斯克出名是因为搞制造业,但作为OpenAI的早期牵头人、也是给Google和DeepMind牵过线的内行,马斯克对AI的理解和参与比一般人想象中深的多。对于中国AI产业,“马建国”自然洞察敏锐。

马建国出席上海的世界人工智能大会

距离ChatGPT诞生不过一年不到的时间,仅1-7月,中国就诞生了64个大模型,累计大模型数量达到130个,超过美国的114个[1]。

不过,马斯克认为中国有潜力成为第一,原因一定不只是中国的大模型数量。在轰轰烈烈的百模大战后,应用层面的建设已经徐徐铺开,在这关键的第二枪上,中国企业其实已经率先站上了起跑线。

谁来打响第二枪?

2022年11月,ChatGPT的问世让生成式AI在短短一个月里,成为了科技圈一整年甚至今后几年的头号关键词。

这样的情形一度让人回忆起2016年,AlphaGo以碾压之势战胜人类围棋冠军李世石,给普罗大众带来的震撼和随之而来的资本狂欢。

AlphaGo 3:0战胜李世石

有了基于transformer的大模型开道,AI以更符合人类想象的方式到来:可以对话,可以思考,可以像朋友、师长、同事、助手。人们会对AlphaGo的智能产生天然的敬畏,对ChatGPT却更多的是好奇、兴奋,确信AI将会改变我们的生产和生活。

更清晰的蓝图,给了人们前所未有的憧憬,带来的是扎堆开发大模型的热闹场面,连坐拥石油的沙特阿拉伯都坐不住了,意图要用“钞能力”堆出一个生成式AI的未来。

在这样的背景里,中国不出意外的成为了大模型开发的主力军。除了数量上的领先,国内大模型的质量参数也保持了高水准:年初至今,不断有机构以不同的指标对ChatGPT和国产大模型做测试,一个可观的趋势已经出现:

年初还与ChatGPT有较大差距的国产大模型,正在以惊人的速度缩小差距。

在今年5月发布的中文通用大模型综合性评测基准SuperCLUE中,科大讯飞推出的星火认知大模型排名全球第三,仅次于GPT-4以及ChatGPT采用的GPT-3.5[2]。

而在10月24日的发布会上,科大讯飞进一步迭代推出了星火认知大模型V3.0,根据国务院发展研究中心的国研经济研究院的横评报告,星火认知大模型V3.0综合能力超越ChatGPT,国内领先、国际一流。科大讯飞年初时定下的计划——全面对标ChatGPT,得到兑现。

而相比大模型本身在理论性能与技术路线上的差距,当下产业界最关心的问题,其实是困扰AI产业十几年,如今再度被搬上台面的“紧箍咒”。

9月,知名投资机构红杉资本的David Cahn发布文章称,如今的AI产业还需1250亿美元的营收,才能挣回为了大模型在GPU、数据中心、能源等成本上的投入。但目前AI在应用层面上的创新与商业化前景,与1250亿美元的阈值还有巨大的分歧。

虽然文章发出马上就引来了a16z的反驳,但双方争议的核心在于计算方式,对“AI应用的创新还不够”这一点却达成了共识:大模型是生成式AI的基建,但做好了基建,如何在此基础上建设应用的高楼大厦实现变现,是这场竞赛的第二枪。

如何让更多“高楼大厦”在大模型的地基上拔地而起,正是中国在生成式AI的赛道上,实现反超的最大机会。

主流观点认为,生成式AI应用中存在几个问题:一是生成能力的可信可靠问题,二是信息的动态集成问题,三是数据耗尽带来的数据获取问题[3]。生成能力的可信可靠,需要技术端长时间的迭代和优化,无论什么国籍的大模型都有很长的路要走。

而后两个问题的核心矛盾,其实在于数据资源。在这一点上,中国的优势其实更加明显:

互联网被视作数据的蓄水池,而中国拥有全球最大的网民规模,英特尔此前估算,中国产生的数据量大约占据全球总数据量的五分之一[4]。同时,中国社会的“数字化程度”相比其他主要经济体要高得多,得益于繁荣的通信基建和各类互联网应用。在小模型时代,中国就在AI应用落地上领先全球。

另一个优势则常常不被普通人注意。加州大学伯克利分校的教授Mark Nitzberg曾在一次访谈中,对比了中美在AI应用落地投资上的差异[5]:

在美国,一家AI初创公司需要在营销上投入巨资,期待产品“一炮而红”然后回本,非常像一种赌博。但在中国,政府层面的产业政策非常成熟,地方政府也会通过基金等更现代化方式入场投资。同时,大量政府订单为AI应用落地提供了缓冲空间。

在红杉的报告里,他们将生成式AI的发展划分为两个章节,第一章是“人们发现了生成式AI”这个工具,第二章是“客户支持”——即应用落地。如今的市场,正是两个章节切换的窗口期。

而打响第二章节的第一枪的,很可能是中国面孔。

前浪、转机、开幕

既然聊到AI的应用革命,很难让人不联想到上一轮AI热潮。ChatGPT之前,最符合人类对AI想象的应用是语音助手,也是死在AI应用沙滩上的第一批前浪。

2018年,还未改名为Meta的Facebook宣布,下线其AI语音助手Facebook M的人工辅助版,最终享年不到3岁。虽然增强版仍可通过别的方式使用,但仅向居住在加州的大约2000人开放。但在上线之初,扎克伯格曾对Facebook M视作公司的给予厚望,视作公司未来增长的另一支柱。

然而事与愿违,Facebook M最终成为了教科书中的反面案例。事实上,谷歌、微软以及亚马逊的语音助手都曾经遇到过类似的困境。

曾经意气风发的扎克伯格

问题出在哪?简单来说,就是智能了,但还不够智能。而根本上,是小模型在应用层面的尴尬。

在大模型诞生前,业内的AI应用大多是基于小模型,只能处理单一任务。面对复杂任务,往往需要拆分成小任务,针对每个小任务去训练模型。传统的语音助手通常都是多个小模型的叠加,只能回答预设领域的问题。比如,传统语音助手可以告诉你“明天是什么天气”,却很难回答“C罗梅西谁的统治力更强”之类从未学习过的问题。

因此,Facebook M时常被诟病,使用说明极其冗长复杂,任务执行范围却极其有限。

这还只是产品体验层面的尴尬。在真正落实到提高人类生产力方面,尤其是遇到生产流程繁琐的情况,十个步骤需要训练十个模型,又涉及到成本和效率的拉扯。因此在2019年,AI行业凛冬到来,融资金额像气球漏了气,缩为前一年的1/10。无法创收的初创企业,存活下来仅有巅峰时期的1/20,其中九成处于巨亏状态[6]。

但随着Transformer推开了大模型时代的大门,AI应用的转机出现了。

transformer模型

相较于小模型,大模型更大规模的神经网络,换来了极强的通用能力,开发者没必要再一一找对应的数据做训练。比如基于ChatGPT的语音助手,不仅可以回答“明天的天气是否适合出行”的问题,还可以帮忙搜集资料、规划项目流程、做会议纪要,还可以像个导师一样给出学习、工作的意见指导,甚至是做心理辅导等。

这便是大模型带来的改变,即提供完整、可靠的问题解决方案,真正意义上具备了一定的智能,而不只是更有效率的方案执行者。

更重要的是,大模型突破性地发展出了启发式对话和长期记忆的能力——它不再只是预设好的机械,而是真正意义上具备了一定的智能。因此,大模型将有机会发展出更深层次的应用,进一步重塑人类社会的科技树。

科大讯飞在AI健康助手这一应用上的突破就是个典型案例。

2015年底,科大讯飞依靠小模型打造出了讯飞智医助理,试图让人工智能技术与医疗行业相结合。从今天的视角来看,讯飞智医助理的能力边界、应用场景主要在B端,为基层医生提供辅助诊断。

但随着大模型时代到来,人工智能显然可以做得更多、更好。

10月24日发布会上,科大讯飞推出的新版讯飞晓医。除原有能力之外,讯飞晓医还能提供看病前问诊功能,帮助有效提升问诊效率,健康自查有效度提升40%。还能解答病人的用药疑问,高风险用药召回率提升90%,帮助病人更合理地用药。在此基础上,讯飞晓医也支持体检报告快速生成重点及健康提醒,使得病人可以有针对性地问诊。

小模型时代的讯飞智医助理,主要在B端,是一个基层医生的助理;相比之下,新版的讯飞晓医可以将能力边界延伸到C端,成为一个私人的健康助手——这一变化,正是大模型所实现的。

值得一提的是,从发布星火大模型V1.0到现在,科大讯飞实现上述应用的落地,只用了不到半年的时间。这些成果背后,其实是科大讯飞企业价值观的一种体现:根据地业务的核心满足社会刚需,以价值创造推动社会进步。这在全球科技公司盲目扩张大模型的当下,有着不小的意义。

有大模型加持的AI,显然比过去更加符合人类对AI的想象了,大概率不会重走上一轮AI热潮的老路。大模型革命的第二章节,很可能会比想象中更加波澜壮阔。

中国企业的十年

人们感叹中国技术进步之快,却很少有人意识到,在此之前,中国科企已经伴随着AI产业走过漫长而曲折的道路。

世界经济论坛创始人施瓦布教授将工业革命划分为四个节点:第一次是蒸汽机的发明,第二次是电气化革命,第三次是计算机革命,第四次是现在的人工智能革命。

前两个节点,中国直接没赶上,第三个节点赶上了,却只赶上了后半截。

在计算机底层的技术上,先是错过芯片产业技术转移黄金期、又是错过“Win-Tel”联盟引领的PC浪潮。虽然后来居上,总算坐上了互联网时代的云霄飞车;但由于过去缺少对底层技术的投入,因此仍有许多受制于人的地方。

值得庆幸的是,在人工智能的技术革命中,中国公司早早入了场。实际上,论底层技术的积累和前期的投入,中国公司并不比西方落后。

人工智能的上一次里程碑事件是2012年的ImageNet图像识别大赛:多伦多大学的Geoffrey Hinton团队拿下冠军,也为深度学习的产业化撕开了一道口子。此后,谷歌等极少数美国科技公司加入到了对人工智能的追逐当中,最终开创了一个时代。

但很多人不知道的是,同一年的全球语音合成大赛中,来自中国的科大讯飞团队也达成了一项成就:它的汉语语音合成超过了普通人水平。从一开始,中国就不乏科大讯飞这样的“AI原生”公司。

科大讯飞对大模型及其背后深度学习理论的启蒙,可以追溯到2010年:

当时,微软AI首席科学家邓力回母校中科大做了场演讲,分享了将深度学习应用于语音识别的最新成果。当时,几乎没有什么人相信深度学习的潜力——连邓力自己,都是2009年和Hinton合作过一次之后,才变成了“信徒”。然而,这场演讲却给台下坐着的胡郁、王智国、刘聪心中,种下了一颗种子。

邓力

彼时胡郁是讯飞研究院院长,而王智国、刘聪为研究院核心成员。

这次讲座,成为了科大讯飞踏足大模型和深度学习的开端。很快在2011年,科大讯飞上线了中文语音识别深度神经网络系统,是早期中国企业探索AI的经典案例。

此后几年,越来越多中国的创业者也都意识到了人工智能的价值。语音技术、翻译、推荐算法等应用陆续涌现,各大厂商基于自身业务和优势开始扩张。科大讯飞便是AI语音赛道上的重要力量。以2014年启动“讯飞超脑计划”为起点,研发基于类人神经网络的认知智能系统,正式跨入认知智能时代。

更早涉足大模型和深度学习,带来的不仅仅是更长久的技术积累,也夯实了中国企业AI人才的建设。AI是个典型的强人才导向型行业,100个大学生未必比得上1个经验丰富的工程师。

因此,科大讯飞等中国企业很早便开始了这方面的投入。

作为“大学生创业”的一面旗帜,科大讯飞一直高度重视人才,从最初以同样位于合肥的中科大为重心,到一步步与更多院校展开合作,与高校的紧密联系,为科大讯飞源源不断地输送着AI人才。

2005年,科大讯飞成立讯飞研究院,但与其他大厂设立的研究院有很大不同:

一方面,整个研究院保留着高校实验室氛围,所有人卸下职级,可以就学术问题与董事长刘庆峰“吵架”,总裁吴晓如在重要时刻也得来做后勤。

另一方面,研究院聚集了公司技术研发的所有力量,也就是说,不存在每个业务线养自己技术团队的现象,也杜绝了所谓“部门墙”带来的内耗。

而过去十年的无数场硬仗,又进一步加速了这支队伍的成长与积淀。

例如2013年的“语音识别卫冕之战”。当时面对来势汹汹竞争对手,讯飞研究院立下军令状,在公司上下的全力支持下,经过三个月的加班加点,成功上线了全新升级的语音识别系统,自此将竞争对手甩在了身后。

也正是有了类似“卫冕之战”的经验积累,才有了如今的星火大模型。

去年年底,科大讯飞迅速组建完了团队并迅速进入攻坚状态:没有内部行政级别,上下一条心,所有人扁平化工作,公司高管成了“后勤”,研究院需要什么就给什么。最终,从成立专项组、人员调动,到发布星火大模型,科大讯飞只用了半年的时间。

一方面,这是研究院十几年文化的延续:看到新技术,立刻扑上去,深度学习如是,大模型如是。而由于是成建制的团队,可以非常有效地调动资源,可以很快作出成果。另一方面,也是科大讯飞从2010年涉足深度学习至今,十几年来的持续投资以及最核心的技术积累的结果。

以科大讯飞为代表,中国企业过往积累的一系列“跬步”,最终换来了今日的“至千里”。

因此,当大模型浪潮的第二幕真的来临,最终如果真由中国企业打响了第二枪,那也没什么好奇怪的了。

尾声

当2012年Hinton团队赢下ImageNet图像识别大赛时,全世界只有很少的商业机构能够意识到深度学习的价值与产业化空间,即便是学术界,对“深度学习有没有研究价值”的争论依然没有消失。在中国,对人工智能开始大规模投资的公司更是寥寥无几。

黄仁勋说自己从来不关注市场份额,这是有一定道理的。资本市场和公众审视科技公司的核心并非销售额或市占率,而是他们依然在引领技术的进步,还是开始变得平庸。

在所有以技术和创新作为关键词的叙事里,我们都能看见对研发义无反顾的投入、对人才毫无保留的尊重以及对长远目标十年如一日的坚守。从方方面面看,科大讯飞都在扮演着这个角色。

假使中国公司能够站在通用人工智能浪潮的前线,科大讯飞没有理由不成为主角。

参考资料

[1]IT 2023,赛迪顾问

[2]SuperCLUE: A Comprehensive Chinese Large Language Model Benchmark

[3]大模型发展与落地思考,中国宏观经济论坛CMF

[4]2019英特尔中国:公有云和互联网创新实践

[5]中国在人工智能产业发展中有哪些优势?投中网

[6]2021年人工智能行业发展白皮书

[7]AIGC正向医院渗透,大模型下的AI医疗能否打破僵局?第一财经

[8]AI十年浮沉,与改变命运的大模型,远川研究所

[9]为什么全球AI应用领军有望产生在中国?求是驿站

作者:何律衡

编辑:陈彬

视觉设计:疏睿

责任编辑:陈彬