中美大模型競賽「勝負手」:差距擴大還是不相上下?

【编者按】2023年,半导体行业面临宏观经济和地缘政治等多重挑战。迎接2024年,《集微网》推出回顾展望系列,邀请行业代表企业总结过去一年的产业链发展、热点话题,并展望未来。通过这一系列,为半导体行业提供有深度的参考,助力企业更好地应对新的发展趋势。

集微网报导(文/陈兴华)随着全球新一轮产业技术变革加速到来,人工智能作为这一浪潮中的核心动能已经越来越受到世界各国的高度重视。其中,在国际地缘环境演变和产业链逆全球化趋势擡升等复杂背景下,中国与美国正力争成为全球AI大模型领域中的主要领导者并成为世界瞩目的焦点,因为这不仅是探索引领科技产业变革的全新高地,也事关人类社会经济发展的未来。

目前,已有政府机搆、行业智库、媒体学者等对主要科技大国的人工智能战略等方面进行了研究,但对中美两国AI大模型的产业政策、技术创新、学术研究、行业应用和市场融资等方面的对比分析相对缺乏。鉴于此,本文通过盘点相关权威机搆及智库报告、专栏文章和榜单等并提炼要点精华,以期对中国AI大模型产业发展有所参考镜鉴和促进发展。

2023年11月21日,美国《财富》杂志首次发布了「人工智能创新者50强」榜单。在这50家企业中,绝大多数都是美国企业,其中包括OpenAI、Anthropic、英伟达、谷歌、微软、Meta、IBM、Adobe等美国知名AI及科技公司,以Midjourney、Hugging Face、Adept、Runway、Pinecone、Exscientia和ARC等新兴玩家入选。

相比之下,中国仅有一家企业——百度入选该榜单。《财富》在对百度入选的评语中指出,2023年10月,百度发布了文心一言4.0,并声称该模型处理许多中文特定任务的表现优于OpenAI的聊天机器人,以及在复杂度和功能方面可以与ChatGPT相媲美。此外,百度除了在其搜索引擎、云计算部门和其他产品中使用机器学习外,还在开发自动驾驶算法,并拥有一支无人驾驶的「机器人出租车」车队。

《财富》表示,50强榜单是一份重要指南,旨在帮助业界了解正在创造定义未来技术的公司。该榜单是由《财富》与风险投资家、行业分析师和《财富》人工智能专家团队进行深入讨论并筛选,以确定处于行业前沿的公司。虽然人工智能领域瞬息万变,但可以确定的一点是:这些公司所做的工作不仅会塑造人工智能的未来,还会影响人们生活的世界。

业内分析指出,从上榜企业数目来看,中美在人工智能综合创新力方面仍有较大差距。这种差异可能是因为上榜公司更加注重研究方向与实用性,而国内大部分人工智能公司则仅是为了跟进市场趋势,缺乏核心优势,需要更多投资和研发进一步提高创新能力和竞争力。

2023年9月9日,钛媒体国际智库发布产生一定行业影响力的《2023 AI大模型应用中美比较研究》报告。报告综合大模型行业渗透度、行业接受程度、行业应用成熟度以及行业融资版图四个维度,选取了部分AI应用主流行业,分别是AI+办公、AI+金融、AI+医疗、AI+文娱、AI+教育、AI+交通以及AI+能源,多维展现了中美在AI大模型相关应用领域的现状及各自的特点、优劣势比较与分析。

报告指出,当前国内外大模型在金融业的渗透率最高(78%),办公领域的渗透率也比较可观,但能源和建筑行业的渗透率较低。其中在中美两国方面,AI+办公领域:美国巨头引领潮流,国内厂商奋起直追;AI+金融领域:美国发展较成熟,国内也已进入应用阶段;AI+医疗领域:国内由于数据制约渗透缓慢,美国数据优势明显,而且青睐研发环节。

另外,AI+文娱领域:美国发展遇阻,中国有望弯道超车;AI+教育领域:美国侧重辅助教师,中国侧重应试,各有千秋;AI+交通领域:中国具备交通应用优势,同时中美在智能驾驶方面处于竞争状态;AI+能源领域:中美两国渗透率均较低,处于探索时期。

对此,报告总结称,中美在AI大模型方向领先其他各国,然而双方的竞争也已经明牌,各方面表现各有胜负,其中以谷歌为代表的科技巨头长期投身于基础理论的研究,使得美国引领者人工智能的发展潮流,依托浓厚的工程师文化在基础大模型上保持领先优势。

在一级市场上,美国对AI大模型的投资也比较积极,其中以英伟达、微软等为代表的科技巨头成为最重要的「独角兽猎手」,通过大手笔投入为美国人工智能的发展积蓄了力量。然而,由于大模型对人才、资本和技术的制约,国内一级市场对相关项目的投资并不如美国火热,投资机搆出手较为谨慎,而且更倾向于利用龙头企业的开源模型来做应用落地的创业。

据不完全统计,2023年上半年,美国AIGC一级市场中,矽谷在人工智能领域共完成42起融资,总金额约140亿美元,占世界总融资金额的55%。其平均轮次融资金额为3.3亿美元,是平均融资水平的近13倍之多。同期,国内人工智能领域共发生161起投融资,较2022年同期减少153起,同比下降49%。另外,国内人工智能领域投融资交易事件涉及总金额61.74亿元,较2022年同期减少99亿元,同比下降62%。

另一方面,美国各个行业整体的信息化水平较高,积累了丰富的结搆化数据,这为美国的大模型落地打下了基础,尤其是在医疗研发等方向会继续保持着先发优势。相较而言,国内大模型一直扮演着追随者的角色,但在基础模型方面中美之间的差距并不大,「重应用轻基础」的研发理念以及国内庞大的下游需求,让国内机搆更加专注于落地应用的研究。

因此,在AI大模型的应用上,国内可以说更胜一筹。一方面,国内一级市场更多是关于大模型应用的创业项目;另一方面,各行业较成熟的企业均依托在各自行业的深耕,或外接基础模型,或利用开源模型自研模型来使所从事的行业用上AI大模型。不过,国内不少行业尚未完成信息化,基础数据的匮乏使得AI大模型在某些行业寸步难行。此外,算力制约成为中美AI竞争的一把利刃,努力冲破算力制约是AI发展路上的头等大事。

ChatGPT在全球范围内掀起的AIGC热潮,本质上是作为一种基于自然语言处理(Natural Language Processing,NLP)技术的大语言模型应用。随着人工智能深入发展,自然语言处理需求持续提升,市场规模及应用领域也在不断扩大,同时也将出现更多挑战。对此,自然语言处理学术的研究成果可以为产业技术方向提供选择,为企业技术创新方向提供指引。

2023年8月,集微咨询(JW Insights)隆重推出了《ChatGPT掀起AIGC新一轮热潮的背后:从学术角度分析自然语言处理技术》报告,对自然语言处理领域的全球顶级期刊学术论文在过去二十年发表的趋势、来源国家/地区、发表机搆、重要学者、资助机搆、出版刊物、热点主题等进行全方位分析,为业界提供该领域相应的学术研究成果解读。

报告显示,截至2023年4月底,全球发表的自然语言处理论文共有74992篇。在论文发表趋势上,全球自然语言处理论文发表量在2002年至2012年之间增长趋势较为平缓,但自2013年起开始出现较为迅猛的增长。2017年,生成式预训练模型Transformer的发表带动了自然语言处理行业学术研究的新一轮热潮,令论文发表量进一步直线上升。

从论文的整体区域分布来看,全球自然语言处理领域的学术研究成果主要集中在中国大陆和美国,论文数量均超1.8万篇,占据全球自然语言处理领域学术研究高地。尽管印度、德国、英国和日本等国也有较多的学术研究成果,但与中美两国相比差距显著。

至于发表论文的机搆,全球论文发表量排名前十的科研院所中,中、美、法等国的科研院所占据绝大多数。其中,中国科学院以1971篇论文的数量排名全球第一,远超第二名美国加州大学近50%,清华大学、北京大学也榜上有名。相比之下,美国除了传统高校之外,高科技企业对自然语言处理基础学术研究也高度重视,其中微软、IBM、谷歌等跨行业巨头均发表了相当数量的论文。因此,美国在该领域学术研究的这一特点在全球绝无仅有。

从对论文的基金资助来看,主要来源于各国政府层面,如中国自然科学基金、美国国家科学基金、欧盟委员会等。其中,中国自然科学基金会资助的论文量最高,为8335篇;美国的国家科学基金会、卫生与公众服务部、国立卫生研究院等机搆合计资助了6000余篇论文的发表。这显示出各国政府正在大力支持自然语言处理技术的基础研究。

此外,集微咨询(JW Insights)基于文献撰写质量、期刊水平、影响力、先进性等多个指标全方位计算学术论文的综合得分,从自然语言处理学术论文中筛选出实力最强的50篇论文,直观展示了这50篇论文的文章标题、国家/地区、所属机搆、研究领域、研究要点,为企业研发创新提供借鉴。

自然语言处理行业学术论文TOP5

分国家和地区来看,美国在自然语言处理领域的科研实力领先,TOP50中入选论文量达28篇,远超其他国家和地区,其中有8篇来自谷歌的研究;中国排名第二,但入选论文数量只有6篇;英国排名第三,仅有3篇论文上榜;其他国家则只有零星的高价值学术成果。对比美国,我国自然语言处理学术论文在撰写质量、影响力和先进性等方面有待进一步加强。

在5月28日举办的中关村论坛人工智能大模型发展分论坛上,由中国科学技术信息研究所、科技部新一代人工智能发展研究中心联合相关研究机搆编写的《中国人工智能大模型地图研究报告》正式发布。该报告借助大模型地图的可视化方式分析了中国大模型的发展特征,公布了国内大模型实力排行榜,同时也揭示了相关发展中尚存在的问题与不足等。

报告称,美国谷歌、OpenAI等机搆持续引领大模型技术前沿,同时中国、欧洲、俄罗斯、以色列、韩国等地越来越多国家也在投入大模型的研发。从全球已发布的大模型分布来看,中国和美国大幅领先,超过全球总数的80%,但美国在大模型数量方面始终居全球最高。

目前,在AI大模型领域,中国与美国保持同步增长态势,在自然语言处理、机器视觉和多模态等各技术分支上均在同步跟进、迅速发展,涌现出盘古、悟道、文心一言、通义千问、星火认知等一批具有行业影响力的预训练大模型,形成了紧跟世界前沿的大模型技术群。

此外,报告基于公开信息梳理分析了中国已发布的79个大模型分析结果显示,中国在14个省市/地区均有团队在开展大模型研发,其中北京、广东两地最多,地域集中度相对较高。从领域分布来看,自然语言处理仍是目前大模型研发最为活跃的重点领域,其次是多模态领域,在计算机视觉和智能语音等领域的大模型还较少。同时,国内大学、科研机搆、企业等不同创新主体都在积极参与大模型研发,但学术界与产业界之间的联合开发相对较少。

此外,报告通过调研全国范围内的算力基础设施分布情况发现,北京、广东、浙江、上海等地的大模型数量最多,而这四个地方也是近三年人工智能服务器采购数量最高的地区,表现出非常明显的强相关性,为大模型研发应用提供了重要支撑。同时,各地也在通过提供公共算力方式补充快速增长的人工智能算力需求,为大模型研发提供更多算力支撑。

进一步来看,作为国内最早以及专业性获业界认可的综合性测评基准,中文通用大模型基准(SuperCLUE)在上述报告推出后发布了大模型6月榜单。该榜单由四部分组成,即总排行榜、基础能力榜单、中文特性榜单、70亿参数量级榜单,分别从不同维度评价模型的能力,其中专业能力包括中学、大学与专业考试,涵盖从数学、物理、地理到社会科学等50多项能力。

业内分析称,从6月榜单上的测评结果来看,GPT-4的综合能力和单项能力都表现出色,在各榜单中都是独占鳌头,比第二名GPT-3.5-turbo要强不少;其次是GPT-3.5-turbo、Claude,二者评分旗鼓相当。而国内大模型都属于跟跑状态,各方面的表现还有待加强,在与美国的AI大模型竞赛中追赶步伐还得加快。值得注意,在SuperCLUE最新发布的11月榜单中,中美AI大模型的评测总分和单项能力方面的差距呈现一定程度扩大趋势。

2023年5月9日,英国《经济学人》杂志刊发专栏文章《中国在生成式AI上有多强?》,文章从论文数、系统数、算力和晶片硬体等几个基础层面的图表对比了中国两国的AI实力,并指出目前中国大模型落后于美国两到三年,原因在于两国在训练数据、晶片等硬体及科技人才上的距离,但未来两国可能终将拥有相媲美的AI能力。

文章称,过去几年,中国在某些衡量AI实力的指标上领先于美国。2021年,全球26%的AI论文来自中国,而来自美国的占比只有17%。按AI论文发表量计算,全球排名前十的机搆中有九个在中国。根据一个常用的基准,计算机视觉领域排名前五的实验室也都在中国。

中美AI相关指标的对比

但在「基础模型」这种赋予生成式AI智慧的领域,美国的优势明显,例如ChatGPT及其背后先进的模型是由美国创业公司OpenAI研发。同时其他美国公司也有自己强大的系统,既有Anthropic或StabilityAI等小公司,也有谷歌、Meta和微软等科技巨头。虽然文心一言作为百度打造对标ChatGPT的产品,但业界普遍认为它还达不到ChatGPT的智能程度。

中国、美国、欧洲的机器学习系统的数量对比

因此,业内人士得出了这一结论:中国在建立基础模型方面比美国落后两到三年。而造成这一差距的原因有三个:第一个原因涉及数据。根据互联网研究网站W3Techs的数据,全球56%的网站是英文内容,而只有1.5%的网站是中文,这有利于美国的建模者。史丹佛大学博士傅亦沁指出,中国人主要是通过微信和微博等App上网互动,其中大部分内容都没有在搜索引擎上建立索引,这让AI模型在训练时难以吸收这些内容。

第二个原因与硬体有关。2022年,美国对一些AI领域的关键技术实施了面向中国的出口管制,其中包括云计算数据中心所用的微处理器,以及可以让中国自行制造此类半导体的晶片制造工具,这打击了中国的大模型研发。英国智库AI治理中心分析了26个中国大模型后发现,超过一半模型的晶片都要依赖美国晶片公司英伟达。而中国最大的晶片制造商只能大规模生产台积电在三四年前量产的晶片。

第三个原因是中国AI公司难以从美国引入的东西是人才。目前,美国对全球科技人才仍然极具吸引力:在期刊上发布论文的美国AI专家中有三分之二在国外出生,其中华裔工程师占到这个顶尖群体的约四分之一。许多中国的AI研究人员曾在美国学习或工作,然后带着专业知识回国,但中美关系紧张加剧等因素导致这一群体的人数下降。

《经济学人》认为,尽管这些因素对中国AI发展造成了障碍,但是否会在更长时间内阻碍中国的AI雄心则是另一回事。当前,中国政府已经为建模机搆提供了大量数据集,并表示希望拆除中国App的「围墙」以释放出更多数据。同时,中国在硬体方面也在寻找变通办法,并且可以用开源模型让缺乏晶片和人才的问题得到一定程度缓解。

因此,中美两国可能最终将拥有相媲美的AI能力,即使中国在这一过程中会因为美国的制裁而付出额外代价。但如果双方大模型的竞争势均力敌,那么美国的另一个优势有可能让它成为AI大赢家,那就是它有能力在经济体系中广泛应用其尖端科技。

2023年10月12日,中国社会科学院社会学研究所经济与科技社会学研究室官方公众号「社计文库」刊发了由牛津互联网学院互联网社会科学硕士艾米·海恩(Emmie Hine)和牛津互联网学院信息哲学和伦理学教授、牛津互联网研究所数字伦理实验室主任卢恰诺·弗洛里迪(Luciano Floridi)日前联合撰写的《中美人工智能政策对比分析》一文。

该文以定量和定性结合方法分析了美国和中国的人工智能发展政策,在梳理两国政策形成脉络的同时重点分析了两国政策制定背后的技术理念、历史文化传统差异,从更深层次的维度剖析大国科技竞争背景下的人工智能政策差异,填补了中美人工智能政策比较的内容空白。

艾米·海恩与卢恰诺·弗洛里迪

文章提及,在政策评估方面,拜登政府的立法和面向社会的施政举措融合了欧巴马政府对打造多样性的努力和川普政府对美国领导力的关注。一是在拜登政府对良好的人工智能社会的愿景中,政府将继续强调研发中的自由市场原则,但同时也会采取措施重塑该行业。二是美国明确的将中国视为竞争对手,在强调多样性和注重道德可信度定义的同时推动多边倡议,拜登政府将人工智能的受益者重新定义为所有美国人和美国的盟友,但不包括中国。

目前,中国的中央和地方规划仍然优先考虑人工智能技术的实际运用而非技术的基础性研究。根据《发展规划》,实现全球领先的人工智能发展是中国的首要目标,包括2025年前后实现重大技术突破、制定相关法规,2030前后年开发出世界领先的人工智能并成为「世界主要人工智能创新中心」。为了实现这些目标,中国的中央政府正联合地方政府和私营部门一道共同推进,大量的具体举措在试图维护社会稳定的同时,也在鼓励创新和技术进步。

总体而言,美国的人工智能战略愿景在近三届政府期间发生了重大转变。如今,在拜登政府的领导下,美国采取了一种更加亲力亲为(即使仍以市场为导向)的方式,强调美国的领导力和创新力的价值,以及加强与盟友的密切合作。在个体维度的新教职业道德的驱动下,这是一种更广泛的技术崇高愿景,其中也包括与中国的全球合作和竞争。

相比之下,中国的人工智能发展外部愿景包括获得全球领导力,以及基于基本人类价值观的合作。另外,在内部愿景方面,儒家思想仍深刻影响着中国对于「良好人工智能社会」的规划与实践。因此,中国的文化传统和当前政治体制驱使中国试图找到一种能够兼顾人工智能创新与维护社会稳定的发展模式。

文章进一步称,虽然中国与美国的这两种发展理念都不是仅为了应对国际技术竞争而形成,但两国的愿景并非水火不容,其中新教伦理更强调个人,儒家更强调社会,两者都是为了社会大众的利益。然而,无论是国内冲突还是国际冲突都不利于实现这一目标,国际合作仍然是实现「良好人工智能社会」的唯一选择。

各国政府应该超越竞争性地缘政治动态的传统观念,采取多元主义的价值立场,在承认存在多种治理方法与模式的基础上开展有效对话,为一个良好的全球人工智能社会勾勒出共同价值观的具体标准。尽管中美两国的竞争态势使得这一愿景在当下难以实现,但如果双方能够互相审视和理解各自的观点,那么在两个大国的和谐合作下,人工智能就有可能成为人类整体项目的一部分——一个「良好的全球人工智能社会」愿景将会实现。