☰

“中国BAT” 大战 “美国OMG”

不止百模大战，也是中美争锋。

来源 | AI黑马

作者 | 张沉浮

早在2017年，国家就出台了新一代人工智能发展规划，明确将人工智能列为国家战略。今年4月28号，中央政治局会议更是重点提及要重视通用人工智能的发展，营造创新生态。7月13日，《生成式人工智能服务管理暂行办法》公布，鼓励技术在各行业和各领域的创新应用。

人工智能三大要素，算力、算法和数据。其中，中国两国在算力方面差距不大，按2022年年底的数据，美国占全球算力36%，中国占31%。

不可否认的是，中美在AGI和AIGC上还是存在差距的。

大模型的基础是深度学习框架，美国的Tensorflow和PyTorch已经深耕深度学习框架生态多年，虽然国内企业也自主开发了深度学习框架，但市场考验还不够，生态还有待打造。

邬贺铨院士认为：“在中国从事AI研究的技术人员不算少，但具有架构设计能力和AIGC数据训练提示师水平的人才仍然短缺。在ChatGPT出现之前，有人认为中国在AI方面的论文与专利数与美国不相上下，ChatGPT的上线使我们看到了在AIGC上中美的差距，现在是需要清楚认识和重视我们面对的挑战，做实实在在的创新。”

现在许多公司和研究机构都处在“百模大战”之中，不论初创公司还是大公司，充分竞争的市场才是好市场，充分竞争的公司才是好公司。

张亚勤院士认为：“大模型时代才刚刚开始，42公里的马拉松我们刚跑到5公里，算力、数据不够都不成问题。中国在PC时代落后于美国，但在移动互联时代领先于美国（数字支付、微信、短视频），AI时代要给创业者、科研人员、企业更多信心。”

一些产业从业人士指出，在AI大模型上中美争锋，主要是“OMG”和“BAT”的战斗。

我们依次看一下这六家企业：OpenAI、Meta、Google、百度、阿里、腾讯。

1）Open AI

2022年11月30日，OpenAI发布ChatGPT。作为ChatGPT的母公司，Open AI引领着AI大模型的发展。2016年微软投资了OpenAI十亿美金。2020年推出的 GPT-3 ，有1750亿参数，是大模型的技术。2022年推出的 ChatGPT 是基于大模型的产品形态。2023年微软继续投入100亿美金，OpenAI+微软已成为最具影响力的AI力量。

2）Meta

Facebook先是押注元宇宙，如今又入局AI大模型。扎克伯格是蹭热点，还是全面发力?过去Facebook的使命是“Make the world more open and connected”，这个话也是非常具有互联网时代特色的，就是开放、连接。如今，扎克伯格已然意识到这个东西不够了，他说我们要“Bring the world closer together”，怎么才能“closer together”呢？还是要通过用户画像、通过人工智能的技术，找到人和人之间相同的兴趣，把他们连接在一起。MetaAI发布了开源大模型LLaMA，可以在单个GPU上运行。

3）Google

2023年5月10日，谷歌在两个小时的大会里提及“AI”200多次，并一口气推出了AI大模型PaLM2、AI机器人Bard、AI搜索、AI办公等多款模型和产品，一套完整的AI系统全面嵌入谷歌旗下超过25个产品和应用。

图注：谷歌搜索将在产品搜索页面同时展示其产品描述、评论、价格和展示图等信息。

4）百度

2023年3月16日，百度在中国率先发布文心大模型。据了解，百度是中国最早布局大模型的公司，于2019年就开始了预训练模型 Ernie1.0。目前，文心大模型家族已形成文心大模型+工具与平台+产品与社区的庞大大家族。

除了依托百度搜索的海量数据优势，百度在AI大模型领域的“四层模式”（芯片层+框架层+模型层+应用层）才是其在“百模大战”中的核心竞争力。百度之所以能够在Google、Meta、阿里、腾讯等大厂之前先做出来“文心一言”，就是因为这四层的全栈布局。

百度在芯片层的布局是昆仑芯，已经量产几万片。昆仑芯第三代，预计2024年初量产。飞桨属于框架层，文心属于模型层。

5）阿里

2023年，4月11日，阿里发布大模型。张勇表示，阿里巴巴所有产品未来将接入“通义千问”大模型，进行全面改造，包括天猫、钉钉、高德地图、淘宝、优酷、盒马、饿了么等。他认为，面向AI时代，所有产品都值得用大模型重新升级。

阿里云也面向企业提供普惠的AI基础设施和大模型能力。未来每一个企业都可以通过阿里云调用通义千问的全部能力，也可以结合企业自己的行业知识和应用场景，训练自己的企业大模型。比如，每个企业都可以有自己的智能客服、智能导购、智能语音助手、文案助手、AI设计师、自动驾驶模型等。

图注：钉钉会议能够随时生成会议记录并自动总结会议纪要、生成待办事项。

6）腾讯

直到2023年6月19日，腾讯才姗姗来迟地开了场发布会。腾讯对外公布行业大模型研发进展，宣布将助力企业构建专属大模型及智能应用，为企业提供MaaS一站式服务。

据了解，腾讯将为文旅、政务、金融等10余个行业，提供超过50个大模型行业解决方案。比如，基于腾讯云智能媒体AI中台，为央视打造人工智能开放平台，提供智能标签、修复、智能翻译等30多种算法。为上海大学，利用腾讯云教育行业大模型能力，构建专属的教育行业大模型基础平台，覆盖在校生和毕业生全生命周期业务，将提供教学助手、人才培养、招生就业助手和作业批改等服务；此外，腾讯企点、腾讯会议、AI代码助手等多款头部SaaS产品，也迎来了能力升级。

我们认为，中国大模型战队中除了BAT，还应该重点关注四家企业和机构，360、华为、智源和智谱。

百度、阿里、腾讯、360、华为、智源、智谱，就好比是中国AI大模型的“战国七雄”。

7）360

2023年6月13日，360集团对外发布了360智脑大模型。360关于大模型的战略是八个字：“两翼齐飞、四路并发”。

“两翼齐飞”，一方面要发展大模型的技术，另一方面要场景化、产品化、平民化、垂直化。只是模仿ChatGPT，做了一个搜索对话框，做了一个聊天机器人，指望这个东西带来工业革命是不现实的。场景分为四路：一是To C的场景，搜索引擎+浏览器和桌面。二是面向中小企业。三是面向政府、大型企业。四是面向行业的GPT，跟有行业数据的合作伙伴相结合。

8）华为

2023年7月7日，华为发布盘古大模型3.0.“不作诗、只做事”、“AI 重塑千行百业”、“AI for Industries ”华为的盘古大模型聚焦行业价值场景，围绕行业重塑、技术扎根、开放同飞三大方向，为行业客户提供服务。

盘古大模型3.0是一个完全面向行业的大模型系列，包括5+N+X三层架构。

华为从2019年到2021年之间就开始立项做盘古大模型。2021年发布了盘古NLP大模型、盘古机器视觉大模型、盘古科学计算大模型、盘古药物分子大模型。到2022年在行业中拓展应用，发布了盘古矿山大模型、盘古气象大模型、盘古海浪大模型、盘古金融OCR大模型。2023年7月7日发布的盘古大模型3.0，重点提及了5个基础大模型（自然语言、多模态、视觉、预测、科学计算）和7个行业大模型（政务、金融、制造、药物分子、矿山、铁路、气象）。

9）智源

2023年6月9日，智源研究院院发布了全面开源的“悟道3.0”系列大模型及算法。继 2021 年悟道大模型项目（悟道1.0于2021年3月发布）连创“中国首个+世界最大”纪录之后，智源 “悟道3.0 ”进入全面开源新阶段，带来一系列领先成果：“悟道·天鹰”（Aquila）语言大模型系列、天秤（FlagEval）开源大模型评测体系与开放平台，“悟道 · 视界”视觉大模型系列，以及一系列多模态模型成果。

10）智谱

2023年3月，基于千亿基座模型的ChatGLM开启内测。智谱AI由清华大学计算机系的技术成果转化而来，致力于打造新一代认知智能通用模型，提出了Model as a Service（MaaS）的市场理念。公司于2021年合作研发了双语千亿级超大规模预训练模型GLM-130B，并主导构建了高精度通用知识图谱，把两者有机融合为数据与知识双轮驱动的认知引擎，并基于此千亿基座模型打造ChatGLM。此外，智谱AI也推出了认知大模型平台Bigmodel.ai，形成AIGC产品矩阵。通过认知大模型链接物理世界的亿级用户、赋能元宇宙数字人、成为具身机器人的基座，赋予机器像人一样“思考”的能力。

最后，我们回看几个问题。

1、中国为什么一定要自研AI大模型？

基于战略安全角度和经济商业价值，都能得出中国一定要自研AI大模型这一确切答案。从中美贸易战到芯片卡脖子等，中国政府必然要保证关键技术的自主可控和国家安全。并且OpenAI和微软的实践也表明了，AI大模型将有巨大的商业价值，中国企业需要抓住这一机遇。

李开复也认为，“使用海外的开源大模型就可以做出中国版的OpenAI”的说法是绝对错误的，技术的天花板将决定你永远做不出达到或超越GPT-4.0技术水平的大模型。此外，拿海外训练出来的大模型，在国内做微调是值得商榷的。因为国内外的文化习惯、法律法规不同，所以自主创新做大模型是中国企业的必经之路。

2、中国AI大模型产品何时能赶上“ChatGPT”?

李彦宏曾公开表示，文心一言与ChatGPT版本差距并不明显，可能只相差一两个月的时间。对于这种说法，王小川则调侃称，媒体采访的可能是平行世界的李彦宏。

王小川认为国内目前的大模型和ChatGPT的差距不可能只是两个月。“如果在追上目前ChatGPT-3.5的水平，大概今年内就能做到，但如果要追上未来的GPT-4和GPT-5，预计要3年左右的时间。”

艾瑞咨询认为，与ChatGPT功能对标的大语言模型(Large Language Models, LLMs)，目前国外主要有Google推出的Gopher、LaMDA以及Meta的Llama等；国内为百度首发的“文心一言”、360发布的大语言模型、阿里发布的“通义千问”、商汤发布的 “商量”等。虽从对话和文本生成的直观体验看ChatGPT略胜一筹，但对于Google等国外大厂而言，克隆ChatGPT并不存在太高壁垒，当前暂时落后主要是出于公司战略与技术理念差异，选择了不同技术路线，随着各家探索成果和新技术方法的实践不断推进，仍存在对GPT系列模型赶超的可能。对百度等国内大厂而言，则在数据、算力、工程化能力等关键要素上存在短板，短期内难以对国外领先大模型实现赶超，为跟随者角色，长期更需要国内AI全产业链整体进化。

3、AI大模型的竞争关键和创新机会在哪？

1）通过OMG可以看到：ChatGPT在逻辑推理、上下文理解等方面的能力，是模型参数量达到该量级后“涌现”出的，即所谓的“大力出奇迹”。在此之前，坚定的科研初心，丰厚的资本支持，是中国科技企业需要向美国科技企业认真学习的。

2）通过百度可以看到：“基础层+模型层+应用层”，底层技术的积累至关重要。无论是芯片层的昆仑还是框架层的飞桨，“根技术”的深厚决定枝叶的生长速度。

3）通过阿里可以看到：“互联网时代的产品都值得用AI重新升级”。阿里是这么说的，也是这么做的。必然有后浪高举AI原生的旗帜，颠覆马云的互联网思维。

4）通过腾讯和华为可以看到。无论是云服务还是大模型，竞争的核心和商业的重点，都指向行业ToB服务，AI大模型要更有行业价值，也要“离钱更近一点”。

5）通过360可以看到，数字人是大模型重要的应用入口，大模型的发展要和国家的产业数字化战略相结合，企业级垂直大模型更为关键。把大模型拉下神坛，变成每个企业、政府部门都感觉能够直接使用的东西。

4、中小企业该如何面对AI大模型？

李开复说：

我们完全可以想象今天的Word、PowerPoint、Excel、Photoshop等应用通通都会用AI大模型重写一次，而且重写之后它的用户体验会变，甚至商业模式也会变。

李彦宏说：

业界有一种说法，大模型时代来了，每一个产品都值得重做一遍。但谁真正重新做了一遍呢？百度要做第一个把全部产品重做一遍的公司，不是整合，不是接入，是重做，重构！

也有企业保持理性：

折腾是找死！不折腾是等死！

大模型更像是巨头的游戏和军备竞赛，它和芯片、语料息息相关，如果没有巨量的资金储备，很难真正做大模型；非巨头还是要理性看待大模型。

大模型是基础建设，行业模型与应用场景等将拥有更大的发展机会？

创业黑马近期举办了两期AIGC产业营，参与者大多都是中小企业，300家。

通过其数据可以发现：25%的企业已经开始探索和应用AIGC，传统产业的企业期望利用AIGC转型升级，300家企业分布在企服、消费、培训、文娱、营销等各个行业领域。

但无论如何，中小企业不得不去思考：

有没有能力做AI大模型或行业模型？

自己的行业会不会出现新的AI产品？

新的AI产品会不会颠覆自己？

自己有没有能力做出那个AI产品？

自己原有产品如何基于AI新技术进行迭代创新？

自己基于大模型做微调做应用层创新？

基于国内外的哪个大模型做应用研发和产品创新？

不考虑大模型，直接用AIGC的产品或工具，简单粗暴降本增效？

最后，还有一点值得大家注意：

“十年前的传统观点认为，人工智能首先会影响体力劳动，然后是认知劳动，再然后，也许有一天可以做创造性工作。现在看起来，它会以相反的顺序进行。”

高科技投机机构ARK Invest预测，以AIGC为代表的新一代人工智能技术将辅助知识工作者（包括教师、律师、医生、财务、程序员等白领职业）提高工作效率。报告预测，到 2030 年，AI 将大幅提高知识工作者的工作效率，平均工作效率增加140%，新一代人工智能技术将有可能大幅度降低脑力劳动者的工作强度。如果这一切成为现实，或将是继人类历史上由于动力革命而摆脱繁重的体力劳动之后，人类社会发生的又一次伟大的技术革命。

上面引号里那句话，是ChatGPT创始人，山姆·阿尔特曼，说的。

他还说过一个观点：

“没必要担心被AI取代，人类和机器终将融为一体。”

“中国BAT” 大战 “美国OMG”

相关资讯