☰

工信部主导首次大模型标准评测仅360、百度、腾讯、阿里过关

大陆首次官方「大模型标准符合性评测」23日公布结果，首批仅百度、腾讯、阿里和360集团等4家通过。图／美联社

大陆首次官方「大模型标准符合性评测」23日公布结果，首批仅百度、腾讯、阿里和360集团等4家通过。

新浪财经报导，这项测试由大陆工信部中国电子技术标准化研究院发起，吸收覆盖大模型产业全链路数十家头部单位意见，重点完成大语言模型理解、生成、逻辑等核心能力的38项具体评测维度，以充分检验大陆大模型标准符合性水准，引领人工智慧产业健康有序发展。

首批通过测试的四家企业，除了网路三巨头BAT之外，还有网安大厂360。这四家投入AI大模型起步早，同时技术和大数据等资源丰富，成为胜出的关键。

其中，百度是大陆AI领域标准的主导力量，多次参与国家人工智慧技术标准体系设计和讨论，也是标准核心贡献单位之一，起草人工智慧预训练大模型系列国家标准。百度今年3月发表「文心一言」大模型，并在8月31日开放全球用户使用。目前，百度文心大模型日均调用量达数千万次，每月服务企业超过1万家。

本次通过评测的首批大模型中，阿里「通义千问」是唯一的开源模型，其性能表现及安全性得到了大范围的公开检验。12月1日开源后，通义千问72B在10个权威基准评测中创下开源模型最优成绩，并力压Llama2登顶海外最具权威性的HuggingFace排行榜，为业界公认性能超强开源大模型。

腾讯混元大模型也率先这次测试。此外，腾讯云还以提案牵头方身份启动「人工智慧模型即服务（MaaS）功能要求」的讨论与编制，推动MaaS领域标准化。

360是大陆较早布局人工智慧大模型的企业，自研千亿规模通用大模型「360智脑」核心能力位居大陆第一梯队，并凭借360在安全领域的积累和优势，成为大陆首个原生安全的大模型。

工信部主导首次大模型标准评测 仅360、百度、腾讯、阿里过关