工信部主导首次大模型标准评测 仅360、百度、腾讯、阿里过关

大陆首次官方「大模型标准符合性评测」23日公布结果,首批仅百度、腾讯、阿里和360集团等4家通过。图/美联社

大陆首次官方「大模型标准符合性评测」23日公布结果,首批仅百度、腾讯、阿里和360集团等4家通过。

新浪财经报导,这项测试由大陆工信部中国电子技术标准化研究院发起,吸收覆盖大模型产业全链路数十家头部单位意见,重点完成大语言模型理解、生成、逻辑等核心能力的38项具体评测维度,以充分检验大陆大模型标准符合性水准,引领人工智慧产业健康有序发展。

首批通过测试的四家企业,除了网路三巨头BAT之外,还有网安大厂360。这四家投入AI大模型起步早,同时技术和大数据等资源丰富,成为胜出的关键。

其中,百度是大陆AI领域标准的主导力量,多次参与国家人工智慧技术标准体系设计和讨论,也是标准核心贡献单位之一,起草人工智慧预训练大模型系列国家标准。百度今年3月发表「文心一言」大模型,并在8月31日开放全球用户使用。目前,百度文心大模型日均调用量达数千万次,每月服务企业超过1万家。

本次通过评测的首批大模型中,阿里「通义千问」是唯一的开源模型,其性能表现及安全性得到了大范围的公开检验。12月1日开源后,通义千问72B在10个权威基准评测中创下开源模型最优成绩,并力压Llama2登顶海外最具权威性的HuggingFace排行榜,为业界公认性能超强开源大模型。

腾讯混元大模型也率先这次测试。此外,腾讯云还以提案牵头方身份启动「人工智慧模型即服务(MaaS)功能要求」的讨论与编制,推动MaaS领域标准化。

360是大陆较早布局人工智慧大模型的企业,自研千亿规模通用大模型「360智脑」核心能力位居大陆第一梯队,并凭借360在安全领域的积累和优势,成为大陆首个原生安全的大模型。