陆AI大模型猛增 数量直超美

中国科学技术信息研究所、科技部新一代人工智能发展研究中心在28日发表「中国人工智能大模型地图研究报告」,该报告指出,初步统计中国10亿级参数规模以上大模型已发表79个,紧追美国的100个,中美远超其余各国总量(22个)。

数量上,大模型出现明显中美竞争型态,2019~2023年期间,中国每年发表大模型数量为0、2、30、28、19个,美国则是4、11、30、37、18个,中国在今年至今大模型增加数首超美国。

地域方面,北京、广东、浙江、上海是中国大模型数量最多的省市,北京多达38个、广东有20个。上述四地是近三年AI伺服器采购数量最高的地区,也是大模型人才较多的地区。此外,北广上三地的开源数量与影响力在大陆居首,相关论文发表量与引用量也最多。

从领域看,自然语言处理是中国大模型研发最热络的领域,其次是多模态领域,机器视觉与智慧语音等大模型较少。报告指出,目前中国有两种路线并行发展,有文心一言等通用大模式,也有针对生物制药、气象等垂直领域专业大模型问世。

大模型影响力上,清华ChatGLM-6B、复旦大学MOSS、百度文心一言是模型开源影响力前三;清华、阿里和百度联合开发的CogView,以及华为FILIP、百度ERNIE3.0、阿里M6-OFA则是论文引用数最多的模型。

报告建议,中国大模型要推进共享统筹资源,鼓励开源开放等。但中国也有发展隐忧,如各地大模型人才数量均不充足。