全国政协委员张云泉接受环球时报专访:“主权级大模型”需要国家整合资源研发

来源:环球时报

【环球时报报道 记者 赵觉珵】人工智能(AI)大模型的发展日新月异。这一飞速发展、竞争激烈的领域成为今年两会不少代表委员的关注点,其中全国政协委员、长期从事超级计算机研发与建设工作的中国科学院计算技术研究所研究员张云泉将提案聚焦在如何解决大模型算力瓶颈问题上。张云泉在接受《环球时报》记者专访时表示,当前国内面临大模型训练用国产高端AI芯片供应不足等问题,应该由国家主导、整合优质科研和产业资源,尽快训练出我国的“主权级”大模型。

在其提交的提案中,张云泉将大模型描述为“实现新质智能生产力的重要手段”。他提到,人工智能带来的效果在现代就像是“核武器”一样,如果前十年的人工智能技术就像是“原子弹”为各行各业赋能,大模型技术就像是“氢弹”,将会深刻改变世界思考问题的方式;而芯片就像是“导弹”,有了“导弹”才能投射“原子弹、氢弹”,发挥“实战”效果。包括Meta公司、软银集团、研发GPT的OpenAI等公司都在大模型领域持续发力,其中一些公司计划自研AI芯片。而在美国封锁之下,能够用于大模型训练的国产智能算力芯片的创新和供应显著落后,国产多模态大模型的训练受到美国制裁的影响。

张云泉说,国内领先的AI芯片厂商因半导体工艺受限或进入美国实体清单的原因,难以使用最新工艺量产所设计的国产芯片,导致大模型训练用国产高端AI芯片供应不足,生态建设严重落后,我们有算法、有数据但没有合适的算力支撑,大模型这样的“氢弹”也不能真正发挥出作用。他还认为,当前国产AI芯片公司缺乏顶层设计,各自为战,无法形成合力,延误了能够替代英伟达高端训练GPU的国产AI芯片的尽快推出。此外,大模型落地所需要的配套软件、服务生态及市场也缺乏投资、引导与建设。

近日,当前大模型训练用GPU的主要供应商英伟达提出“主权AI”的概念,并将其定义为“一个国家利用自己的基础设施、数据、劳动力和商业网络生产AI的能力”。受“主权AI”概念启发,张云泉提出要重视“主权级大模型”的开发。他向《环球时报》记者解释称,“主权级大模型”是一个动态概念,它应该是某一时期内最高水平的大模型。这一大模型算力要求最高、智能水平最高,是一个国家AI水平的最高点、基础大模型的基础,也可以被形容为“根模型”。

张云泉认为,“主权级大模型”将深刻影响一个国家的科技竞争力,涉及军事、经济、政治等多方面能力。“没有‘主权级大模型’,就像是国家没有了国防重器,国家就会被打压,国家安全也会受到威胁”,张云泉强调,因此必须尽快研制处于国际领先水平的“主权级大模型”,以维护未来的国家安全。

在国产AI芯片研发制造仍需时日的情况下,作为超算领域的“老兵”,张云泉建议利用我国在超算研发建设中的丰富积累,设立能够支持“主权级”多模态大模型训练的专用超算攻关专项,快速缓解国产“主权基础大模型”训练的算力瓶颈。

张云泉告诉《环球时报》记者,目前大模型使用的GPU最早就是来自超算界。但它在超算上的使用效率不高,却在深度学习和大模型找到了最佳应用点。大模型训练用到的很多技术,如大规模并行技术、高速网络技术、可靠性技术、绿色功耗技术、液冷技术等,中国超算科研人员都已有很成熟的积累,并有较高水平。

在解决AI芯片“卡脖子”的基础性问题上,张云泉则建议,集中全国AI芯片研制力量,组建由业内权威专家和各主要AI芯片厂家参加的智能算力发展专项组,通过多轮竞争,确定最优的训练芯片研发技术路线和国家标准,择优集中投入资金和优秀人才资源,整合芯片产能,尽快研制出能够满足国产主权基础大模型训练的十万卡、百万卡甚至千万卡并行算力需求的AI芯片和系统。

“我之所以认为必须要由国家‘出手’,‘集中力量办大事’,是因为国内一些企业往往倾向于使用国外的开源大模型,还经常出现低水平重复与‘内卷’,延误了‘主权级大模型’的研发”,张云泉认为,无论是专用超算攻关专项还是AI芯片攻关专项,都需要国家出面协调资源,统一协调国内优质科研产业资源,以取得快速突破,在智能领域的“核武器”时代占领先机。“留给我们的时间窗口并不长,不能错失良机。”