日开发“富岳”后续机型应对AI浪潮

参考消息网8月31日报道 据《日本经济新闻》8月27日报道,超级计算机“富岳”后续机型的开发将于2025年启动。日本文部科学省的目标是,在应用于人工智能(AI)的计算性能方面实现世界首个“泽塔级”(1泽塔是1兆的10亿倍)。此举旨在应对这一新潮流:将AI和超级计算机相组合,应用于科学研究和工业领域。开发费用总额尚未确定,国家预计将投入超过1100亿日元(约合7.565亿美元)经费。

日本理化学研究所是“富岳”后续机型的主要开发者,与之推进联合研发的主要企业名单将在2025年3月之前确定。除曾参与开发“富岳”的富士通外,有力的候选企业还包括美国超威半导体公司(AMD)、英伟达公司和英特尔公司等。根据计划,2025年度内将确定基本设计,2026年度内进行详细设计,力争在2030年前后启动运用。

实现具有高AI性能的超级计算机,对于推动日本科学研究取得进展而言是不可或缺的。已有机构开始将AI用于科学假说的高度化生成和模拟,以加速推进科学研究。

研发目标是,在使用超级计算机进行传统模拟和AI两个领域的计算上,“富岳”后续机型都达到世界最高性能。

超级计算机的发展在全球范围内正迎来转折点。这是因为AI的重要性日益提升,而超级计算机本身计算速度的提升则有所放缓。

超级计算机性能日益多样化,一律按计算速度排名进行比较越来越难。衡量性能的新指标也陆续出现。

从20世纪90年代前半期开始,美国研究者发布了计算一次方程求解速度的排名,测量以高准确度显示小数点以后数字等的计算速度。这就像田径比赛100米纪录一样清晰,一直以来作为性能指标受到重视。

理化学研究所开发的“京”和“富岳”,均曾在超级计算机排名中位列第一。自排行榜公布以来,超级计算机性能有了飞跃式提升。筑波大学计算科学研究中心主任朴泰佑回忆道:“高精度计算速度大约在10年间提高了数百倍。”提升的原动力是计算设备高速化。

20世纪90年代,将多个负责计算的中央处理器(CPU)集成在一个芯片上的技术出现。21世纪00年代后半期,出现了利用图形处理器(GPU)加快计算速度的超级计算机。电路线宽也从21世纪10年代前期的10纳米以上缩小至约4纳米,集成化取得进展。

就像花了100年时间将世界纪录缩短约1秒的百米赛跑那样,超级计算机的性能也实现了高速化,但速度升级步伐有所放缓。之所以出现这一动向,主要源自以下两个原因。

首先,计算设备升级速度变慢。英伟达2017年推出专门用于特定种类计算的GPU等,技术革新持续进行,但电路精密化和集成化迎来极限。

朴泰佑指出:“目前找不到突破摩尔定律(半导体元件数量每两年翻一倍)极限的技术。”从10年间的提速幅度来看,2000年至2010年计算速度提升了700倍以上,2010年至2020年计算速度提升了200倍以上。

其次,超级计算机的用途发生变化。东京工业大学教授横田理央表示:“在制药和防灾方面运用AI或制作大规模生成式AI的情况,从本世纪10年代后半期开始增加。”

AI抗计算噪声能力强,即使不详细显示小数点以后的数字等也能继续运转。例如,用生成式AI写文章时,参考学过的文章中单词的排列模式,灵活地将单词连接起来,不需要进行高精度计算。

超级计算机性能或将朝多样化方向发展,无法仅凭单一指标决定优劣。超级计算机须兼具不同性能,就像一个人可以完成游泳、自行车和长跑的铁人三项那样。

最有力的指标之一是,构建可以生成复杂文章、绘画和音乐作品等的生成式AI的性能。

另一有力的指标是HPL-MxP,指混合精度计算下的性能。具体而言,根据在AI等方面的用途,简化小数点以后的数字计算等,节约计算资源以提高计算速度。

横田教授指出:“今后很可能出现新指标。”

虽然新的性能指标还有待确立,但包括“富岳”后续机型在内,超级计算机和AI的一体化将继续推进。(编译/马晓云)