xAI建造全球最大AI超級電腦Colossus 藉由NVIDIA的乙太網路技術加速

NVIDIA宣布,xAI在美国田纳西州孟菲斯市使用NVIDIA Spectrum-X乙太网路平台,打造搭载10万个NVIDIA Hopper Tensor核心GPU构成的Colossus (以漫威漫画中的「钢人」为称)超级电脑丛集。

Colossus是全球最大的人工智慧超级电脑,用于训练xAI的Grok系列大型语言模型,并且为「X」Premium用户提供聊天机器人功能。xAI正在将Colossus的规模扩大一倍,总计将搭载20万个NVIDIA Hopper GPU。

xAI与NVIDIA在短短122天内就建置出相关配套设施与最先进的超级电脑Colossus,此规模系统通常要用到几个月到几年的时间建置。而从安装第一个机架到开始训练人工智慧,前后仅历时19天。

Colossus超级电脑在训练规模极为庞大的Grok模型时,在所有三层网路结构中,系统都未因流量碰撞而出现应用程式延迟或封包遗失的情况,并且透过Spectrum-X壅塞控制功能,确保高达95%的资料输送量。

相较之下,标准乙太网路可能会造成上千次的流量碰撞,多半只能提供60%的资料输送量。

NVIDIA网路事业部资深副总裁Gilad Shainer表示:「AI正成为关键业务,需要更高的效能、安全性、扩充能力和成本效益。设计NVIDIA Spectrum-X乙太网路平台的目的,就是要为xAI这一类创新公司能够更快速处理、分析和执行AI工作负载,以加速开发、部署 AI 解决方案,并且更快推向市场。」

Elon Musk在X上表示:「Colossus是世界上最强大的训练系统。xAI团队、NVIDIA及我们的众多合作伙伴与供应商表现非常出色。」

xAI的发言人表示:「xAI建造出世界上最大、最强大的超级电脑。NVIDIA的Hopper GPU加上Spectrum-X让我们能够突破大规模训练AI模型的界限,并在乙太网路标准基础上,建造一个拥有超级加速、并最佳化的AI工厂。」

《原文刊登于合作媒体mashdigi,联合新闻网获授权转载。》