微软 Azure 推出全球首个定制英伟达机架

Nvidia 的 Blackwell 处理器 如今是最受欢迎的数据中心硬件之一,因为各公司正在努力用数量越来越多的参数训练大型语言模型 (LLM) 。据传,微软是首家获得 Blackwell 服务器的公司,但这属于非官方消息。今天,该公司表示,它不仅获得了 Nvidia Blackwell 部件,而且已经启动并运行。

因此,微软 Azure 至少有一个基于 GB200 的服务器机架,其中 B200 处理器的数量未知,估计约为 32 个。它使用了高度复杂的液冷系统。这台机器不是英伟达的 NVL72 GB200,据报道,微软更喜欢这种,而不是密度较低的变体。这个特定的机架可能会用于测试目的(包括英伟达 Blackwell GPU 和液冷系统),而且在未来几个月,微软将为商业工作负载部署基于 Blackwell 的服务器。

预计配备 72 个 B200 图形处理器的 NVL72 GB200 机器将消耗并散发约 120 千瓦的功率,这使得此类机器不得不采用液冷。因此,微软在部署基于布莱克威尔的机柜之前,测试其自身的液冷解决方案,这是个好主意。

就 FP8/INT8 性能而言(4500 TFLOPS/TOPS 对 1980 TOPS),英伟达的 B200 GPU 的性能相比 H100 处理器要高出 2.5 倍。在 FP4 数据格式下,英伟达的 B200 能提供高达 9 PFLOPS 的性能,为训练极其复杂的大型语言模型敞开了大门,从总体上能够为人工智能带来新的使用模式。

“我们与 NVIDIA 的长期合作伙伴关系以及深度创新继续引领行业,为最为复杂的 AI 工作负载提供动力支持,”微软首席执行官萨蒂亚·纳德拉在另一则 X 帖子里说道。