《外资》Nvidia GH/GB200超级晶片创造新机遇 首选4强将

外资分析,首波生成式AI伺服器基于Nivida HGX平台采用A100/H100 GPU,而GH200/GB200超级晶片则是基于Nivida宣布的GH200 NVL32伺服器机架规模解决方案的伺服器机架设计。基于GH200 NVL32机架规模伺服器解决方案,Nvidia采用了MGX平台与GH200超级晶片取代了HGX平台与A100/H100 GPU,并将热解决方案从风冷升级为液冷。

首波生成式AI伺服器机架的设计特点,是四个伺服器与HGX主机板(每机架3个GPU)使用风冷;Nvidia GH200 NVL32,基于Nvidia DGX Cloud内的机架规模解决方案,包含32个GPU,其中有八个双GH200计算托盘、九个NVLink切换托盘和八个双GH200计算托盘使用液冷。Nvidia尚未宣布GB200机架解决方案,但预期机架规模解决方案将与GH200相似,其基于MGX机箱和液冷。

NVIDIA DGX GH200拥有巨大的共享记忆体空间。它使用NVLink互连技术及NVLink Switch System来连接256个GH200 Grace Hopper超级晶片,让所有超级晶片以单一GPU之姿态来执行各项作业。这提供了1 exaflop的效能和144 TB的共享记忆体,与前一代NVIDIA DGX A100系统的记忆体容量增加了近500倍。

由于AI伺服器机架设计发生了重大变化,GH200/GB200伺服器机架的机架级设计能力的重要性将增加。外资预期具有机架级设计能力的公司,如广达、纬创集团、鸿海和英业达将受益。

虽然外资在「买进」评等中未纳入英业达,但认为英业达有能力支援GB200平台,英业达在2019年投资ZT Group,英业达的投资深化伺服器的市占,抢进亚马逊、脸书和微软供应链(3家公司取英文字首简写为A.F.M),同时也分散生产基地。ZT Group是一家美国生产电脑运算及储存解决方案的公司,该公司提供的产品,包括伺服器系统及高速储存解决方案等,主要供应给大型资料中心,用来做大数据的分析,并出货整合型的机柜、交换器与电源管理方案等,ZT也设计资料中心与特殊应用。