辉达携美电信商 攻订阅服务
辉达次世代AI伺服器逐渐清晰,独有多节点NV-Link通讯协定,将带动架构全新改动;图为执行长黄仁勋。图/美联社
辉达AI伺服器产品路线图
辉达持续深化软体服务,开拓GPU之外的第二主战场,24日宣布与美国大型电信商Equinix共同发表托管型人工智慧超级运算解决方案,除加深AI伺服器相关GPU晶片产品布局外,也积极抢占订阅服务市场。
辉达强调,完全托管型NVIDIA AI超级运算服务,提供客户在靠近其资料处操作其AI基础设施。辉达执行长黄仁勋指出,生成式AI正在改变每个产业,现今世界各地企业都可以在全球数百个资料中心拥有NVIDIA AI超级运算和软体,并结合Equinix管理提升营运效率。
黄仁勋近期抵台,再掀AI浪潮。这也让外界关注到辉达H200/B100外,GB/GH 200次世代AI伺服器轮廓也逐渐清晰,加上辉达独有多节点NV-Link通讯协定,将带动伺服器架构全新改动,然而辉达尚未正式发布相关讯息,惟市场已高度期待次世代伺服器所带来的超级运算实力与应用。
AWS将为首家配备多节点NVLink技术的厂商,将32颗GH200透过NVLink与NVSwitch相互连接,成为最佳GPU运算环境;业界预估,最多可扩充至数千台GH200,提供客户训练参数超过1兆个的大型语言模型。
此外,B100架构也传出用台积电CoWoS-L设计;长期来看,CoWoS在整体晶片面积加大的趋势下,各家业者也将持续投资先进封装技术中。
业界人士分析,辉达GPU晶片随台积电CoWoS产能开出逐步缓解,不少下游零组件供应商开始取得晶片,迈开伺服器组装步伐,估计第一季便会有显著营收贡献。
2023年为辉达丰收的一年,台湾分公司将于25日举行尾牙,黄仁勋亲自出席,为今年营运暖身、再创高峰。供应链也透露,H200、B100箭在弦上,分别于上下半年问世;此外,次世代AI伺服器GH/GB 200整合CPU及GPU,晶片之间互联采NVLink,速率提高达900GB/s,远高于传统PCIe,最快于第二季,就能看到GH200,并以MGX模组方式贩售。