NVIDIA Blackwell推动液冷渗透率翻倍,联想成最大受益算力厂商
根据TrendForce集邦咨询最新调查,随着NVIDIA Blackwell新平台预计于2024年第四季出货,将推动液冷散热方案的渗透率明显增长,从2024年的10%左右至2025年将突破20%。随着全球ESG(环境、社会和公司治理)意识提升,加上CSP(云端服务业者)加速建设AI服务器,预期有助于带动散热方案从气冷转向液冷形式。
观察全球AI服务器市场,2024年主要AI方案供应商仍是NVIDIA(英伟达)。若在GPU AI服务器市场而言,NVIDIA则占据强大的优势,市占率接近90%,排名第二的AMD仅约8%。
TrendForce集邦咨询观察,今年NVIDIA Blackwell出货量规模较小,主要是因为供应链仍在进行产品最终测试验证等流程,如高速传输和散热设计等方面需要持续优化。新平台因能耗较高,尤其GB200整柜式方案需要更好的散热效率,有望促进液冷方案渗透率。TrendForce集邦咨询预估2025年Blackwell平台在高端GPU的占比有望超过80%,这将促使电源供应厂商和散热行业等将竞相投入AI液冷市场,形成新的产业竞争格局。
近年来,Google、AWS和Microsoft等大型美系云端业者皆加快布建AI服务器,主要采用搭载NVIDIA GPU及自研ASIC的方式。据TrendForce集邦咨询了解,NVIDIA GB200 NVL72机柜之热设计功耗(TDP)高达约140kW,需要采用液冷方案才能解决散热问题。HGX和MGX等其他架构的Blackwell服务器因密度较低,气冷散热为主要方案。
在云端业者自研AI ASIC方面,Google的TPU除了使用气冷方案,还积极布局液冷散热,是最积极采用液冷方案的美系厂商。中国大陆方面,Alibaba(阿里巴巴)最积极扩建液冷数据中心。
目前,全球AI服务器液冷方案中,联想、惠普、浪潮都有各自的技术,其中以联想的Neptune液冷技术最为成熟及高效。十多年来,联想Neptune在数据中心冷却技术方面一直处于世界领先地位,开创了使用液体散热的独特方法,与传统的风冷系统相比,能够使客户实现高达40%的功耗降低。Neptune方案使用温水循环来冷却数据中心系统,并保持所有服务器组件冷却,从而减少数据中心运行中对高耗电系统风扇的需求。
联想凭借40多项行业首创的专利,正在将液体冷却技术推向新的高度。随着第六代联想Neptune液体冷却技术的问世,联想将其业界领先的Neptune液体冷却技术扩展至ThinkSystem V3和V4主流产品组合中,并引入了新的设计创新:
•扩展Neptune技术的广泛应用:主流的ThinkSystem V3和V4产品提供直接开放式循环水冷却CPU的选项。
•全新的行业独有的冷板设计:为CPU和加速器优化的专利冷板设计,最大化了大约700W加速器的热提取效率,未来设计将支持超过1000W的加速器。
•ThinkSystem平台的新型内存冷却技术:联想为高密度高性能计算(HPC)系统设计的专利内存冷却技术将被集成到特定的ThinkSystem平台中,采用直接对DRAM进行液体冷却,允许客户选择CPU和内存冷却选项,以有效降低热量并最大化性能。
第六代Neptune温水冷却设计将允许在无需特殊数据中心空调的情况下运行,并且通过允许设施内热水的再利用,将废热转化为价值。
通过这些创新,联想继续巩固其在高效能计算和可持续发展领域的领导地位,为客户提供更高效、更环保的冷却解决方案,以满足日益增长的高性能计算需求。