AI教父加持的水冷散熱概念股

【文/庄家源】

晶片算力提升,产生的热能也随之增加,气冷散热已无法应付,后续GB200将导入水冷方案,新架构伺服器整机柜水冷产值更高。

受到晶片算力提升,电源供应器朝高瓦数发展,伴随而来的热能也跟着增加,以目前Intel、AMD推出的高阶伺服器CPU来看,Sapphire Rapids、Emerald Rapids与Genoa在热功耗设计(TDP)都已达三五○∼四○○瓦;在GPU方面,Nvidia、AMD推出的B100、MI300XTDP则达七○○∼七五○瓦,而Nvidia明年预计推出的GB200将达一二○○瓦。

GB200带起水冷散热需求

由于传统的气冷散热受限于空气传导热的效率差,与散热空间受限,气冷已濒临散热极限(四○○∼五○○W),为了提高散热效率,目前的散热模组设计主要多采3D均热板(3DVC)升级现有的散热模组,加强热传导的效率,其最高可应付约八○○W,虽然成本较低但体积大,且仍需配合空调降温,目前已导入Intel Eagle Stream和AMD Genoa两大平台。

不过,随着近年节能减碳意识擡头,传统以3DVC搭配空调的散热解决方案,其资料中心电源使用效率(PUE)约落在一.五∼一.七左右,而目前多数国家标准,如欧盟、中国皆要求未来兴建之资料中心PUE需低于一.三。此外,随着晶片效能持续提升,Nvidia今年底明年初将推出新款AI晶片GB200,根据法人对供应链访查,在搭载GB200的AI伺服器当中,其使用的机壳、散热模组结构将出现大幅变化,其中在伺服器机壳的设计将改采二U,因此伺服器机壳将缩小、重量减轻,GB200晶片的TDP提升至一二○○W,散热模组由气冷改为水冷。

从Nvidia在今年GTC大会上展示的DGX SuperPOD超级电脑系统,即采用了水冷式散热架构,目前水冷散热系统主要可分为开放式水冷与浸没式水冷,前者是搭配水冷板(Cold Plate)、冷却水分配装置(CDU)、冷却水歧管(CDM),透过冷却器和风扇背门或是热交换器(RDHx)将冷却水降温;而后者则是将伺服器完全浸没于冷却水当中,直接透过水体对流的方式将废热自晶片转移至液体中,提高热传导效率,在不开空调的情况下,可使PUE降至约一.一,虽然初期建置成本较高但体积小排列能够更密集,且若考虑未来数年省下的电费来看,水冷仍占有优势。

散热模组厂双鸿早在二○一二年就向IBM技转伺服器水冷技术,目前已累积超过十年的水冷开发经验,双鸿在不管是在开放式水循环或封闭式水冷、水冷板、冷却水分配装置、冷却水歧管等一应俱全。

双鸿最早跨入水冷市场

双鸿在去年十一月的法说会中,针对伺服器水冷散热,董事长林育申认为,随着晶片的TDP提升至一千瓦以上,将推动水冷散热需求提升,今年将处于气冷与水冷散热的交换期,预期明年水冷散热的占比将会明显提升。

随着水冷需求持续扩大,法人预估每台GB200伺服器的散热成本是H100的十一倍,预期将因此推动二○二四∼二七年伺服器散热市场规模大增四倍,从二二亿美元成长至九五亿美元;水冷市场规模将增长二五倍,从三.一亿美元成长至七八亿美元。

【全文详情及图表请见《先探投资周刊》2300期;订阅先探投资周刊电子版】