拐点来临:液冷从奢侈进入普惠时代
生成式AI吸引了目光、掀起了大浪,而如果要得到持续发展,需要的是:一半火焰、一半海水。
火焰,是火热的。各类大模型开发、各类工具应用问世、各类算力资源提升、各种生态形态丰富。
海水,是冷静的。高效平衡、利用各种资源,尤其在功耗、散热方面,算力需求越大,“制冷”的需求就越高。这是一个不那么显眼,但又无比重要的领域。毕竟,过热的GPU、CPU,不仅会罢工,也会带来直接或间接的损失。因此,也成为算力使用者要关切的重要事物。
而在散热领域,一个加速的趋势就是,液冷,正取代风冷,成为制冷领域的主力,从奢侈进入普惠时代。
迭代升级的必然
电子产品甚至任何商品,升级迭代都是一个必然规律。就像最近很火的光模块,从40G取代10G,100G取代40G,400G取代100G,800G取代400G,升级之路永不停歇。而每一代产品,也都经历了从“奢侈”、“尝鲜”到“普及”、“刚需”的过程。
在散热领域也是如此。比如从人的需求来看,先是扇子、后来电扇、再后来空调,空调也有了变频,技术升级的同时,制冷越来越有效。而电脑、服务器等电子产品,随着功耗越来越高,散热需求、相应技术也在提升。先是自然风冷、空调风扇、散热片,继而是液冷。液冷也有喷淋式、冷板式和浸没式等等。
产品迭代升级的驱动力,就是第一性原理。满足业务的核心需求,并提供越来越高的综合性价比。无论投资还是实业,都需要把握产品迭代升级的节奏。过早,会导致成本过高、甚至可能失败;过慢,就会丧失先机和机遇。
于是,关键点在于判断:拐点何时来。
液冷的拐点来临
液冷时代的必要性、可行性都在大幅提升。
首先,必要性方面,当前数据中心的高功耗,正成为不得不面对的问题。而传统的风冷散热,已经无法应对。
工信部曾有一份数据预测,到2025年,中国数据中心耗电量占全国用电量比重预计将从2018年的1.6%增长到5.8%。在“双碳”的要求下,数据中心节能减排成为大事。
比如政策也规定,新建大型、超大型PUE小于1.3,国家枢纽节点小于1.25,可再生能源利用率明显提升,绿色低碳等级4A以上。而风冷方式下数据中心的PUE值通常在1.5左右,离政策要求有不少差距。
与此同时,AI发展带来的高功耗,也已经突破了风冷的能力上限。比如单芯片来看,风冷芯片级散热功耗上限是800W,GPU已达到了700W,接近风冷上限。而高算力GPU的研发还在继续。
从数据中心角度来看,自然风冷的数据中心,单机柜密度一般只支持 8-10kW,在机柜功率超过 10kW 后性价比大幅下降。而2025年AI集群算力单机柜密度将会达到20-50kW,也远远超出了风冷的上限。
因此,无论是新建数据中心,还是数据中心改造,采用液冷已经不再是“可选项”,而是“必选项”。尤其PUE 1.3 成为数据中心建设“绿线”,节能改造刻不容缓。
其次,液冷的性价比,提供了良好的可行性。液冷的好,大家都知道,而之前一个困难就是“贵”,但当下,随着技术发展、产业链不断成熟,以及产品规模扩大带来了降本,液冷和风冷相比,体现出了更优的性价比。
在功率密度为 10kW/机架状况下,风冷和液冷数据中心的投资成本大致相等。当提升2倍功率密度(每机架 20kW)后,初投资可降低10%。当提升4倍功率密度(每机架 40kW),可节省高达14%的投资成本。
有政策带来的引导和迫切,有技术提升带来的效果,还有更划算的成本,那么,对液冷的选择,便是理所当然。
如何让奢侈到普惠发生
当然,美好的事物,并不会自动发生,也需要更好的落地路径。
就以数据中心改造来说,也是难题重重。首先是技术难度,液冷不是传统的风冷,多上几个风扇,把转速提高。风转液冷首先要考验包括复杂部件液冷适配、漏液可靠性等在内的综合技术。
其次,液冷的初期建设成本会高10%左右,用户倾向于关注初期建设成本,往往忽略了液冷释放的性能而带来的业务效益与节能效果。第三,落地麻烦,涉及到楼体改造、空间布局、施工难度大、改造周期长。
那么,如何让想法落地?
这也是宁畅从公司成立之初就在考虑的事情。三年前,公司就开始布局液冷,率先的思考和布局,确保了公司的执行力、对需求和行业发展趋势的理解力。
当下,宁畅带来的方案就是:数据中心的“无忧焕液计划”,包括:尝鲜焕液、升级焕液、尊享焕液三大套餐,“多、快、好、省”地推荐数据中心转型升级。
三个套餐各有特色。尝鲜版,顾名思义,是用户想体验、尝试一下,这种业务体量小,可以快速登门改造,有点像快递行业次日达;升级版,用户的业务规模相对加大,对液冷的需求也比较明确,宁畅可以为用户提供全栈液冷模块化的解决方案,这种方式更类似于“预制菜”模式,工厂预制好后到机房进行安装;尊享版,对于那些预算充裕,想引领技术潮流的用户,可以提供更先进的浸没式液冷全系统解决方案。
这种由小到大、从轻到重、从体验到喜欢,循序渐进的产品方案,可以确保用户对新技术、新产品的接受度更丝滑,也享受到实实在在的收益。
比如“次日达”方案,仅部件温度降低,就可以带来性能提升10%左右,甚至更多。升级版,实现了模块化按需组合与解耦,冷板覆盖甚至可达到95%。尊享版,可使PUE≤1.05, 趋近于1,且性能提升20%,性能提升也就意味着业务能力的提升。
宁畅在液冷方面的能力建设,为这些方案提供了保障。“多”场景,液冷技术可覆盖包括通用、AI、机架、整机柜等产品;“快”交付,用标准化、模块化,实现工厂预制直接到现场安装;“好”迭代,可实现从风冷-风液混合-全液冷的各阶段递进式方案服务,以及浸没液冷全系统打造;“省”心力,公司可以从一次侧到二次侧,全面提升运维效率,协同管理。
产品和服务体系的完善,也不是一日之功,而是“软磨硬泡”后的真功夫。
软方面,布局早是宁畅的重要优势,目前,宁畅已经有18万台液冷的出货量,液冷经验丰富,此外宁畅具备完善的液冷设计库,囊括各类问题及素材。这也使得宁畅可灵活地实现液冷产品的设计、验证和量产,可以保证机房的建设,以及针对性地对机房进行改造。
硬方面,为了确保交付,宁畅有布局在北京、天津、杭州、深圳的四个研发中心。本地化的团队,可以确保第一时间向用户登门拜访、交流方案、部署维护。同时,公司也布局了三大生产基地,分别在华北、华东和华南,可以实现就近生产、制造、交付。
先发是种优势,而对产业的坚定、对用户需求的关切,才可以将产品优势转变为用户的实在利益。
尾声
算力浪潮,热度要有,吸引人才和资金;冷静,更要有,让算力保持在最佳效果。不早不晚,当下,正是液冷从奢侈到普惠的开始。布局当下,享受算力腾飞的红利,参与AI提效各行各业的浪潮。