华为四大重构,新一代数据中心来了!

(原标题:华为四大重构,新一代数据中心来了!)

10月30日的2020共赢未来全球线上峰会(Better World Summit2020)数字转型之下的能源目标网专场,Uptime Institute全球大客户总监Lilia Severina作了精彩的《数据中心发展趋势洞察》报告,简要介绍了2020年和2021年全球数据中心行业的十大最新趋势。Uptime Institute是全球公认的数据中心标准组织和权威的第三方认证机构,其上述洞察引起了5G微信公众平台国内数据中心发展趋势的深思。

数据中心亟需成为技术创新高地

当下,受"联网+"、大数据战略、数字经济、新基建等国家政策指引,以及5G、物联网、大数据、云计算、智能等技术蓬勃兴起下消费互联网和产业互联网快速发展的驱动,数据正在成为宝贵的战略资源关键生产要素,对产业生产方式、运行模式、生态体系产生深远影响。各行各业利用传感器、5G、物联网、数据中心等采集、传输、存储并分析显性及非显性数据,通过广泛攫取数据及深度挖掘数据价值为企业数字化转型提供支撑,海量数据不断生产并积累。如下图所示,赛迪预计2030年中国数据原生产业规模将占整个经济总量的15%,数据的总体规模超过4096 ZB,占全球数据总量的30%。

数据量及计算量呈指数级的爆发式增长,将带动数据中心规模不断扩张。与TCP/IP时代机房/数据中心处于"配角"地位不同,提供并管理资源的云数据中心逐渐进入到了舞台中央。一方面,数据中心进入需求扩张期且大型化、园区化、集群化趋势明显,随着云计算技术的大规模商用,大型云基础设施要求在相对集中的区域内部署多个大型数据中心园区,满足其超大规模计算和数据存储的需要。另一方面,云计算、大数据、智能等改变了数据中心,使得数据中心从拿来主义的技术输入方逐渐变成各种创新技术的输出方,使得数据中心成为复杂性的聚集地,变得资源密集型、资本密集型,而且正在变得技术密集型,也将必然会发展为技术创新的新高地以真正成为数字经济深入发展的"基石"。

数据中心的上述技术创新先是发生在其IT域,一是计算方面的整机柜、多节点、定制化通用服务器等,二是网络方面的超大规模组网、大规模路由组织、"SDN+OpenStack"云网一体化管控、智能网卡、超低时延无损网络等,三是存储方面的企业级硬盘等。但是在非IT域,为平衡效率成本,作为信息处理、存储、发布等核心设施的数据中心,其传统规划设计、建造、运维等全生命周期过程越来越不能适应飞速发展的业务需求的变化特点。而5G微信公众平台深入分析华为近日发布的"PowerX2025能源目标网"之"DC PowerX© (下一代数据中心能源)"解决方案后发现,围绕数据中心的非IT域技术创新也已经取得了很大的成果,引领数据中心非IT域开始走向开放化、标准化模块化和预制化等,实现了对数据中心架构供电链路温控系统管理系统的重构。

华为对数据中心进行了四大重构

市场需求激增的数据中心,面临着建设资源获取难/建设周期长、能耗高、运维复杂等艰巨挑战。据悉,华为提出了极简、绿色、智能、安全的下一代数据中心目标架构,以"四大重构"为手段,解决了数据中心上述挑战。

● 解决了"建设周期长":重构数据中心架构

传统的数据中心,在建设模式上的弊端多且大,在前期规划建设阶段主要有三大难点,一是存在过度投资的风险,初期投资成本高企;二是建设工程复杂,建设周期长,无法快速投产(比如以一个具有1000架机柜的数据中心为例,如果按照现有传统的建设模式,需要经历18个月以上甚至两年时间的"旷日持久");三是即使是在建成后,业务需求增长、数据中心容量扩容、现有设施扩建或改造等带来的设计和建设问题也很难得到解决。

这些使得数据中心越来越跟不上时代的发展。一方面,随着消费互联网业务以及产业互联网业务日益呈现"短时间内快速爆发"的特征,业务侧数据和流量需求激增,要求数据中心必须快速投入使用。另一方面,数据中心正在由支撑系统转变为生产系统,"更快上线"意味着"更快收益"。

所以亟需对数据中心的建设模式进行变革。据了解,华为推出了工程预制化和部件模块化方案,通过工厂预制集成和预安装以及发货前全场景调测,将其作为标准化"即插即用式"模块运至数据中心施工现场以进行简单、快速的"拼接"式安装(好比拼接积木一般),以及后期模块化灵活扩容,从而实现了"工程极简",可满足数据中心对于"快速部署"和"业务快速上线"的需求——建设周期可以被大幅缩短至6-9个月,TTM和交付时间均节省50%以上。

综上,5G微信公众平台认为华为的上述方案使得数据中心具备快速部署、弹性扩容、运维简单、高效节能等优势,相比于传统数据中心在成本和效率的可预见性、时间成本、空间成本、规划流程、可靠性、改善灵活性等方面都不可"同日而语";而且尤其是在数据中心单柜平均功率日趋高密的趋势下,该方案使得数据中心更加节省空间。总体上,相关方案正在引领数据中心的建设模式从实体建筑向模块化组装过渡。

● 解决了"能耗高":重构数据中心供电链路、温控系统

数据中心的本质是把电力转换为算力,再把算力转换为IT服务。随着计算能力不断提升,能耗必然大幅提升。数据中心属于高能耗信息基础设施,一个拥有1000台高密度机架的小型数据中心,总功耗是21000kW,全年满负荷能耗可达1.8亿千瓦时。还有数据显示,全球数据中心目前的耗电量约占总量的3%,预计到2025年总耗电量将达1000TWh以上。巨大的能耗成本是数据中心最主要的运营成本之一,节能减排和降低运营成本面临巨大挑战,受不可再生资源稀缺及能源成本日益上升的影响,降低数据中心PUE以及建设低能耗绿色数据中心成为必然的发展方向。

从数据中心的能耗构成来看,IT系统、供电系统以及温控系统是构成数据中心能耗的主体, 三者所消耗的能耗占数据中心整体能耗的98%,成为数据中心节能降耗的关键领域。其中,供电系统以及温控系统的能耗仅次于IT系统的能耗,比如PUE=1.6的数据中心,供电系统以及温控系统约占整体能耗的40%左右。目前国内大多数数据中心的PUE值还有着很大的优化空间。着眼于大幅降低数据中心PUE,笔者了解到,华为提出了重构数据中心供电链路、重构数据中心温控系统的解决方案——通过"硅进铜退"、"锂进铅退"、预测性维护,重构供电链路,实现安全可靠;通过"风进水退"与智能节能,重构温控系统,降低PUE,实现极致节能。

一是重构数据中心供电链路。

传统数据中心供配电系统包括变压器、低压配电、UPS、支路馈线等多个部分,存在系统割裂且复杂、占地面积大、故障定位难等问题。而如果有极简的供电架构,则可减少变换次数,缩短供电距离,减少占地,提升出柜率和系统能效。同时,相比于传统铅酸电池的占地面积大、初始投资高、维护成本高,锂电池在占地面积、使用寿命等方面存在优势,随着锂电池成本的不断下降,未来将在数据中心规模应用。华为通过锂进铅退硅和进铜退的数据中心供电链路重构,大幅降低能源浪费。一方面华为电力模块用电效率高达95.5%;另一方面智能锂电实行全部件模块化,按需求扩容,单柜电量高。同时,系统运行效率高,单套UPS全生命周期可省电费约20万,且全部件模块化,可在后期按需扩容。

此外,传统数据中心的供配电系统采用"分散设计,分段招标,再进行现场施工"的部署方式。而华为电力模块采用全链路融合的一体化设计,并采用预制化、预调测来实现极简安装、即插即用,不但可实现快速部署,还更加省地、省电,以及更易于维护管理。5G微信公众平台认为预制化电力模块是数据中心配电系统建设的一种创新形式,从设计到建设阶段,全程遵循"标准化设计、工厂化加工、装配式建设"的理念,通过电气一次和二次集成设备最大限度实现规模生产、集成调试、模块化配送,减少现场安装、接线、调试工作;电力模块采用装配式结构,可通过工厂预制、现场机械化安装,有效提高建设质量和效率,既能缩短施工现场部署时间,又能提高系统性能的可预见性。

二是重构数据中心温控系统。

GPU、NPU的应用促进高密场景增多,液冷系统越来越普遍。但部分存储与计算业务仍为低密场景,为快速适应未来不确定的IT业务需求,制冷方案需兼容液冷系统和风冷系统。

一方面,数据中心液冷系统的节能可分为设计节能和运维节能。设计节能主要是通过制冷系统方案设计和设备选型来实现,更多体现在通过硬件来节能。但是,有了高能效的硬件,并不代表就能发挥出最优的节能效果,其节能效果的优劣还与数据中心的运维水平息息相关。而传统的运维节能往往依赖于一个有经验的运维团队,他们会根据多年的运维经验,判断出在不同季节、不同环境温度和不同负载率下,如何调节整个制冷系统的运行参数,尽可能地实现制冷系统能效的最大化。但运维团队的经验是在实践中摸索出来的,不但可遇不可求,同时也难以精准把控。因此,针对复杂的冷冻水制冷系统,需要找到一种新的控制算法,以达到整体最优的效果,而大数据、智能化则是能效优化的一个探索方向。5G微信公众平台了解到,目前华为iCooling技术已经在多个大型数据中心规模商用,实现了数据中心制冷智能化,实测可有效降低数据中心PUE 8%-15%(比如实践表明,通过引入iCooling,华为廊坊云数据中心的PUE值从1.42降低到了1.26),还大幅度节省了运维人力。

另一方面,现有的传统冷冻水系统由冷却塔、板式换热器、冷水机组与冷冻水型精密空调组成,架构复杂、链条长,需四次换热,且安装和运维复杂,不利于快速部署和运维,而华为模块化架构的间接蒸发冷却系统只有一套系统、只需一次换热,可缩短部署时间、降低运维难度,同时充分利用自然冷却资源,大幅降低制冷系统的电力消耗,能将PUE降至1.2,年电费节省14.3%,在气候适宜区域将逐步取代冷冻水系统。

● 解决了"运维复杂":重构数据中心管理系统

数据中心运维中最大的难点在于当调整了其中一个参数时,系统中的其他参数将做出如何改变、又应该如何配合?在目前的运维体系中没有现成的公式或算法可供参考。通过数字技术分析与数据中心内具体组件生成的数据之间的联系,以发现不同设备与不同系统参数对系统整体的影响,于其中,动态模型训练、推理与决策是关键。据悉,华为重构了数据中心的管理系统,让传统被动型人工运维转变为主动预防型数字化运维,并将逐级实现自动化运维,实现数据中心运维的自动驾驶,降低运维成本。笔者相信随着iCooling方案以及一系列数字技术在数据中心运营和管理中的作用越来越广泛,"智能运维"、"无人值守"等概念将不再只是被反复提及的"热词"。

助力推进碳中和的伟大目标

新基建时代,网联化、信息化、数字化将驱动数据呈爆发式增长态势,迎来政策与技术发展风口期的数据中心,亟需解决建设周期长、能耗高、运维复杂等艰巨挑战,以成为数字经济深入发展的坚实底座。从上文看来,华为"DC PowerX© (下一代数据中心能源)"解决方案通过重构数据中心架构、重构数据中心供电链路与温控系统、重构数据中心管理系统很好地解决了上述三大挑战,引领数据中心开始走向开放化、标准化、模块化和预制化等,为"二氧化碳排放2030年左右达到峰值并争取尽早达峰,单位国内生产总值二氧化碳排放比2005年下降60%-65%"这一目标的早日实现提供了很大的助力。

作者:5G