算力如何转化为生产力?邬贺铨院士释疑

来源:封面新闻

封面新闻记者 滕晗

算力已成为继热力、电力之后的新的生产力。2022中国算力大会公布的数据显示,2021年我国算力核心产业规模达1.5万亿,关联产业规模超过8万亿。

中国工程院院士邬贺铨(主办方供图)

7月30日,中国工程院院士邬贺铨在会后接受媒体采访时表达了对“降低算力门槛”的思考,“我们希望算力能够跟电力一样‘即插即用’, 但实际上算力跟电力不同,它的使用是需要门槛的,我们希望能够降低算力的门槛。”

在谈到算力基础设施的国产化情况时,邬贺铨对封面新闻记者表示,“现在服务器基本上都是国内为主了,但是服务器里边的芯片还是英特尔的可能更多,不过已经看到了像浪潮现在也跟华为合作。另外,其他芯片如GPU等这些国内也在做,只不过都是小企业在做,目前还成不了主流,所以应该看到我们还是有差距。”

“东数西算”实际上是“东数西存”

邬贺铨认为,数据分为冷数据和热数据,“热数据主要是一些需要实时性计算的数据,相比之下冷数据就不需要实时性了,国家的八大算力枢纽,实际上西部主要是处理冷数据,当然还有本地的一些数据,而东部主要是热数据。”

今年2月,国家发改委、中央网信办、工业和信息化部、国家能源局联合印发通知,同意在京津冀、长三角、粤港澳大湾区、成渝、内蒙古、贵州、甘肃、宁夏等8地启动建设国家算力枢纽节点,并规划了10个国家数据中心集群。至此,全国一体化大数据中心体系完成总体布局设计,“东数西算”工程正式全面启动。

“人类历史上90%的数据都是过去几年产生的,50%是短短两年产生的,意味着两年之前的数据肯定都是冷数据,而且两年之内产生的数据也有很多是冷的。预见到2025年的数据量年均增长30%。最近产生的数据是热数据,但是热数据经过一周或者几个月以后,也要变成冷数据。一般的统计,冷、温、热的数据分别占到80%、15%和5%,也就意味着‘冷’是主要的。冷数据主要是存储,对冷数据来讲,计算不是常态。要这样算,东西部分别是热数据和冷数据,照这样算,‘东数西算’实际上是‘东数西存’,主要存在西边,当然偶尔会有一些计算。”

“希望能够降低算力的门槛”

“我们希望算力能够跟电力一样‘即插即用’, 但实际上算力跟电力不同,它的使用是需要门槛的,我们希望能够降低算力的门槛。”邬贺铨说,算力的使用,首先必须要充分的数据,然后通过数据进行建模,总结出数学模型,才能根据数据计算得出人工智能的决策。

中国人口多,工业门类齐全,理应产生更多的数据。“可是我们虽然产生了很多数据,但真正把它们存储起来的比例还是不够高,即便存储起来的,利用的比例就更低。”邬贺铨说,将算力转化为生产力,首先要从源头上充分发挥数据的能力,即需要从感知数据、存储数据利用起来,这就包括鼓励企业上云,就企业数字化转型来说,对大多数中小企业而言,并不需要自己去购买数字化转型要的IT设备和软件,“实际上可以上云,要通过推动云服务来让更多企业利用,这样算力才能有更好的用武之地。”

同时,还需要有支撑算力发展的产业基础,包括数据中心、芯片,以及往前端延伸的数据清洗、标注、脱敏等。此外,除IT系统以外,数据中心还包括电力、空调制冷等,因此,如何降低数据中心的能耗,也是值得研究的问题。

“所以国内提出‘东数西算’,利用西部比较充裕的能源,比较廉价的电费,以及有可能利用再生能源,更好满足低碳的需要。所以发展一个算力产业,实际上产业链是相当长的,有很多工作要做,数据中心只是算力产业里突出的中心环节。”

如何兼顾算力提升与节能减排

节能减排是算力提升进程中绕不开的话题。目前,数据中心的能耗大概占全社会能耗的2%,不过在邬贺铨看来,“尽管比例不大,但是相当于一个三峡加一个葛洲坝,也就是说能耗绝对值还是相当可观的,而且还在增长。”

因此,在建设数据中心时多在强调PUE值,即数据中心消耗的所有能源与IT负载消耗的能源的比值,是评价数据中心能源效率的指标。“现在一般希望能做到1.3,也就是说主要的能耗还在IT上面,数据中心附加的制冷、空调等尽可能降低,当然PUE值低了,仍然不能反应就可以了,因为我们希望 PUE值的电力最好是来自‘绿色’的,所以还有一个指标叫CUE(环保效率),比如说碳排放,在常规能源情况下,PUE跟CUE是等效的,消耗多少电就排放多少二氧化碳。”邬贺铨说。

邬贺铨还指出,“PUE、CUE都降低,也不等于说IT的能耗不需要再进一步降低,IT的能耗其中有服务器里的能耗,有存储站的能耗,有网络站的能耗,数据中心虽然是7×24小时工作,但不是7×24小时计算,很多时间是不计算,但是也耗能,也就是说不仅要降低计算的耗能,还要降低存储的耗能。”

对此,邬贺铨建议,针对冷数据可用磁带代替磁盘,以降低大量能耗,对热数据,可先用闪存代替硬盘,这样访问速度会快,而且能耗也能降低,“只是目前成本要高一点。”

在降低耗能之外,另外一个努力方向应是降低数据中心的散热,“现在已经提出来用液冷、水冷,甚至有人提出把数据中心泡在水底上、海底上,或者利用自然冷却,比如挖个山洞,利用山洞的穿堂风等。”邬贺铨说,不过他也指出,尽管数据中心的能耗值得关注,但还应该看到,数据中心提供的节能效果是它自身产生能耗的20倍。

西部地区应抓住机遇 提供数据中心增值服务

当前,许多地方在加码布局数据中心。在邬贺铨看来,“东数西算”工程的启动是宏观层面的引导,“合理布局数据中心,不要无序建设。”有意引导东部规范热数据的发展,西部更好地支撑全国的冷数据,“这既是算力的均衡,也是能源的合理利用,更是带动区域的协同发展。”

邬贺铨也指出,当前在一个数据中心枢纽里,各个数据中心的协同仍然不够,地方政府应该统一协同,至少在公用的能源、电力、水等以及出口的干线、带宽上可以更优化,另一个更大的优化是要跨数据中心,“数据中心要备份,那么主数据中心跟备用数据中心之间,数据就要来往沟通,这里就要协同,包括设计好它们之间的联系线路,干线传输带宽等。我们还需要在国家层面的对跨域的数据中心协同的规划部署,当然这还需要一个过程。”

“数据中心更重要不在于建,而在于用。”邬贺铨强调,值得注意的是,数据中心是重资产,投入后回报比较慢,在西部地区仅靠建数据中心是很难马上得到回报的,因此,将来的发展方向应该是提供增值服务,包括提供数据的均衡、安全的保障、服务质量的保障,并且西部地区还要延伸到数据前端,“目前,数据的清洗、标注、预处理70%仍然靠人工来完成。西部应该抓住这个机遇。当然数据中心机房也是个产业,有服务器了,安装、布线需要大量员工,还有制冷、能源、电力、安防,这些也可以很好地发展,有条件的还可以发展到后端,算法算力的处理等。所以我认为数据中心的产业链现在刚开始,抓住数据中心这个中心环节是对的,但是要延伸到全产业链才能发挥它的价值。”