上海:到2025年本市智能算力规模超过30EFlops,占比达到总算力50%以上

上海市通信管理局等11个部门联合印发《上海市智能算力基础设施高质量发展 “算力浦江”智算行动实施方案(2024-2025年)》提出,到2025年,本市智能算力规模超过30EFlops,占比达到总算力的50%以上。算力网络节点间单向网络时延控制在1毫秒以内。智算中心内先进存储容量占比达到50%以上。

上海市智能算力基础设施高质量发展“算力浦江”智算行动实施方案

(2024-2025年)

算力是集信息计算力、网络运载力、数据存储力于一体的新型生产力,主要通过算力基础设施向社会提供服务。算力基础设施是新型信息基础设施的重要组成部分,呈现多元泛在、智能敏捷、安全可靠、绿色低碳等特征。智能算力基础设施是人工智能时代算力基础设施的核心载体,主要面向人工智能应用提供算力、数据和算法。在大模型蓬勃发展以及相关应用场景取得突破的背景下,智能算力正在为产业赋能带来实质性推进,为企业智能化改造和数字化转型提供有力支撑,不断催生新业态、新模式、新应用,进而助力数字技术与实体经济深度融合,成为壮大算力作为新质生产力的重要引擎。根据工业和信息化部等六部门联合印发的《算力基础设施高质量发展行动计划》、国家发展改革委等五部门联合印发的《关于深入实施“东数西算”工程 加快构建全国一体化算力网的实施意见》以及《上海市进一步推进新型基础设施建设行动方案(2023-2026年)》《新型数据中心“算力浦江”行动计划(2022-2024年)》有关精神,结合上海发展实际,制定本实施方案。

一、总体要求

(一)指导思想

以习近平新时代中国特色社会主义思想为指导,全面贯彻党的二十大精神,落实上海市委市政府有关加强高能级算力与数据基础设施的决策部署,坚持布局优化、异构创新、开放兼容、赋能发展,以超大规模预训练模型以及生成式人工智能快速发展为契机,举全市之力打造智能算力创新及应用示范区,适度超前布局与人工智能技术相适应的智能算力基础设施,努力创建基础设施齐全、技术水平领先、应用生态聚焦、标准体系完备的智能算力发展格局,助力智能算力基础设施高质量发展。

(二)总体目标

以构建支撑本市公共服务、商业服务的智能算力供给体系为指引,形成上海算力交易平台、上海市人工智能公共算力服务平台两大算力资源调度核心,以及面向智算应用的算力中心多极分布的“1+1+X”智能算力建设和服务体系,不断完善和深化探索算力、运力、存力协同布局的智能算力基础设施建设,聚焦智能芯片、算法模型、训练框架、计算平台与重点行业应用,逐步构建以自主可控、安全可靠、开源开放、广泛兼容、高性能算力聚合为特征的智能算力基础设施产业体系。力争到2025年,打造智算设施高效协同、智算要素自主可控、智算应用融合泛在、绿色智算效能突出、智算生态安全开放的智能算力支撑体系,建成具有区域乃至全国影响力的智能算力创新及应用示范区。

智算设施高效协同

到2025年,本市智能算力规模超过30EFlops,占比达到总算力的50%以上。算力网络节点间单向网络时延控制在1毫秒以内。智算中心内先进存储容量占比达到50%以上。

智算要素自主可控

到2025年,本市新建智算中心国产算力芯片使用占比超过50%,国产存储使用占比超过50%,服务具有国际影响力的通用及垂直行业大模型设计应用企业超过10家。

智算应用融合泛在

到2025年,本市具备大规模应用赋能价值的智算中心数量达到10家。智能算力典型应用场景超过50个。争取5个以上智算中心纳入国家级算力基础设施典型案例名单。

绿色智算效能突出

到2025年,本市新建智算中心PUE值达到1.25以下,存量改造智算中心PUE值达到1.4以下。智算中心内绿色能源使用占比超过20%,液冷机柜数量占比超过50%。

智算生态安全开放

到2025年,智算中心运营企业实现网络安全实战攻防、首席数据官制度全覆盖。形成5项以上的智算领域地方标准。

二、重点任务

(一)筑强算运存协同布局的智算设施体系

1.优化布局智能算力中心建设

加快推进临港、青浦、松江、金山、张江等重点区域大型智算中心建设。根据上海市各特色产业园区发展需要,建设以算力多样化、网络全光化、应用容器化为主要特征的边缘智算中心,单中心智算峰值规模小于300P,重点满足中小企业和部分科学研究的智算需求,提升多元化异构算力算效水平。

2.构建城市高速全光运力环网

统筹合规建设城市级数据中心算力环网,推动在临港、外高桥、宝山、青浦、松江、浦江等有关数据中心集群间建立算力网络骨干节点,按需在重点数据中心聚集区内,结合边缘算力区域化部署,建立算力网络二级节点,联通全市主要智算资源。利用全光、光电共封装、端到端切片、无损以太、长距离RDMA、网络数字地图等技术,探索在跨算力集群间构建全程全网高效无损智算网络。

3.提升先进存力要素资源部署

以“先进介质、高效架构、兼容生态、安全可信”为支撑,在智算中心内加快部署下一代先进存储技术,推动全闪存储、硬件高密、数据缩减、多协议数据互通等核心技术底层适配,提升存储介质、容灾备份、加密存储、数据防护等关键技术水平。加速开展存储资源与智能计算多云容器平台的相互兼容与高效对接,推动两侧软硬件相互促进、协同发展。探索存储和算力资源跨节点分布的“存算分离”新模式。

4.实施智能算力高效率调度

聚焦跨区域模型训练、自动驾驶、机器人研发、科学研究等智算协同需求,完善智能算力调度机制。以基础电信企业、新型互联网交换中心的合规算力网络调度为依托,上海算力交易平台、上海市人工智能公共算力服务平台加快建设多云互联智算资源调度体系,开展智能算力跨地域直连试点,推动与芜湖集群、中西部地区枢纽节点间的跨域协同,探索与“一带一路”沿线算力中心构建合规算力互联通道。持续推进智能计算云资源统一纳管,强化“IPv6+”等智能网络技术以及算力度量、感知与编排算法研发,推动算力调度逐步向容器级与应用级延伸。鼓励基础电信企业基于跨地区智算资源池对本市提供智算服务。

(二)构建自主可控的智算生产要素

1.加快智算芯片国产化部署

面向多模态大模型以及规模化、高速化分布式计算需求,加快ARM、RISC-V、X86等基础架构以及GPU、ASIC、FPGA等国产异构智能算力研发进程,实现高端训练算力、自主边缘决策算力、高效终端执行算力在智算中心内的全方位部署。积极探索可重构、存算一体、类脑计算、Chiplet、DSV等创新架构路线。推动智算芯片全面兼容国产训练框架,进一步提升智算中心算力调度能力,推动智算芯片软硬件实现高质量自主可控。

2.加强开源大模型适配应用

瞄准具身智能、自主智能体、深度超大规模图计算等前沿领域,围绕大模型工程设计、模型构建、应用部署、训练迭代等环节,在智算中心内重点应用基于自主芯片和算法的开源通用大模型,推动部署重点领域专用行业模型。推动大模型多维并行训练优化、模型快速适配、模型异构推理部署等技术和工具研发,提升先进算法原始创新能力与规范化水平。

(三)打造创新融合泛在的智算应用场景

1.智算+城市治理

围绕城市治理“一网统管”要求,在实时感知、智能分析、精准研判、协同指挥与应急处置等应用场景,推动智能算力在民生守护、公共安全、规划建设、市场运行等重点领域应用,推动城市治理精细化、智能化能力显著提升。

2.智算+工业

围绕智能制造、工业仿真等实时应用场景计算需求,推动智能算力赋能工业机器视觉、协同研发设计、柔性生产制造、预测性维护、工业传感等应用场景。推动多源感知、深度学习、智能分析、力位耦合与轨迹规划等关键技术在智能制造领域的应用,构建开放核心算法模型,提升全制造业智能制造水平。

3.智算+教育科研

推动智能算力资源覆盖校园、科研院所和科创中心,优化布局以科研、教育、实验实训等资源为主的智算服务平台。推动智能算力赋能计算生物学、新材料研发、可控核聚变等前沿科研领域,助力解决相关科研领域重大瓶颈。

4.智算+金融

围绕生物特征识别、高频支付、隐私安全等智慧金融重点应用场景,强化智能边缘侧节点搭建。构筑“云边端+智能”产业数字金融平台,打造金融行业大模型,推动智能算力在信贷决策、智能风控,智能客服、可信交易、资产智能管理等新领域的应用。

5.智算+医疗

推动人机融合医疗会诊、医疗行为多维度感知、诊疗能力智能评估等领域关键技术研发与应用落地。聚焦电子病历、医疗影像、病理切片、诊疗记录等医疗大数据,培育具备多元融合、多协议免拷贝、无损压缩、智能缓存预读、视网联动、全光阅片等功能的智算应用。

6.智算+机器人

构建大规模云端并行计算与边端决策计算协同的机器人智算服务框架,围绕共性需求构建机器人智能云管平台,推动智能算力在机器人系统研发、多形态自重构、信息感知与导航、多任务规划与智能控制、人机交互与自主编程、高效仿生驱动、精准安全操控等关键技术领域的应用。

7.智算+自动驾驶

加快推动临港新片区等重点区域车路协同设施建设,构建专属边缘算力池。加强对L4及以上高级别自动驾驶、5G-V2X等领域技术的创新发展,强化自动驾驶训练数据集搭建与视觉大模型训练,推动“车、路、云、网”智能基础设施落地应用。

(四)提升低碳节能的绿色智算水平

1.优化智算中心绿色能源使用

加快推动采用长时储能、氢燃料发电机、风电光伏、生物燃料等方式,结合大数据分析、AI算法建模等技术,探索电网算网一体化“源网荷储”协同方案。探索通过清洁电能动态储备与灵活调度,提升清洁能源电网稳定性、可靠性与利用效率,逐步提升智算中心绿色能源使用比例。鼓励光伏储能微电网技术、电池人工智能技术、锂电池储能系统、直流微电网系统在智算中心的示范应用。

2.加快智算中心新型节能技术应用

加快发展和部署全液冷、风液混合、高弹性冷却等新一代绿色节能方案应用,推动液冷在智算中心的规模化和规范化发展。推进智算中心利用预制化交付、整机柜工程、集群新背板等融合技术创新,结合IT设备智能化运维监测提高智算中心能源使用效率。按需分批次推动存量中小型数据中心向边缘智算中心的智能化、绿色化、集约化改造,加强基于云原生的绿色计算应用普及,全链条提升智算中心节能效率。

(五)创建安全可持续的智算产业生态

1.强化智算中心网络数据安全运行管理

推动智算中心与网络数据安全保障体系同规划、同布局、同建设,全面提升网络数据安全运行与管理能力。加强对网络通信、行为日志、数据传输、共享接口等安全监测分析,形成重要数据发现、态势感知、风险预警、应急处置、事前预防等综合技术保障能力。智算中心建立完善网络数据安全管理制度,落实网络数据安全防护措施,完善数据安全分类分级管理机制,加强智算中心安全生产管理,防范遏制重大安全事件。

2.打造开放兼容标准化的智算生态体系

加快智算中心软硬件适配生态建设,制定智算中心建设、智算调度、计算架构、训练框架、数据接口、信息安全、软硬件规范等标准体系。依托Deeplink人工智能开放计算体系推动智算中心底层硬件与软件框架高效适配,加快相关算子库、编译器、驱动软件、开发环境等支撑工具研发,推动自主深度学习开源框架与智算中心开展广泛适配与融合优化。加快智算中心性能检测实验室建设,构建适配评测体系,实现智算中心软硬件技术的深度协同。

三、保障措施

(一)健全组织保障

市相关职能部门根据职责分工加强协同,做好重点任务保障,组织本市重点智算中心企业、芯片设计制造企业、算法模型开发企业、智算应用核心企业成立“算力浦江”智算行动推进工作组,合力推动智能算力基础设施优化布局与机制创新。依托“算力浦江”专委会、算力网络协会等行业组织加强智算生态打造,聚焦前沿技术攻关、产业链协同、跨域算力调度等协同任务,助力提升本市智算基础设施协同创新与产业赋能水平。

(二)加强要素保障

加强对智能算力基础设施要素保障。通过贴息贷款、专项补贴等方式持续引导在建和已建数据中心向智算中心演进,通过市区两级“算力券”等激励机制,引导智能算力通过集约化调度方式在上海算力交易平台、上海市人工智能公共算力服务平台集聚,推动智算中心国产算力应用。对于以智能算力为主,积极部署国产化智能算力资源的相关重点拟建数据中心,适当放宽项目能耗指标要求。以“疏堵结合,以疏为主”的原则,加强算力网络连接合规性保障。

(三)强化示范引领

组织评选在高效算力、绿色低碳、模型训练、产业赋能、算力调度等领域成效明显的智算中心,发布上海市智能算力中心“示范标杆”名单,形成一批可借鉴、可复制、可推广的典型案例并择优向国家推荐。开展智能算力典型应用场景征集,形成智算应用产业图谱,推进典型场景智算应用深化和普及。加强示范宣传,强化“算力浦江”品牌效应,形成媒体矩阵,共同提升上海智能算力基础设施创新示范效应。