NVIDIA让全球 TOP500超级电脑 不只加快运算速度 还变更聪明

全球这批运算速度最快的超级电脑中,有近七成皆使用 NVIDIA 的技术,而且当中对越来越多超级电脑使用人工智慧 (AI) 技术,协助研究人员在更短时间内发现新的事物。

这些世界上运算速度最快的超级电脑,不只是比过去提高了运算速度,也变得更聪明,还能支援处理更多种类的作业负载。

于 SC20 大会上发布的全球最高速超级电脑 TOP500 最新榜单中,有近七成的超级电脑都采用 NVIDIA 的技术,这包括前十名中的八台。

而在超级运算领域内最负盛名的戈登贝尔奖 (Gordon Bell Prize) 入围名单中 (本周将于 SC20 大会公布得奖名单),有四组入围提名的研究团队,均使用 AI 来推动发现研究成果

他们的共通点为使用 NVIDIA 的端到端 HGX AI 超级运算平台,这个平台加快处理科学运算、资料分析及 AI 等作业负载。这一切始于效能晶片超高速智慧网路,然而最终都回归到全球采用的 NVIDIA 资料中心规模平台,以协助研究人员进行各项伟大的科学研究工作

把 AI 纳入高效能运算 (HPC) 领域和跨越传统超级运算中心领域的平台,这项转变代表着这个领域的重大变革。打从 Seymour Cray 在1964年推出 CDC 6600 以来,这个领域便不断致力于利用规模日渐庞大、执行能力越来越强的机器,以执行需要繁杂运算作业的模拟和建模作业。

最新的 TOP500 榜单不只能看到超级电脑在进行高效能运算的 Linpack 成绩:

速度纪录:以传统的超级运算效能为基准 (也就是执行 FP64 双精度浮点运算所需的速度) 进行测量,NVIDIA 的技术加快了这些全球最快运算丛集的执行速度,前十名的超级电脑中有八台采用 NVIDIA 的技术。其中包括排名第五的Selene 超级电脑,这是NVIDIA 自家的超级电脑,也是世界上最强大的商用系统。还有新加入的系统,像是排名第七的 JUWELS (德国于利希研究中心) 及排名第十的 Dammam-7 (沙乌地阿拉伯国家石油公司)。

「智慧」纪录:使用 AI 运算效能基准的混合精度标准 HPL-AI 来进行测量时,搭载 NVIDIA 技术的超级电脑同样位居前几名,像是橡树岭国家实验室 (Oak Ridge National Laboratory) 的 Summit 超级电脑为 0.55 exaflops,NVIDIA 的 Selene 超级电脑为 0.25 exaflops。

环保纪录:NVIDIA DGX SuperPOD 系统在 Green500 最高运算效率超级电脑榜单上勇夺冠军,其运算效率写下全新世界纪录,达到每瓦 26.2 gigaflops。整体而言,在 Green500 榜单上的前 30 名中,有25台超级电脑搭载 NVIDIA 的技术。

AI 超级运算时代正飞速发展,或许这是最让人刮目相看的成就:我们已经稳妥地提前完成 exascale 等级的运算目标。

义大利的 CINECA 超级计算中心十月时公布将计划打造全球最强大的 AI 超级电脑 Leonardo,预计 AI 运算效能将达到 10 exaflops。捷克卢森堡斯洛维尼亚也赶上这波热潮,发布了多台全新 EuropHPC AI 系统。除了欧洲之外,亚洲与北美地区也将建造更多 AI 超级电脑。

原因在于现代的 AI 使用 NVIDIA GPU、NVIDIA CUDA-X 函式库,还有世界上唯一的智慧全加速网路内运算平台 NVIDIA Mellanox InfiniBand,它们极为杰出的平行处理能力将大量资料注入先进的神经网路,打造出现实世界中这些精密复杂的模型,使得科学家们能够完成透过其它方式无法处理的研究案。

比起过去入围者用以进行模拟作业的最大规模系统,入围今年戈登贝尔奖的劳伦斯伯克利国家实验室 (Lawrence Berkeley National Laboratory) 运算研究部门的团队运用 AI,将其分子动力学的模拟规模至少扩大了百倍。

系统速度很重要没错,更重要的是在现实环境中的用途。这正是各位会看到搭载 AI 的新型超级电脑,会投入于对抗新冠肺炎病毒前线的原因。

入围今年戈登贝尔特别奖的四组团队中,有三组靠着 NVIDIA 的 AI 技术,投注精力于对抗遍及全球的新冠肺炎病症上。

一支研究团队训练出的 AI,在劳伦斯利弗莫尔国家实验室那台于 TOP500 榜单夺下第三名的 Sierra 超级电脑上,只要短短23分钟便能从 16亿种化合物中辨识出新的候选药物

另一支研究团队在橡树岭国家实验室那台于 TOP500 榜单中排名第二的 Summit 超级电脑上,使用27,612个 NVIDIA 的 GPU,每秒对两个关键的 SARS-CoV-2 蛋白结构进行19,028种潜在药物成分测试。

另一支团队则是使用 Summit 超级电脑来建立一项 AI 工作流程,以模拟主要的病毒感染机制 SARS-CoV-2 棘状蛋白是如何攻击人类的血管张力素转化酵素 (ACE2) 受体

各领域纷纷采用具扩展能力的 NVIDIA HGX AI 超级运算平台 (当中包括从处理器到网路和软体在内),科学家可以在云端运算服务公司的超大规模资料中心与超级电脑中运行其作业负载。

在这个统一的平台上可以融合处理高效能运算、资料分析及 AI 等作业负载。这个平台上有230万名开发者,支援超过1,800个加速应用程式,以及各种 AI 框架与包括 DASK 和 Spark 在内的热门资料分析框架,使得科学家与研究人员能够在搭载 GPU 的 x86、Arm 及 Power 系统上,即时处理各项工作。

NVIDIA NGC 目录还为最新版本的高效能运算及 AI 应用程式,提供了经过效能最佳化的容器,科学家与研究人员就能快速完成部署,把心力放在推动科学发展上。