因中国缺席而夺冠的美国超级电脑问题多 陆媒:效率仅6 成

今年因中国缺席而让美国夺回超级电脑第一名的橡树岭国家实验室前沿(Frontier)超级电脑问题不断,整体运算效率只能达到设计目标的60%。(图/美国橡树岭国家实验室)

今年5月因中国缺席而让美国夺回超级电脑第一名的橡树岭国家实验室前沿(Frontier)超级电脑问题不断,原订2022年投入运行,却因故障不断而延迟至2023年。据陆媒报导,这部全球第一台进入百亿亿次运算的Frontier超级电脑被曝自上线之初就问题重重,除了故障不断之外,整体运算效率只能达到设计目标的60%,而且目前尚未弄清楚问题出在哪里。

据《快科技》报导,今年6月,全球第一台百亿亿次超级电脑Frontier公开亮相,采用AMD Trento EPYC 7A53处理器与AMD Instinct MI250X GPU加速卡的组合,这也是AMD时隔10年重返超级电脑的巅峰之作,其性能相当于其后第2到第7名的总和。

报导说,Frontier超级电脑部署在美国能源部橡树岭国家实验室,最初计划2022年内全面投入运行,后来推迟到2023年,但现在却被曝出自上线之初就存在严重的问题,每天都故障不断。

Frontier系统可能于今年秋天提前交付,将在明年按期向科学界开放。(图/美国国家橡树岭实验室)

据表示,Frontier超算规划的FP64双精度浮点性能为1.685EFlops(168.5亿亿次计算/每秒),但目前只能勉强跑到1EFlops,也就是只能达到设计目标的60%。

造成此现象的具体原因仍不详,有一种说法是HPE Cray机柜使用的Slingshot网路互连系统与HPE集群存在冲突,另一种说法是Slingshot互连系统与AMD计算平台存在冲突,但究竟是哪个原因仍不得而知。

美国能源部百亿亿次运算项目对外联络负责人Mike Bernhardt声明称,感谢HPE、AMD的努力,Frontier系统可能于今年秋天提前交付,目前正在进行安装和集成,这是一项繁重、复杂的任务,但目前进展顺利,将在明年按期向科学界开放。

由美国田纳西州橡树岭国家实验室的巨型电脑Frontier,在今年5月为美国夺回了超级电脑运算速度世界第一的宝座,在超级电脑排名测试中,成为首台取得每秒百亿亿次运算性能的电脑。它是美国能源部于多年前投资18亿美元打造3部「百亿亿次级」电脑系统的其中之一,预料它能在科学、医学和其他领域发挥重大作用,是超级电脑工程的重要里程碑。

超级电脑专家指出,这项每秒百亿亿次运算性能竞赛中,Frontier比不上中国的2个电脑系统「神威」与「天河」,但今年这2个系统都没有提交测试结果供超级电脑500强排名评选,原因可能是美中的紧张关系。分析人士透露,中国的超级电脑已达到百亿亿次级的水准,很多人推测中国不希望引来美国的进一步制裁,所以未再参加评选。