国产超算"灵晟"以2.19EFlops登顶全球TOP500，时隔9年重回超算榜首

2026-06-24
84

关键词：灵晟超算 TOP500 灵晟 E级超算 ISC2026

6月23日，在德国汉堡举行的ISC2026国际超算大会上，全球超算TOP500榜单正式发布。由中国全国产自主研制的"灵晟"超级计算机以2.19EFlops（每秒219亿亿次）的持续双精度浮点性能登顶榜首。这是时隔9年，中国超算再次排名全球第一，也是世界首台持续性能突破2EFlops（二百亿亿次）的超算系统。

中国超算登顶史：从"天河"到"神威"再到"灵晟"

中国超算首次登顶全球TOP500是在2010年，"天河一号"以 Intel CPU 为核心拿下榜首，打破了美国长期垄断的局面。此后，"天河二号"从2013年6月至2015年11月连续6次蝉联世界第一。

这一连串的领先引起了美国的高度警觉。美国随后禁止Intel等芯片厂商向中国出口超算CPU。面对封锁，中国转向自研道路，以申威自主CPU替代进口芯片。2016年，搭载申威CPU的"神威·太湖之光"再次登顶，并连续4次（2016年至2018年）蝉联世界第一，彻底证明了中国在超算领域的自主实力。

2018年6月，美国橡树岭国家实验室的"Summit"以122.3 PFlops的性能超越"神威·太湖之光"（93.0 PFlops），终结了中国超算的榜首时代。此后，中国自2021年起不再向TOP500提交新一代、性能更强的超算系统进行测试，导致"神威·太湖之光"和"天河二号A"的排名持续下滑——到2025年底，前者已降至第21位，后者排在第31位。但这并不意味着中国超算实力停滞，而是新一代"国之重器"选择了低调潜行。

全国产全栈自主的E级超算"灵晟"

此次登顶的"灵晟"由国家超级计算深圳中心发布，总设计师为中山大学教授、国家超算深圳中心主任卢宇彤。它是一台面向科学工程智能计算的国产全栈融合基础设施，从芯片、网络、存储到系统软件，全部实现自主可控。

与当前主流超算普遍采用的CPU+GPU异构架构不同，"灵晟"首创了Online Acceleration全CPU架构，打破传统异构壁垒，内嵌AI矩阵加速单元，回归计算加速本质，实现了超算与智算等多种计算模式的高效协同。

在技术参数层面，"灵晟"的核心突破包括：

芯片层：搭载自研LX2 CPU，创新性引入多精度与矩阵加速能力，实现片上超算算力与智能算力深度融合；集成首颗国产片上内存（HBM），内存带宽相比传统CPU提升10倍。

网络层：自主设计的"灵启"高速互连网络，可支持200万个端口、10万节点的超大规模组网。

存储层：采用分层架构，兼顾高性能作业区与容量型数据区，可扩展至E级规模。

系统层：构建大规模超智融合框架，自研全栈软件，将底层硬件能力以可用、可编程、可优化的方式释放给应用。

能效：首创100%全液冷散热计算机柜，以51GFlops/W的能效比，在登顶全球算力的同时树立绿色计算新标杆。

在应用层面，自部署以来，"灵晟"已支撑大气海洋、工程仿真、材料科学、药物发现、脑科学、科学AI、大模型推理等多领域应用，支持混合精度计算、工作流和复杂多任务并行运行。在大规模并行环境下，其平均扩展效率达84.4%，实现了超过千万核心的全系统高效可扩展运行。

图灵奖得主、美国田纳西大学教授Jack Dongarra评价称："中国的'灵晟'系统让世界看到了超算通向AI4Science新型系统架构的希望之光。"

颁奖仪式

为何选择纯CPU架构？

在美国持续限制高端GPU对华出口的背景下，中国超算选择了一条不依赖外部GPU的全CPU路径。这一路线避免了异构计算中CPU与GPU之间昂贵且耗带宽的数据传输、复杂的编程模型、GPU内存限制以及加速器专用软件栈等问题。同时，CPU-only系统结合HBM和大容量DDR能力，可拥有更大的连贯内存池，更自然地与传统高性能计算环境集成，尤其适合将AI与大规模科学模拟、数据分析深度融合的"AI for Science"场景。

榜单前十：美欧日紧随其后

本次TOP500榜单中，"灵晟"登顶后，其他超算排名顺延：

第2名：美国劳伦斯·利弗莫尔国家实验室的El Capitan，1.809 Exaflop/s

第3名：美国橡树岭国家实验室的Frontier，1.353 Exaflop/s

第4名：美国阿贡国家实验室的Aurora，1.012 Exaflop/s

第5名：德国于利希超级计算中心的JUPITER Booster，1.000 Exaflop/s

第6名：意大利能源公司埃尼集团的HPC7，571.5 Petaflop/s（首次亮相）

第7名：微软Azure云平台的Eagle系统

第8名：意大利埃尼的HPC6

第9名：日本Fugaku，442 Petaflop/s

第10名：瑞士Alps，434.9 Petaflop/s

TOP500在新闻稿中指出，超级计算领域的高端架构正呈现显著多样性。从全CPU架构的"灵晟"，到配备AMD加速器的HPE Cray集群（El Capitan、Frontier），再到采用英伟达Grace Hopper架构的JUPITER Booster和Alps，乃至搭载英特尔Ponte Vecchio GPU的Aurora，没有哪一种架构占据绝对主导地位。这份榜单表明，通往领先级计算领域并没有单一技术路径。

九年，23倍跃升

从2017年"神威·太湖之光"的93 Petaflop/s到2026年"灵晟"的2.198 Exaflop/s，中国超算在近九年时间里完成了超过23倍的性能跃升。"灵晟"的登顶不仅是一次算力性能的突破，更是在特殊技术封锁背景下，中国超算完成全栈自主可控、探索独立技术路线的历史性跨越。

来源：电子工程专辑