国产超算"灵晟"以2.19EFlops登顶全球TOP500,时隔9年重回超算榜首

国产超算"灵晟"以2.19EFlops登顶全球TOP500,时隔9年重回超算榜首

  • 2026-06-24
  •  84

关键词: 灵晟超算 TOP500 灵晟 E级超算 ISC2026

6月23日,在德国汉堡举行的ISC2026国际超算大会上,全球超算TOP500榜单正式发布。由中国全国产自主研制的"灵晟"超级计算机以2.19EFlops(每秒219亿亿次)的持续双精度浮点性能登顶榜首。这是时隔9年,中国超算再次排名全球第一,也是世界首台持续性能突破2EFlops(二百亿亿次)的超算系统。

中国超算登顶史:从"天河"到"神威"再到"灵晟"

中国超算首次登顶全球TOP500是在2010年,"天河一号"以 Intel CPU 为核心拿下榜首,打破了美国长期垄断的局面。此后,"天河二号"从2013年6月至2015年11月连续6次蝉联世界第一。

这一连串的领先引起了美国的高度警觉。美国随后禁止Intel等芯片厂商向中国出口超算CPU。面对封锁,中国转向自研道路,以申威自主CPU替代进口芯片。2016年,搭载申威CPU的"神威·太湖之光"再次登顶,并连续4次(2016年至2018年)蝉联世界第一,彻底证明了中国在超算领域的自主实力。

2018年6月,美国橡树岭国家实验室的"Summit"以122.3 PFlops的性能超越"神威·太湖之光"(93.0 PFlops),终结了中国超算的榜首时代。此后,中国自2021年起不再向TOP500提交新一代、性能更强的超算系统进行测试,导致"神威·太湖之光"和"天河二号A"的排名持续下滑——到2025年底,前者已降至第21位,后者排在第31位。但这并不意味着中国超算实力停滞,而是新一代"国之重器"选择了低调潜行。

全国产全栈自主的E级超算"灵晟"

此次登顶的"灵晟"由国家超级计算深圳中心发布,总设计师为中山大学教授、国家超算深圳中心主任卢宇彤。它是一台面向科学工程智能计算的国产全栈融合基础设施,从芯片、网络、存储到系统软件,全部实现自主可控。

与当前主流超算普遍采用的CPU+GPU异构架构不同,"灵晟"首创了Online Acceleration全CPU架构,打破传统异构壁垒,内嵌AI矩阵加速单元,回归计算加速本质,实现了超算与智算等多种计算模式的高效协同。

在技术参数层面,"灵晟"的核心突破包括:

芯片层:搭载自研LX2 CPU,创新性引入多精度与矩阵加速能力,实现片上超算算力与智能算力深度融合;集成首颗国产片上内存(HBM),内存带宽相比传统CPU提升10倍。

网络层:自主设计的"灵启"高速互连网络,可支持200万个端口、10万节点的超大规模组网。

存储层:采用分层架构,兼顾高性能作业区与容量型数据区,可扩展至E级规模。

系统层:构建大规模超智融合框架,自研全栈软件,将底层硬件能力以可用、可编程、可优化的方式释放给应用。

能效:首创100%全液冷散热计算机柜,以51GFlops/W的能效比,在登顶全球算力的同时树立绿色计算新标杆。

在应用层面,自部署以来,"灵晟"已支撑大气海洋、工程仿真、材料科学、药物发现、脑科学、科学AI、大模型推理等多领域应用,支持混合精度计算、工作流和复杂多任务并行运行。在大规模并行环境下,其平均扩展效率达84.4%,实现了超过千万核心的全系统高效可扩展运行。

图灵奖得主、美国田纳西大学教授Jack Dongarra评价称:"中国的'灵晟'系统让世界看到了超算通向AI4Science新型系统架构的希望之光。"

颁奖仪式

为何选择纯CPU架构?

在美国持续限制高端GPU对华出口的背景下,中国超算选择了一条不依赖外部GPU的全CPU路径。这一路线避免了异构计算中CPU与GPU之间昂贵且耗带宽的数据传输、复杂的编程模型、GPU内存限制以及加速器专用软件栈等问题。同时,CPU-only系统结合HBM和大容量DDR能力,可拥有更大的连贯内存池,更自然地与传统高性能计算环境集成,尤其适合将AI与大规模科学模拟、数据分析深度融合的"AI for Science"场景。

榜单前十:美欧日紧随其后

本次TOP500榜单中,"灵晟"登顶后,其他超算排名顺延:

第2名:美国劳伦斯·利弗莫尔国家实验室的El Capitan,1.809 Exaflop/s

第3名:美国橡树岭国家实验室的Frontier,1.353 Exaflop/s

第4名:美国阿贡国家实验室的Aurora,1.012 Exaflop/s

第5名:德国于利希超级计算中心的JUPITER Booster,1.000 Exaflop/s

第6名:意大利能源公司埃尼集团的HPC7,571.5 Petaflop/s(首次亮相)

第7名:微软Azure云平台的Eagle系统

第8名:意大利埃尼的HPC6

第9名:日本Fugaku,442 Petaflop/s

第10名:瑞士Alps,434.9 Petaflop/s

TOP500在新闻稿中指出,超级计算领域的高端架构正呈现显著多样性。从全CPU架构的"灵晟",到配备AMD加速器的HPE Cray集群(El Capitan、Frontier),再到采用英伟达Grace Hopper架构的JUPITER Booster和Alps,乃至搭载英特尔Ponte Vecchio GPU的Aurora,没有哪一种架构占据绝对主导地位。这份榜单表明,通往领先级计算领域并没有单一技术路径。

九年,23倍跃升

从2017年"神威·太湖之光"的93 Petaflop/s到2026年"灵晟"的2.198 Exaflop/s,中国超算在近九年时间里完成了超过23倍的性能跃升。"灵晟"的登顶不仅是一次算力性能的突破,更是在特殊技术封锁背景下,中国超算完成全栈自主可控、探索独立技术路线的历史性跨越。


来源:电子工程专辑