算力狂飙下的“能效”革命:英诺达如何用国产EDA给AI芯片“降功耗”?

算力狂飙下的“能效”革命:英诺达如何用国产EDA给AI芯片“降功耗”?

  • 2025-11-26
  •  51

关键词: 算力需求,能耗挑战,芯片功耗,功耗设计瓶颈,英诺达解决方案

在人工智能与高性能计算迅猛发展的今天,全球算力需求呈现爆发式增长,而随之而来的能耗问题已成为制约行业可持续发展的关键瓶颈。

2025年11月25日,在全球CEO领袖峰会上,英诺达创始人、CEO王琦博士以“算力澎湃,能效致胜”为题,剖析了大算力时代下芯片设计面临的能耗挑战,并分享了国产EDA企业在低功耗技术路径上的创新与实践。他表示:“唯有从设计源头系统性地解决功耗问题,才能真正突破大算力时代的能效瓶颈。”

算力爆发的背后:日益严峻的能耗挑战

根据中国信通院《绿色算力发展研究报告》(2025)数据显示:2025至2030年间,全球数据中心累计IT设备负载将新增106GW,年均增长达17.7GW。这一数字背后,是AI服务器作为核心驱动力所带来的巨大能源压力。

为更直观地理解这一规模,王琦博士做了一个生动的类比:中国三峡水电站的总装机容量约为22.5GW。这意味着,年均新增的17.7GW负载,相当于每年需新增近0.8个三峡水电站的发电能力;而规划期内全部新增负载,则需近5个三峡电站满负荷运行才能满足;若以核电为参照,一个典型核电机组的功率约为1GW,那么每年新增负载相当于需新建17至18台核电机组。

在微观层面,单次AI请求的耗电量同样令人震惊。一次标准Google搜索耗电约0.3Wh,而一次AI驱动的Google搜索耗电高达8.9Wh,提升近30倍(中国信通院《绿色算力发展研究报告》(2025))。王琦指出:“这还只是开始。当前AI系统的能效,距离人类智能的‘节能水平’仍有巨大差距。”

芯片功耗的急剧攀升:从300W将到2000W的挑战

随着制程工艺与架构迭代,AI/HPC加速芯片的热设计功耗持续攀升。据SemiAnalysis数据,该类芯片的TDP(Thermal Design Power,热设计功耗)从2017年的约300W迅速增长至1400W,未来很可能突破2000W。英伟达、AMD等厂商的产品均呈现相同趋势。

以英伟达H100 GPU为例,其TDP达700W,而新一代GPU产品功耗提升至1400W。相比之下,CPU的功耗增长较为平缓。一般家用蒸汽电熨斗的功耗通常在1000瓦到2500瓦之间,取中间值则是1500瓦。也代表新一代GPU的功耗水平已接近家用电器如电熨斗的功耗水平,这迫使数据中心必须采用液冷等先进散热方案。

功耗问题不仅是技术问题,更是商业战略问题

在算力爆发的时代,芯片功耗问题已经超越了传统意义上的技术范畴,演变为影响企业核心竞争力的战略要素。王琦博士对此有着深刻的洞察,他将高功耗带来的挑战系统性地归纳为三个关键维度:

技术维度:物理极限的严峻挑战随着制程工艺的不断演进,芯片面临的功耗挑战呈现出三重技术困境:动态功耗呈指数级增长,电源管理复杂度急剧上升,散热方案逐渐逼近物理极限。迫使整个行业转向液冷等更先进的散热方案。然而,这仅仅是治标不治本的应对之策。

商业维度:市场竞争力的直接威胁在商业层面,功耗问题直接转化为企业的经营压力。过高的功耗导致产品在能效比这一关键指标上失去竞争力,制造成本因需要复杂的电源管理和散热系统而大幅攀升,更重要的是,为了解决功耗问题而延长的开发周期直接影响了产品的上市时间。

战略维度:发展路径的根本抉择王琦博士表示:“当前行业中‘重散热、轻能效’的做法,就像发烧了就吃退烧药,咳嗽就用止咳药,只解决表面症状而不究其根本。而我们应该学习中医思维,注重系统调理,从设计源头控制功耗。”

这种理念的差异反映了企业在技术路线上的战略选择。是继续沿着“高功耗-强散热”的老路艰难前行,还是转向“源头控制、系统优化”的新路径,这已经成为一个关乎企业长远发展的战略决策。

功耗设计流程的三大瓶颈

在深入分析行业痛点的基础上,王琦博士指出了当前芯片设计流程中存在的三个根本性瓶颈,这些瓶颈严重制约了功耗优化工作的效率和效果。

瓶颈一:优化窗口的时效性困境“功耗优化必须宜早不宜迟”,这是他反复强调的核心观点。当前行业中普遍存在的误区是将功耗优化工作后置,待到设计后期甚至流片前才着手解决。然而,功耗优化的效果与介入时机密切相关。一旦错过早期优化窗口,后续能够采取的优化措施将极其有限,效果也会大打折扣。

瓶颈二:分析效率的工程学挑战精度功耗分析严重依赖后仿真的完成,这个过程通常需要数天甚至数周时间。以一个中等规模的AI芯片设计为例,完成一次完整的后仿真可能需要2-3周时间,期间需要处理数十GB的波形文件,消耗大量的计算资源。这种漫长的分析周期严重制约了设计迭代的速度,使得工程师难以及时获得反馈并进行优化调整。

瓶颈三:工具生态的协同性难题现代芯片设计流程中使用的工具链存在割裂现象。各个设计阶段使用不同的工具和功耗模型,数据格式不统一,信息传递不畅。这种割裂导致设计团队需要在不同工具间进行频繁的数据转换和验证,不仅大幅增加了工作量,还引入了额外的误差风险。更重要的是,这种碎片化的工具生态使得全局性的功耗优化难以实施。

英诺达的破局之道:全流程协同的解决方案

面对以上瓶颈,英诺达提出了“前端介入、全程协同”的解决方案。EnFortius®凝锋®系列低功耗EDA工具。实现在架构设计、RTL编码等早期阶段就开展功耗优化工作。

其中,EnFortius® RTL Power Explorer(ERPE)能够在设计早期自动识别功耗优化机会,实测可帮助客户降低动态功耗;而EnFortius® Gate-level Power Analyzer(EGPA)通过创新的波形重放功能,将功耗分析周期从数周缩短至数小时,同时保证精度在签核工具的3%以内。

这种全流程的协同优化模式,不仅解决了各个阶段的具体问题,更重要的是建立了贯穿始终的功耗优化体系,使功耗管理从被动应对转变为主动规划,从局部优化升级为系统优化。

正如王琦博士所言:“我们正在推动一场芯片设计方法的革命——从依赖个人经验的艺术,转向基于数据驱动的科学。”这场变革的核心,就是要打破传统设计流程中的壁垒,实现功耗优化的前置化、系统化和智能化。

除此之外,英诺达曜奇®系统验证云平台(EnCitius® System Verification Studio),该平台具备以下特点:基于Palladium Z1/Z2/Z3硬件仿真系统构建,其总仿真容量超100亿门,单设计最大容量达46亿门;提供PCIe、CXL、USB、Video、Ethernet等各类接口板;数据加密传输、物理隔离、专业防火墙保障客户设计安全。

同时,他还介绍说,该平台不仅提供仿真资源,更与EnFortius工具链深度融合,实现“基于硬件的功耗验证闭环”,为功耗分析提供准确的信号活动信息,助力客户在早期完成架构优化与功耗调优。

结语:AI算力发展正从粗放阶段”走向精细时代

在王琦看来,AI算力发展正从“大力出奇迹”的粗放阶段,转向“高能效、高智慧”的精细时代。“唯有从设计源头系统性地解决功耗问题,才能真正突破大算力时代的能效瓶颈。”

英诺达以“性能优先”为突破点,通过工具链与云平台的双轮驱动,正逐步赢得国内先进设计公司的认可。王琦总结道:“我们不一定能在所有点上超越国际巨头,但我们可以在关键路径上做得更快、更早、更聪明——这正是国产EDA的价值所在。”

责编:Clover.li

来源:国际电子商情