关键词: OpenAI 博通 Jalapeño AI推理芯片
当地时间6月24日,OpenAI与半导体巨头博通(Broadcom)联合发布首款定制芯片Jalapeño(西班牙语意为"墨西哥辣椒")。这是一款专为大语言模型(LLM)推理设计的专用集成电路(ASIC),从立项设计到成功流片仅耗时9个月。首批工程样片已完成实验室验证,预计2026年底实现大规模量产,配套建设千兆瓦级数据中心集群。
在分工层面,OpenAI负责芯片的底层架构设计;博通负责硅片实现(代工制造)及网络硬件,包括其Tomahawk网络芯片;加拿大电子制造服务商Celestica负责板卡与机架系统的集成配套。
发布现场,博通CEO陈福阳(Hock Tan)与总裁Charlie Kawwas将首批工程样片正式交到了OpenAI CEO山姆·奥特曼(Sam Altman)和总裁格雷格·布罗克曼(Greg Brockman)手中。

双方的合作早在18个月前就已启动。2025年10月,OpenAI与博通对外公布量产规划,明确将在2026年下半年推出由OpenAI主导设计、支持整机柜交付的自研AI芯片。双方已就AI加速器的联合开发和供应达成长期协议,计划联合开发10吉瓦(GW)算力的定制AI加速器。
Jalapeño是一款面向大语言模型推理场景量身打造的ASIC专用芯片,可适配各类大语言模型。与英伟达通用GPU相比,ASIC可编程灵活性更低,但可针对AI专属任务深度优化,成本优势显著。
在架构层面,该芯片重点优化数据流架构,减少了数据移动,实现了计算、内存与网络资源的均衡配置,使实际利用率更接近理论峰值性能。OpenAI负责硬件项目的理查德·何(Richard Ho)表示,团队围绕对前沿AI模型最为关键的内核、内存传输、网络以及服务模式,对架构进行了全面优化。

在实测数据方面,首批工程样片已在实验室以量产标准的频率和功耗条件下稳定运行机器学习任务,并成功跑通OpenAI今年2月推出的代码模型GPT-5.3-Codex-Spark。OpenAI方面表示,早期测试表明,Jalapeño的每瓦性能(能效比)将显著优于当前业界最先进水平。博通CEO陈福阳透露,该AI加速器相比传统GPU可节省约50%的成本。有关性能的详细技术报告将在未来几个月内发布。
Jalapeño的流片标志着OpenAI打破了纯软件与算法层面的局限,迈出了软硬一体基础设施建设的关键一步。
在早期阶段,OpenAI主要通过独家绑定云厂商、以资本换算力的方式获取算力——接受微软投资,租用由数万枚英伟达GPU组成的微软Azure专属集群进行模型训练与托管。
2024年至2025年,OpenAI开始进行多元化供应链平衡。在维持与微软核心合作的同时,公司与甲骨文等第三方云服务商达成算力租赁协议,并在模型层面引入MRC(多径可靠连接)协议,联合AMD、博通、英特尔、英伟达及微软,优化多芯片间的高速通信,压榨硬件极限。
OpenAI总裁布罗克曼坦言,当前公司算力供给始终跟不上业务扩张速度。选择在2026年中期推出Jalapeño,是高昂运营成本、市场竞争及供应链压力交织的必然结果。目前行业主流模型推理端算力消耗已逐渐超过训练端,摆脱单一供应商依赖也是厂商的共性选择。
在AI芯片领域,自研或深度定制已成为头部企业的共同选择。
谷歌凭借自研TPU系列芯片,在算力成本控制和软硬协同优化上展现出巨大的利润空间,是业内最早实现大规模AI芯片自研的科技公司。
微软、Meta及亚马逊等AI领域头部企业近期也相继推出定制化AI芯片,用于其服务器端的模型训练或推理运算,但在综合性能层面仍与英伟达芯片存在一定差距。
Anthropic则采取与亚马逊、谷歌两大云厂商深度资本与算力绑定的策略,同时联合多家算力、硬件厂商搭建多元算力底座。
博通作为此次OpenAI的合作伙伴,其六大核心客户的算力需求近乎无限。陈福阳表示,现有产能完全无法满足市场需求,算力紧缺不止会持续2026、2027年,预计2028年行业算力需求还会继续攀升。
按照规划,Jalapeño芯片预计于2026年底实现小规模首批部署,2027年迎来快速爬坡阶段,2028年上半年实现全面规模化量产落地。远期规划总耗电量最高将达到10吉瓦。

OpenAI将Jalapeño定位为多代计算平台的首个里程碑,是OpenAI"为自有模型与产品搭建全栈技术体系"战略的关键一步。布罗克曼表示:"通过自主研发更多底层技术环节,我们可以用更高效率提供智能服务,持续推动前沿人工智能技术实现规模化普惠落地。"
此次芯片发布也加剧了外界对OpenAI IPO的猜测。奥特曼近日表示,公司正考虑"在未来一年内"进行公开上市。Coinbase已推出与OpenAI相关的Pre-IPO期货,进一步助长了外界对OpenAI正在为自身上市做准备的猜测。
来源:电子工程专辑