
在AI工作负载爆发式增长与数据中心基础架构面临代际更迭的关键节点,英特尔于5月28日举办了一场媒体预沟通会,正式揭开了其下一代数据中心CPU——至强6+处理器(代号Clearwater Forest)的面纱。
作为英特尔首款基于Intel 18A制程工艺的数据中心级产品,至强6+不仅将核心密度推向了新的高度,更试图重新定义数据中心在能效、密度与AI原生时代的角色。

英特尔公司执行副总裁兼数据中心事业部总经理Kevork Kechichian表示:“能够参与到该芯片的开发和代工过程,并亲眼见证过去一年英特尔代工业务和数据中心产品所发生的巨大转型,这确实是我的梦想之一。” Kechichian进一步指出:他在去年出任数据中心事业部总经理,从客户那里反复听到的核心诉求,至强6+是英特尔亲临一线、倾听需求,并将之转化为覆盖从传统数据库、网络到新兴AI推理的多样化解决方案。
Intel 18A+Foveros Direct 3D封装
至强6+是首款基于Intel 18A制程的服务器CPU,该工艺集成了PowerVia背面供电技术和RibbonFET环栅晶体管技术。而在此之前,英特尔面向客户端推出的Panther Lake处理器的已经验证了Intel 18A的成功。
据介绍,与 FinFET 晶体管架构相比,RibbonFET 栅极结构完全包裹在通道周围(由器件核心的硅纳米片堆栈定义),可以最大限度地减少晶体管关闭时不需要的漏电流。较小的漏电流意味着芯片运行时浪费的能量更少。
PowerVia 背面供电技术则是将原本位于晶圆正面的供电电路,转移到晶圆的背面,并在每个标准单元中嵌入纳米级硅通孔(nano TSV),从而实现了供电线与信号线的分离,晶体管的供电路径变得更加直接高效,可以提高供电效率,减少损耗。按照英特尔的说法,PowerVia 可以提升标准单元利用率最多达10%,从而可以提高晶体管密度,并减少最多30%压降,提升芯片运行频率最多6%。
英特尔数据中心芯片工程团队负责人Tim Wilson也指出,PowerVia通过更短、更直接的供电路径来有效降低功耗,而RibbonFET则显著降低了待机功耗,增强了性能一致性。

根据英特尔此前公布的数据显示,与Intel 3 工艺相比,Intel 18A 在相同的功率下可以实现30%的频率提高,或者在相同的性能水平下,降低25%的功耗。
在架构设计上,至强6+代表了英特尔面向数据中心的芯片解耦架构的又一次重大演进。从第三代至强的单裸片,到第四代、第五代通过EMIB技术连接两大模块,再到至强6引入分离的I/O Tile与计算Tile,至强6+此次则采用了更为激进的“Foveros Direct 3D”封装技术。

据介绍,至强6+由12个基于Intel 18A的计算Tile、3个基于Intel 3的Active Base Die、2个基于Intel 7制程的IO Tile,以及12个用于互联的EMIB Tile构成,总计29个组件。计算Tile与Base Die之间通过高密度的混合键合(Hybrid Bonding)技术互联,构建了一个极宽的片间总线,以确保跨Die访问的时钟延迟被控制在较低水平。

对于Compute Tile之间缓存延迟可能不一致的疑问,英特尔表示,设计上并未采用计算Core与L3缓存的固定对应关系,而是通过分布式的哈希算法,使所有核心对末级缓存(LLC)的访问能够被均匀地分散和平均化,以避免特定区域出现拥塞,从而保障不同工作负载下性能的稳定。
288核心,每瓦性能提升55%
在具体规格方面,至强6+提供业界最高的内核密度,单Socket拥有多达288个能效核(E-core),这一数字较上一代产品实现了翻倍。内存子系统方面,它支持12通道DDR5,速率高达8000 MT/s,并配备了高达576MB的末级缓存,英特尔称其缓存容量较上一代提升超过5倍。该平台还提供了96条PCIe Gen 5通道,并支持单路和双路配置,这些规格升级带来了显著的代际性能跃升。

之前的资料显示,至强6+采用的是Darkmont能效核架构,相较于前代Sierra Forest,在相同功耗下,单核性能(IPC)提升了17%。
Tim Wilson给出的数据作为显示:与上一代对应规格产品相比,至强6+在主流数据中心工作负载下的整体性能最高可提升至2.26倍,每瓦性能最高可提升55%。在与主流竞品的对比中,至强6+提供了高达30%的每线程性能提升,以及在虚拟化数据中心负载中作为关键指标的每线程每瓦性能30%的提升。

这种能效优势在客户整合现有基础设施时体现得尤为明显。据测算,从第二代至强可扩展处理器升级,至强6+可实现高达9:1的服务器整合比例,相当于减少近80%的物理空间占用,同时节省约73%的能源。
英特尔至强产品总监Kira Boyko在沟通会上引用爱立信的测试数据称,在与上一代E-core相同的核心数量下,至强6+在分组核心网中的性能提升了30%,每瓦性能提升超过60%,运行期间机架功耗降低了38%。

据介绍,目前AMAX、华擎、华硕、戴尔、鸿海、技嘉、HPE、联想、微星等OEM和ODM厂商正在开发基于至强6+的相关解决方案,可提供更高级别的密度规格,为客户带来更广泛的选择。

值得一提的是,至强6+能直接安装在为至强6性能核处理器(代号Granite Rapids AP)设计的现有服务器平台(Birch Stream AP)上,无需更换主板,可实现平滑升级。
智能体时代,CPU重回中心
随着云端的AI工作负载开始由训练转向推理,特别是智能体(Agentic AI)的兴起,对于服务器CPU的需求发生了巨大变化。
Kechichian将云端的工作负载划分为三类:需要高密度计算的横向扩展负载与网络、需要平衡性能与吞吐的通用负载,以及计算密集型的AI负载。他指出,当前基础工作负载与AI工作负载的增长大致各占一半,而一个明显的趋势是,需求正从以训练为主的“前沿模型”向推理侧迁移,智能体的兴起正重塑数据中心架构。

“在智能体范式下,我们看到CPU重新回到了核心位置。” Tim Wilson分析道,智能体工作流是多步骤、多推理、多计算的,它会繁衍出多个子智能体去协同完成复杂任务。此时,CPU的角色从过去单纯的推理参与者,转变为核心的编排与调度者。这一变化直接影响了系统内CPU与GPU的比例,正从以往训练场景中常见的1:4甚至1:8,向着1:2、1:1甚至更高的CPU配比演变。
英特尔数据中心集团技术产品总监杨锦文(Jinwen)在采访中进一步解释称:“随着生成式AI带来的需求,CPU需要承担的工作越来越多、越来越复杂。在调度、工具调用和反复执行的过程中,CPU与GPU的配比正在发生反转。” 这意味着,能够提供高密度、高能效、高内存带宽的CPU,将在未来的数据中心中占据更为关键的地位。而至强6+的288核设计,正是为了在单颗CPU上部署更高密度的智能体。据其透露,在常规云服务配置下,一颗288核的至强6+可以轻松支持400-500个以上的并发智能体。
此外,英特尔还透露了将于2027年推出的代号Diamond Rapids的下一代P-core服务器CPU的部分细节。

据介绍,该CPU将基于英特尔最新的Intel 18A-P制程工艺,具有统一内存延迟特性的可扩展SoC架构;针对那些对带宽有严格限制的应用程序,提升了2倍的通道数量和传输速度;支持PCIe Gen 6,在需要大量进行读写操作的场景中,能够实现极高的处理速度和出色的扩展性;针对高需求场景进行了优化,核心数量将提升50%,能够实现高性能的线程处理能力。
安全、遥测与新一代以太网
伴随高密度多租户环境中智能体的快速启停,安全与能效洞察成为必选项。至强6+搭载了英特尔软件防护扩展(SGX)和可信域扩展(TDX)用于机密计算,并新增了密码学算法加速指令集,据称其性能较上一代提升高达15倍,较主要竞争对手高出6倍。

此外,英特尔推出了一项名为“应用能效遥测技术”(AET)的新硬件功能,可在工作负载层级实时监测CPU核心的功耗与运行状态。这为数据中心运营商实现精细化的资源编排、成本分摊和能效优化提供了直接手段。

为了不让网络成为系统瓶颈,英特尔同步发布了全新的以太网解决方案E835。该以太网控制器支持高达200 GbE吞吐量,具备RDMA和动态设备个性化(DDP)技术,专为至强6+等高核心数平台设计。

E835卖点依然集中在能效上:在全双向200G线速运行时,E835的功耗比同类产品低28%至47%,最终实现了1.4到1.9倍的每瓦性能比提升。在5G专网等边缘场景,E835与至强6+配合,还能实现约10纳秒精度的低成本时钟提取与分发功能。
Crescent Island:基于Xe3P架构,支持LPDDR5X内存
在AI加速器方面,英特尔数据中心GPU产品线负责人Anil介绍了代号为“Crescent Island”的下一代数据中心GPU。该产品将是首款基于Xe3P架构的数据中心GPU,专为AI推理和智能体工作负载优化。

与当前主流GPU普遍采用HBM(高带宽内存)不同,Crescent Island选择了一条差异化的高性价比路径:它采用LPDDR内存,将容量提升至最高480GB,同时将整卡热设计功耗(TDP)控制在350瓦,使其能够适配现有的风冷数据中心和标准PCIe外形规格。Anil解释称,此举旨在优化总体拥有成本(TCO),并针对超长上下文长度和多模型快速切换的场景提供更好的支持。
对于外界关注的模型部署能力,杨锦文透露,在FP8量化精度下,4张Crescent Island即可支持拥有1.6T(1.6 万亿)参数量的DeepSeek-V4标准版模型部署。
值得一提的是,2026年2月,英特尔与AI芯片厂商SambaNova正式宣布建立多年期战略合作,旨在提供高性能、高性价比的AI推理解决方案,作为当前“以GPU为中心”方案的有力替代选择。因为,外界也非常关心双方在未来的合作与竞争关系。
当被问及与合作伙伴SambaNova的定位区别时,英特尔方面明确表示,SambaNova的大机架级架构更侧重于对延迟极度敏感、高并发的大规模集中推理;而Crescent Island则聚焦于极高性价比,非常适合企业端8-16卡规模的一体机部署,二者形成互补。同时,因其原生支持FP64,部分公司已对其HPC加速应用表现出兴趣,相关工作正在推进中。
小结:
在2026年智能体需求大爆发的这个时间点,至强6+的发布清晰地展现了英特尔的战略思路:坚守并放大其x86生态的深厚积淀,利用Intel 18A带来的制程红利,以极致的密度和能效去承接数据中心中依然庞大且不断增长的传统与新兴工作负载。
Kechichian在总结时强调,英特尔的数据中心战略核心在于在所有工作负载之间扩展,“我们致力于提供最适合客户需求的产品,为下一阶段的AI基础设施提供支持。”
据悉,至强6+处理器与代号为Diamond Rapids的下一代P-core产品,将共同构成英特尔基于Intel 18A制程节点的数据中心CPU产品组合,而代号为Crescent Island的AI GPU则将代替此前英特尔基于AISC路线的Gaudi系列AI加速器,以补足英特尔在数据中心AI加速器方面的劣势。
编辑:芯智讯-浪客剑