苹果全球开发者大会(WWDC)定于6月8日开幕,其人工智能重构计划中最具深远影响的细节,竟涉及苹果并不拥有的硬件。据悉,基于Gemini重建的Siri将把最复杂的请求发送至谷歌云,由英伟达Blackwell B200图形处理器进行处理,而非运行在苹果自有服务器上。对于约20亿台苹果设备的庞大装机量而言,这意味着iPhone智能的核心部分,很快将在两大竞争对手构建的基础设施上运行。
打破全栈闭环:复杂查询路由至英伟达B200
预计苹果将继续让设置计时器或控制智能家居等简单请求在iPhone本地运行。这一转变主要针对超出设备处理能力的复杂场景:相关查询将回退至谷歌的大型Gemini模型,并在谷歌部署的英伟达Blackwell B200芯片集群上完成处理,用户数据将在硅片层面进行加密。这一安排使谷歌和英伟达成为苹果多年来最重要产品的核心环节。
此举打破了苹果长期掌控全栈技术的惯例。该公司多年主张安全的软件必须建立在自行设计的硬件之上,并为此构建了“私有云计算”(Private Cloud Compute)。将旗舰助手的推理能力外包给竞争对手的数据中心,直接背离了这一理念。
性能瓶颈迫使转向:私有云难以承载万亿参数
这一变化的主因是性能问题。据报道,苹果曾尝试在私有云计算中运行Gemini模型,但测试显示系统速度过慢,无法达到Siri所需的大规模可用性标准。这促使苹果转向谷歌现有的基础设施,后者已为万亿参数推理做好了资源准备。
这一细节修正了此前关于新Siri工作原理的认知。去年11月,外界普遍预期定制版Gemini模型将独家运行在苹果自有服务器上。而最新迹象表明计划已变,目前尚不清楚私有云计算在此次发布中究竟扮演何种角色。
隐私新防线:英伟达机密计算技术
隐私机制是此事的工程核心。Blackwell B200是一款多芯粒数据中心处理器,集成2080亿个晶体管,专为服务万亿参数模型设计。苹果所依赖的是英伟达机密计算(Confidential Computing),这是一种从CPU扩展至GPU的基于硬件的可信执行环境。
当该模式激活时,Blackwell芯片会对GPU内存中的所有数据(包括模型权重、用户输入和推理结果)进行加密,同时在计算过程中保持加密状态。在多GPU配置中,芯片间的NVLink流量也会被加密。B200是首款在输入和输出路径上都提供可信执行保护的GPU。
对读者而言,其实际意义非常具体:苹果押注即使请求在竞争对手机器上处理,片上加密也能确保Siri请求的机密性,避免数据以明文形式暴露给谷歌云端。这与苹果最初“无状态服务器、不保留任何数据”的私有云设计理念截然不同,新方法通过硬件在每一步保持提示词加密,并结合密码学证明验证芯片身份。
资金流向逆转:苹果年付10亿美元授权费
在英伟达硬件之上,是苹果与谷歌于2026年1月12日宣布的合作关系。苹果同意每年支付约10亿美元,授权一款定制的1.2万亿参数Gemini模型。该系统大小约为苹果自身1500亿参数云模型的八倍,远超设备上运行的约30亿参数模型。
这种经济模式颠覆了熟悉的关系格局。谷歌每年已向苹果支付约200亿美元以保持Safari默认搜索引擎地位,而在Gemini协议下,资金流向发生逆转,苹果需为其助手背后的智能层向谷歌付费。
反垄断阴影下的合作
这种日益紧密的关系落入了充满争议的法律环境中。美国司法部于2026年2月提起反垄断上诉,挑战了维持200亿美元搜索默认协议有效的裁决。法律分析人士指出,Gemini-Siri协议引发了政府在搜索案中识别出的相同结构性担忧,因为它将20亿台设备的复杂AI查询路由至单一主导提供商。
谷歌方面表示,通过该协议不会接收苹果用户数据,且据报道合同禁止谷歌利用Siri查询训练其模型。若上诉成功,该合作关系可能面临两家公司均未公开讨论的限制条件。
发布时间表:9月正式亮相
任何期待在周一看到成品助手的用户可能需要等待更久。WWDC将是苹果预览iOS 27及其配套操作系统的场合,随后将推出开发者测试版。据报道,具备完整对话功能的Gemini驱动Siri将与下一代iPhone一同在9月发布。周一只是正式揭幕和开发者接入的开始,而非消费者发布日期。
常见问题解答
Siri是否在使用Google Gemini?
是的。根据2026年1月宣布的合作协议,重建后的Siri基于苹果从谷歌授权的定制Gemini模型。苹果自身的较小模型仍负责处理简单的设备端请求。
新版Siri何时推出?
据报道,Gemini驱动的Siri将于2026年9月与下一代iPhone一同发布,而非在6月8日的WWDC主题演讲上亮相。预计WWDC将率先预览该软件并向开发者开放。
苹果会与谷歌共享Siri数据吗?
谷歌表示不会通过该交易接收苹果用户数据,且苹果正依靠英伟达机密计算在处理过程中对请求进行加密。据报道,合同防止谷歌利用Siri查询训练其模型。
什么是英伟达B200?
Blackwell B200是英伟达的旗舰数据中心GPU,专为大规模AI训练和万亿参数推理而设计。它包含硬件机密计算功能,可在芯片处理数据时对数据进行加密。
【星途科讯 图文丨欧阳布布】