联合谷歌与英伟达:苹果最强自研大模型背后的“秘密同盟”
摘要
在苹果WWDC 2026大会上,重构版Siri与Apple Intelligence的亮相惊艳了科技界。然而在聚光灯背后,苹果高管在技术分享会上低调承认,其最先进的云端大模型AFM Cloud Pro并非闭门造车,而是正在谷歌云上运行,并联合英伟达GPU硬件与机密计算(Confidential Compute)技术共同打造。本文深度揭示这三大科技巨头之间错综复杂的“AI同盟”以及苹果独特的隐私保护计算架构。
在苹果一年一度的全球开发者大会(WWDC 2026)上,重构后的Siri与全新的“苹果智能”(Apple Intelligence)毫无疑问成为了全场焦点。能够根据用户上下文安排日程、查询演出门票并智能规划路线的Siri,展示了苹果在端侧智能领域的深厚积淀。
然而,在这场被冠以“重塑苹果”光环的发布会背后,苹果的AI野心远没有局限在端侧设备。在WWDC首日演讲结束后,苹果高管在库比蒂诺总部的一场技术交流中透露,苹果最先进的云端大模型——Apple Foundation Model (AFM) Cloud Pro,实际上是苹果联合其硅谷死敌谷歌(Google)与芯片霸主英伟达(Nvidia)在暗中共同打造的“秘密同盟”。这也是苹果首次证实其核心AI服务正在运行于英伟达的芯片上。
轻资产模式下的“强强联手”
与微软、谷歌以及Meta等竞争对手大肆挥霍数百亿美元建设数据中心不同,苹果在AI军备竞赛中选择了一条极其务实的轻资产路线。苹果不打算购买海量的算力基础设施去训练所谓的通识“超级模型”,而是将其资源聚焦在如何将精巧的自研模型与用户的本地设备进行深度绑定。
即便如此,在运行如图像生成、长文摘要等高负载AI任务时,端侧设备孱弱的芯片性能依然无法应付。为此,苹果构建了“私有云端计算”(Private Cloud Compute)架构,将无法在端侧本地运行的复杂查询路由至云端。
苹果AI执行总监阿马尔(Amar Subramanya)指出,苹果的自研云端模型 AFM Cloud Pro 在能力上完全可以比肩谷歌的 Gemini 行业旗舰模型。而让这一大模型跑起来的底层基础设施,正是谷歌云(Google Cloud)中部署的英伟达最新一代GPU算力集群。
这种多边技术合作十分微妙:苹果使用谷歌云的服务器与虚拟化技术,借助英伟达提供的高速算力芯片,来训练和运行苹果自己的定制模型。三方通过深度利益捆绑,各取所需。
机密计算:保护隐私的最后一道红线
既然需要将用户的个人隐私数据(如日程表、私人邮件、日常对话等)上传到由谷歌和英伟达管理的第三方云端进行模型处理,苹果又该如何信守其“视隐私为生命”的品牌底线?
苹果软件副总裁塞巴斯蒂安(Sebastian Marineau-Mes)表示,苹果对于接入第三方云算力提出了极为苛刻的条件:谷歌和英伟达必须确保这套云端系统在物理和逻辑上均无法“读取”和“存储”任何服务器上处理的用户数据。
英伟达最近推出的一项名为“混淆机密计算”(Ambiguous Confidential Compute)的底层安全技术成为了促成此次合作的钥匙。这项技术允许在数据从端侧加密传输至GPU进行并行矩阵运算的整个链路中,解密秘钥仅保存在安全的硬件飞地(Enclave)中。无论是谷歌的云网络管理员,还是提供硬件维护的英伟达,都无法通过导出内存镜像或嗅探内部通道来获取明文数据。
正是这项新技术的突破,才让苹果感到安全,并放手将“苹果智能”的重度运算负载迁移到第三方的公共云端。
系统协调器:苹果AI的核心总线
在具体架构层面,苹果为“苹果智能”设计了一套精密的“系统协调器”(System Orchestrator)。
苹果软件工程高级副总裁克雷格(Craig Federighi)将协调器描述为整个隐私与算力分流架构的“总线”。每当用户向Siri发起一个请求,系统协调器会在毫秒级时间内评估该任务所需要的算力以及可能触及的个人数据级别。
如果任务较轻且不需要外部信息,它将全部在端侧芯片上就地解决。
如果需要调用复杂的图文生成能力,但涉及大量隐私,协调器会对数据进行加密打包,通过安全的机密通道发送至苹果 Private Cloud Compute 的专用服务器。
如果是极其复杂且不涉及核心隐私的通识类问答,协调器则可能会提示用户,并安全地引流给谷歌的 Gemini 服务。
克雷格强调,苹果自研的云端 AFM 模型是针对苹果芯片(Apple Silicon)进行了深度强化学习与微调定制的,与谷歌公开发布的 off-the-shelf 版 Gemini 相比有本质的区别。
苹果通过将谷歌作为模型微调的“陪练者”,将英伟达作为算力的“提供商”,用极快的速度建立起一套能与主流大模型分庭抗礼的云端架构,再次用极强的资源整合能力为硅谷上了一课。