操作系统级Agent诞生:苹果Siri AI史诗级升级,采用“自研模型+Google Gemini”联合架构
摘要
在备受瞩目的苹果全球开发者大会(WWDC 2026)上,苹果酝酿已久的AI版Siri终于正式亮相,并被正式命名为“Siri AI”。这一次,Siri不再仅仅是一个简易的语音助手,而是进化成了一个具备操作系统级Agent能力、拥有独立App的智能体。通过引入“自研基础模型 + Google Gemini”联合模型体系,Siri AI具备了屏幕感知、个人情境理解和跨App任务执行三大核心能力。本文深度解析Siri AI的混合架构底座及人机交互的未来图景。
北京时间2026年6月9日凌晨,在库克作为CEO主持的最后一届WWDC上,除了引人瞩目的iOS 27与液态玻璃UI视觉革命,苹果在人工智能(AI)领域的终极底牌也终于揭晓——酝酿两年的AI版Siri以Siri AI之名正式登场。
自2011年首次集成到iPhone 4S以来,Siri曾是智能助手的先驱,但随着ChatGPT、Google Gemini和Claude等生成式AI的崛起,传统Siri因死板的对话体验和极弱的逻辑推理而被外界戏称为“人工智障”。早在2024年,苹果就曾向外界承诺过一次大改,但直到今天,这个承诺才真正兑现。全新亮相的Siri AI彻底颠覆了以往的定位,重塑为一款拥有独立App、具备系统级Agent(智能体)能力的交互中枢。
“自研+Gemini”联合脑:鱼与熊掌兼得的底层架构
Siri AI最核心的突破在于其底层大模型架构的重大调整。苹果首次采用了“自研基础模型 + Google Gemini”的联合模型体系。
端云协同的自研基础模型(Apple Foundation Models):
负责处理日常语音识别、简单的文本提炼、图像理解和Vision Pro(visionOS)上的眼动视线判定。这套模型高度优化于端侧(On-device)及苹果私有云计算(Private Cloud Compute),确保绝大多数涉及个人隐私和敏感数据的处理不需要离开设备。
Google Gemini的深度融入:
当用户提出涉及海量外部知识检索、高度复杂的多步骤逻辑推理或者长篇文本创作等任务时,Siri AI会向用户发起确认,并在征得同意后,无缝调用云端的Google Gemini大模型。这标志着苹果与谷歌在AI时代的战略联盟正式落地,使得Siri同时具备了苹果端侧的安全敏捷与谷歌云端大模型的广博智能。
出于对用户隐私的承诺,Siri工程副总裁迈克·罗克韦尔(Mike Rockwell)特别强调,即使在调用外部模型或使用云端计算时,用户的IP地址也会被隐藏,且任何传输的数据均不会被苹果或谷歌存储用于模型训练。
屏幕感知与跨App执行:真正的操作系统级Agent
Siri AI不再只是一个倾听声音的语音助手,而是拥有了“眼睛”和“手脚”的系统级智能代理。它具备三大核心超能力:
屏幕感知(On-screen Awareness):
Siri AI可以实时理解用户当前屏幕上正在显示的内容。例如,当你在短信中收到一张朋友发来的聚会日程海报时,你只需唤醒Siri并说“把这个加到我的日历里”,Siri AI就能自动提取海报中的时间、地点和主题,在后台完成日历创建。
个人情境理解(Personal Context):
依托于系统底层的深度数据整合,Siri AI能够调取邮件、短信、备忘录和PDF文件中的个人信息。在一场演示中,MacBook上的Siri被要求协助提供“建造一个小木屋的建议”,它不仅从网上搜索了建造步骤,还自动调阅了本地电脑中用户之前保存的木材购买清单,给出了完全定制化的本地建议。
跨App任务执行(Cross-App Actions):
得益于iOS 27与macOS 27更开放的系统API,Siri AI不仅能实现跨系统应用的联控,还能直接指挥第三方App。你可以对它说“帮我把昨天收到的照片用特定滤镜处理后发给小张”,它便会自动打开相册、找到对应照片、调用修图软件、最后通过即时通讯软件发送出去。
多端无缝接力与Vision Pro的“灵动之眼”
在产品形态上,Siri AI已经从隐藏在后台的后台进程进化为了一款独立的App。它的视觉设计也迎来了重构:当在iPhone上被唤醒时,它会以柔和的流体折射动效从屏幕边缘及动态岛(Dynamic Island)处弹出;而在visionOS上,它则呈现为一个悬浮的流体半透明光球。用户仅需用眼神注视这个小球并开口说话,即可完成复杂命令的输入。
此外,苹果还打通了设备之间的壁垒。用户可以“在iPhone上向Siri AI发起一个长文本润色任务,在走到Mac前时,无缝在Mac屏幕上继续接收Siri生成的修改方案”。这种无感的多端协同,将苹果生态的硬件壁垒再次拉高。
虽然Siri AI在WWDC的官方演示中表现得行云流水,但其在复杂真实世界中的多设备识别精度和防误触能力,仍有待正式版推出后广大用户的实际检验。据悉,Siri AI首期仅支持英语,但苹果承诺将“极快地”推向包括中文在内的更多主流语种。Siri AI的推出,正式拉开了手机与PC从“App时代”向“Agent时代”跨越的序幕。
同类栏目导航