本文梳理了苹果Siri从诞生到2026年改造的发展路径,分析了苹果AI战略的得失,以及面临的核心挑战。 ## 1. 领先出道却被耽误十几年的Siri - Siri脱胎于美国国防高级研究计划局资助的CALO项目,2010年苹果以超2亿美元收购,2011年随iPhone 4S发布,是全球最早的个人智能入口,也是如今Agent的最早雏形。 - 受苹果封闭控制的产品逻辑限制,Siri仅被允许做确定性任务,缺失主动性和记忆,从有野心的个人助理退化为语音遥控器,逐渐被用户冷落,苹果也成为最晚完成Agent产品的头部厂商。 ## 2. 十年端侧布局仍未追上生成式AI浪潮 - 苹果早在十年前就布局AI:2015年布局自然语言与端侧深度学习,2017年推出Neural Engine、Core ML并收购Workflow(后改为快捷指令),后续持续推进端侧AI算力与场景落地,形成了“端侧优先、隐私优先”的独特路线。 - 苹果AI多年来分散在系统功能中,未能整合成整体智能能力;ChatGPT出现后,用户预期转向整体AI能力,苹果自研模型没能追上用户期待,2024年推出的Apple Intelligence也未能按计划落地。 ## 3. 引入Google Gemini重构底层,借外力推进Siri升级 - 苹果调整AI团队架构:原AI负责人John Giannandrea退场,由Craig Federighi接管AI方向,重新组建Siri团队,计划每年向Google支付约10亿美元,获得1.2万亿参数定制Gemini模型支撑Siri改造。 - 本次合作采用蒸馏技术:苹果用Google Gemini生成的训练数据,蒸馏出可在端侧运行的小模型,共发布5个Apple Foundation Models,端侧最小30亿参数,云端最大模型专为Nvidia GPU优化;部分推理任务依托Google Cloud的Nvidia GPU运行,苹果PCC首次延伸至第三方基础设施。 - 苹果保留产品控制权,保留自身生态权限框架,但放弃了全自研的技术主权,形成“自有产品框架+Google模型骨架+Nvidia算力关节”的格局,长期存在供应链依赖风险。 ## 4. 落地与产品仍存多重待解挑战 - 中国市场落地难度大:受监管要求、数据本地化限制,Apple Intelligence在中国需要对接本土模型与服务商,且难以适配微信、支付宝等本土高频场景,能力会与海外版本存在明显差异,同时面临国产手机AI的直接竞争。 - AI能力存在硬件门槛:Apple Intelligence最低要求iPhone 15 Pro及更新机型,最强端侧模型要求更高配置,AI或成为苹果刺激用户换机的新动力,但也将“更懂用户”的AI能力设置成了价格门槛。 - 核心伦理问题待解决:苹果AI的核心目标是帮用户分担认知杂活,但真正的“个人智能”需要在走进用户生活后把握边界,理解用户与拥有用户数据是完全不同的两件事,这一考验苹果尚未完成解答。
苹果终于承认,Siri老了
2026-06-09 15:45

苹果终于承认,Siri老了

本文来自微信公众号: 动察Beating ,作者:Sleepy,头图来自:AI生成


北京时间2026年6月9日凌晨,苹果的WWDC 2026如期而至。


在发布会上,它把Siri改名叫Siri AI,公布了和Google的深度合作,用Gemini的模型能力训练自己的新一代基础模型,把Private Cloud Compute第一次延伸到了Google Cloud和Nvidia的GPU上。


它发布了五个Apple Foundation Models,端侧最小30亿参数,云端最大的专为Nvidia GPU优化。几乎每一个日常App都被重写了一遍。Siri还有了自己的独立应用,能保存对话,跨设备同步,有了记忆。


这是苹果这些年信息量最大的一场发布会。


一、驯化一个未来


苹果的AI故事,可以追溯到2011年秋天,iPhone 4S发布会,Siri第一次站到台前。


那时乔布斯已经病重,苹果正站在一个时代的交界处。Siri像一个从科幻电影里跑出来的小东西,你问天气,问餐馆,叫它设闹钟,它会用一种略带机械的口气回答你,你第一次觉得手机不只是一块没有温度的玻璃。


Siri脱胎于SRI International的CALO项目,原本是美国国防高级研究计划局资助的军事级人工智能助手。2010年苹果将它收入囊中,据TechCrunch报道这笔交易可能超过两亿美元。一年后Siri随iPhone 4S亮相,苹果说它能理解自然语言,能像个人助理一样替你办事。


那一刻,苹果拿到了全世界最好的个人智能入口。然后它耽误了十几年。


今天回看,Siri最早改变的是人和机器说话的姿势。2011年,iPhone正在把手机从通信工具变成个人计算设备,App Store重新定义了软件分发,移动互联网从PC桌面迁进掌心。Siri出现在一个上升期的浪尖。可进了苹果之后,它很快从一个有野心的个人助理变成了一个听话的语音遥控器。


苹果骨子里信奉封闭和控制。但一个真正的个人助理必须接入更多服务,理解更多上下文,容忍更多不确定性。而不确定性意味着出错,意味着隐私风险,意味着苹果最不擅长应对的失序。


于是Siri只被允许做确定性任务,像一个被驯化的未来。它有名字、有声音、有人格包装,唯独缺少真正人格所需要的主动性和记忆。用户最初被它惊艳,后来拿它开玩笑,再后来干脆不怎么用了。


苹果最早把“个人助理”放进了手机,又最早把它关了起来。


今天全行业都在做的Agent,回头看,2011年的Siri几乎就是它的原型。可以说苹果是最早做出Agent雏形的公司,最后反而成了最晚把它做完的那一个。


二、不像AI的AI


Siri没长大的这些年,苹果的AI止步不前了吗?


答案恰好相反。苹果做了很多AI,只是做得太不像AI了。


如果按发布会声量算,苹果像是2024年才突然开始认真讲AI。可如果沿着技术路径倒着看,苹果从十年前就在行动了。


它在2015年连续收购了两家公司,一个补自然语言对话,一个探索在手机上直接跑深度学习。同年WWDC讲Proactive Assistant,试图让系统在用户开口之前就给出建议。这个想法很超前,但在当时的技术条件下更像一句口号。


第二年推出SiriKit,有限地把Siri向开发者打开一条缝,又公开讲了Differential Privacy,表态要在保护个体隐私的前提下从大规模数据中学习。2017年iPhone X带来Neural Engine,Face ID和相机开始依赖设备端机器学习,苹果同时推出Core ML让开发者在苹果设备上跑模型,又买下了Workflow,也就是后来的快捷指令。


这是一组很苹果的答案。它又想要AI,又不想像Google那样把赌注押在云端和海量个人数据上。又要开发者,又不想让Siri变成一锅乱炖。所以苹果选了一条最难也最慢的路,做端侧,做隐私,做系统集成。


到了2020年前后,苹果又接连买了几家做低功耗边缘AI和语音理解的公司。同年M1芯片发布,16核Neural Engine登上Mac,端侧AI算力从口袋里的手机一路推进到电脑。第二年Live Text和Visual Look Up落地,照片里的文字可以直接复制,相机能认花认草,更多语音请求不出本机就能处理。


苹果这十几年确实没推出一个单独的AI App,但它确实让手机变聪明了。


选择走这条路有它的道理。手机上的AI不只是答题机器,它要看照片,听语音,理解联系人,调用App,感知电量、位置和时间。它最好能在没网的时候也做一点事,最好不要每个请求都把用户的生活打包上传到云端。苹果的硬件控制力让它有资格走这条路。


可局部聪明和整体智能之间,隔着一道很深的鸿沟。苹果擅长把技术拆成可靠的零件,可生成式AI要求它把零件拼回一个整体。


这些零件安安静静地埋在系统里,等着一个契机。


契机没有先来。ChatGPT先来了。


2022年底ChatGPT出现的时候,苹果并非毫无准备。Tim Cook在多个场合反复强调AI和机器学习是苹果产品多年来的核心技术,Bloomberg 2023年也披露苹果内部有Ajax大模型框架和内部Chatbot项目。


可问题不在苹果手里有没有牌,问题在于牌桌上的规则变了。


ChatGPT把用户的注意力从“功能”拉到了“能力”。用户开始默认手机上必须有AI,然后去比谁更强。当ChatGPT已经能把一段乱七八糟的想法整理成一篇邮件的时候,Siri还在说“我在网上找到了这些内容”。


2024年WWDC,苹果把Apple Intelligence摆上台面。写作工具,通知摘要,照片搜索,Siri个性化理解,ChatGPT接入。苹果终于承认只靠自研模型,至少在2024年,它追不上用户的期待。但它画的饼最后没能按宣传的节奏落地。


三、请Google当家教


Apple Intelligence延期的背后,不只是技术跟不上,而是整个Siri团队的结构跟不上这一轮AI。


多家媒体确认,苹果原AI负责人John Giannandrea退场,Craig Federighi接管AI方向,Vision Pro负责人Mike Rockwell被调来执掌Siri团队,大量Siri工程师被送去学AI编程工具。这不是一次体面的轮岗,苹果内部已经意识到,靠原来的人和原来的节奏,赶不上趟了。


2026年1月苹果和Google发表联合声明,苹果将借助Gemini技术为iPhone和其他产品定制Apple Intelligence功能。据报道苹果计划每年向Google支付约10亿美元,使用一个1.2万亿参数级别的定制Gemini模型来支撑Siri改造。苹果此前也测试过OpenAI和Anthropic的模型,最后还是选择了Google。


这和2024年的ChatGPT接入完全不同。那一次ChatGPT更像是Siri答不上时用户授权请的救兵,品牌是OpenAI的,界面是弹窗式的。这一次Gemini直接进了底层,变成苹果新一代基础模型的一部分。


关键动作是蒸馏。Google给了苹果对Gemini的完整访问权限,苹果在Google数据中心里用大模型生成高质量的答案和推理过程,再拿这些结果去训练更小更便宜能在iPhone上跑的模型。


WWDC前一天苹果公布的技术文章把这套合作包装成第三代Apple Foundation Models,和Google定制合作开发了五个模型。端侧有30亿参数的AFM 3 Core,还有200亿参数但按请求只激活一部分的稀疏模型AFM 3 Core Advanced。云端有AFM 3 Cloud和图像模型ADM 3 Cloud,以及最强的AFM 3 Cloud Pro。


更现实的变化在算力上。端侧模型再聪明也无法完成所有任务,苹果Private Cloud Compute的基础设施难以独自承载完整的Gemini级推理,部分请求会跑在Google Cloud的Nvidia GPU上。苹果随后确认PCC首次扩展到苹果自有数据中心之外,技术栈覆盖了Nvidia Confidential Computing、Intel TDX和Google Titan芯片。苹果强调仍由自己控制PCC软件,设备只信任经过苹果加密批准的程序,相关二进制文件也会对安全研究人员开放检查。


苹果没有真正放弃控制权,但放弃了全自研的体面。


四、骨头是借来的


理解苹果在AI时代的位置,要先看清它最核心的资产是什么。


不是芯片,不是模型,是设备。设备里装着相册、邮件、日历、地图和支付,承载着大量普通人的生活碎片。哪个AI能调动这些碎片,它就不只是一个聊天机器人,它就能成为真正的个人智能中枢。


苹果很早就开始为这个中枢铺路。2017年买下的Workflow后来变成快捷指令,和Siri以及系统自动化深度绑定。2022年推出的App Intents让第三方应用把自己的能力暴露给系统入口。到了Apple Intelligence时代,这些接口就成了AI调用真实世界动作的手和脚。


有了这些接口,OpenAI可以进来,Gemini也进来了,中国市场将来可以找本土伙伴。但它们进来的方式不是直接接管iPhone,而是被装进苹果的权限框架和隐私规则里。


苹果最怕的不是谁的模型比自己强。它怕的是用户开始绕过系统,直接把生活交给另一个入口。如果有一天用户每天打开的不是App而是一个能替他调度一切的AI助手,苹果就沦为一个做工不错的壳。


所以从此以后,Apple Intelligence这几个字里的Apple更多代表产品控制权,而不再代表完整的技术主权。皮肤是自己长的,衣服是自己裁的,可骨头是借来的。Google提供了骨架,Nvidia提供了关节,苹果要做的是让这副身体穿上自己的衣服走出去。


Google从这笔交易里得到的是一次巨大的背书,连苹果都承认Gemini的底层能力更可靠。Nvidia得到的是另一个证明,哪怕苹果有最强的消费级芯片和自研服务器的野心,到了前沿推理和复杂agent任务面前,还是绕不开GPU云。


可骨头借得越多,身体就越不完全是自己的。每一根借来的骨头背后都有供应商的商业算盘、监管和技术节奏。万一哪天有人要把骨头抽回去,苹果能不能站得住,这个问题它暂时还不需要回答,但迟早要回答。


五、住进系统里的新房客


普通人不关心模型参数。普通人关心的是手机能不能少烦他一点。


苹果在WWDC26台上说:“There are times when you expect more from Siri.”


对苹果来说这几乎算是道歉了。


然后它试图让你看到一个不一样的早晨。


你醒来,屏幕上堆着二十条通知。过去你得一条条划掉,现在系统已经替你分好了轻重缓急,老板发的排在前面,广告和促销被收拢成一行灰字。你打开邮件,一封长长的工作邮件已经被摘成了三句话,你决定回复,Siri根据你平和这个人说话的语气替你起了个草稿。你想起下午要给一个商家打电话退货,还没拨出去,系统已经从你前两天的邮件里翻出了订单号贴在通话界面上。


这就是苹果想讲的故事,一层铺在系统底下的智能,替你省掉那些每天重复的认知杂活。少读一点废话,少找一会儿文件,少被通知打断一次。


为了讲好这个故事,苹果几乎重做了Siri的入口。iPhone上它被放进灵动岛,下拉就能对话。iPad和Mac上跟Spotlight合在一起。它有了独立的App,能保存和继续过去的对话,通过iCloud跨设备同步。苹果想让Siri变成一个住在系统里的AI助手,有记忆有上下文,但又尽量不让它看起来像ChatGPT。


视觉也是一个重要的方向。相机里新增了Siri mode,对着食物拍一下就给出营养信息,对着看不懂的东西拍一下就能识别和搜索。系统级听写不只是语音转字了,还会自动加标点调格式,把口语变成能直接发出去的文本。


开发者侧也在铺路。苹果开放了Core AI框架,让第三方在设备上加载自己的模型。App Intents升级后Siri更容易理解第三方应用。Foundation Models Framework不再只调用自家端侧模型,还支持接入Claude和Gemini这些外部供应商。苹果在给整个生态铺一条路,以后Siri要跨App做事,开发者必须把内容和动作交给系统去理解。


这些规划如果落地,苹果AI就不再只是“会聊天的Siri”。


只是这次苹果比过去谨慎了许多。Siri AI今年晚些时候才以beta形式向用户开放,英语先行。而同一个Apple Intelligence到了中国,很可能已经不是同一个产品。


中国用户看苹果AI,基本上也就是图一乐。发布会是热闹,功能是好看,但中国地区“暂不支持”。


中国市场对生成式AI有备案、内容安全和数据本地化一整套规矩。苹果需要找本土模型合作方,需要过监管审批。Apple Intelligence在中国不只是晚几个月上线的问题,它从底层就可能不是同一套东西。


美国用户看到的是自研模型加Gemini的组合,中国用户看到的可能是苹果系统权限、本地云服务、本土模型和监管要求共同揉出来的版本。它们都叫Apple Intelligence,但实际能力和可触达的边界可能完全不同。


iCloud中国大陆服务由云上贵州运营。云盘保存文件,AI要理解文件;云盘存照片,AI要看懂照片;云盘同步备忘录,AI要从备忘录里抽出你的计划、习惯和人际关系。这些数据在AI时代有了全新的用法,自然也要面对不同分量的监管。


更现实的威胁来自竞争。国产手机厂商在端侧大模型、中文助手和影像AI上动作很快。对中国用户来说,花一两万买一台新iPhone,结果最核心的AI功能用不上,那不如换个品牌。


中国市场的日常场景对苹果又格外棘手,微信、支付宝、美团、抖音、网约车、政务服务、医院挂号,这些才是很多人每天真正用手机处理的事。一个AI助手如果进不了这些场景,看不懂群聊、票据、验证码和各种只有本地人才能秒懂的表达,它就很难称得上“智能”。


六、理解一个人


Apple Intelligence还有个问题,它并没有覆盖所有的iPhone。


iOS 27可以覆盖到iPhone 11和第二代iPhone SE,但Apple Intelligence至少要求iPhone 15 Pro及更新机型、M系列iPad和Mac。最强的端侧模型还要求更高,iPhone 17 Pro、iPhone Air、至少12GB统一内存的M4 iPad或M3 Mac。


过去几年换机周期越拉越长。屏幕够好,拍照够用,很多人不再每年换手机。AI也许能成为苹果重新刺激换机的理由,端侧AI确实需要更强的芯片和更大的内存,硬件门槛不可避免。一个被包装成“更懂你”的个人能力,最后却变成一道价格门槛。


苹果过去十几年不断追问“iPhone之后是什么”,试过手表,试过耳机,试过电视,试过那个传了十年最后被砍掉的造车项目。2024年造车团队的部分员工被转入生成式AI团队。


AI来得正好,它给了苹果一个不用从零造新硬件品类的下一代故事,改造已经握在十几亿用户手里的设备就行。iPhone之后也许还是iPhone,只是它必须变成另一种东西。


Tim Cook的接班人Ternus负责的硬件产品未来的规划暗示了苹果的下一步。他在推进一组未发布的AI设备,带摄像头的眼镜和可穿戴设备,用计算机视觉理解周围环境。如果这些产品成真,Apple Intelligence会从手机继续往外蔓延,手机、耳机、眼镜和家庭中枢都可能成为新的感官。


可不管感官怎么延伸,核心问题始终是同一个。


人和手机的关系,大多数时候不是坐下来长谈,而是在极琐碎的场景里互相打扰。你在赶地铁,孩子在哭,老板在催,屏幕上堆着20条通知。Apple Intelligence对普通人最具体的意义不是万能助手,而是让手机开始替你分担一部分认知杂活。少读一点废话,少找一会儿文件,少被通知打断一次。


苹果一直把自己塑造成站在用户这一边的公司。它说隐私是基本人权,说设备属于用户,说技术应该服务于人。AI时代,这套话会遇到真正的考验。因为一个系统一旦开始理解你,就不只是在保护你的数据,它也在塑造你的行动。它给你摘要、给你建议、替你筛选信息、替你判断什么重要什么可以忽略。


个人智能的难点从来不只是智能,还有“个人”。一个人的生活不是数据库,里面有情绪、误会、不体面,有不想被任何系统看见的角落。AI要进入这些地方,就不能只拿效率当通行证。


石黑一雄在《克拉拉与太阳》里写过一个人工智能陪伴者克拉拉。她花了全部的存在去理解一个女孩,学会了观察光线的变化,学会了读懂表情和沉默,学会了在该安静的时候安静。


但整本书最动人的地方在于克拉拉最后终于明白那个女孩身上有她永远触碰不到的部分。她不是不够聪明,而是她懂得一件事,理解一个人和拥有一个人的数据是完全不同的两件事。


苹果花了十五年才走到承认Siri不够好这一步。WWDC这一夜它向Google借了模型,向Nvidia借了算力,向用户借了又一年耐心。它证明了自己愿意低头,但低头只是开始。


接下来它要学的,是克拉拉早就知道的那件事。不是怎么变得更聪明,而是在走进一个人的生活之后,知道在哪里停下来。

AI创投日报频道: 前沿科技
本内容由作者授权发布,观点仅代表作者本人,不代表虎嗅立场。
如对本稿件有异议或投诉,请联系 tougao@huxiu.com。
正在改变与想要改变世界的人,都在 虎嗅APP
赞赏
关闭赞赏 开启赞赏

支持一下   修改

确定