苹果搭载大模型的Siri,可能和你想的不太一样
2024-03-26 19:57

苹果搭载大模型的Siri,可能和你想的不太一样

本文来自微信公众号:爱范儿 (ID:ifanr),作者:肖凡博,题图来自:视觉中国

文章摘要
本文介绍了苹果与百度商讨搭载生成式AI的业务,并探讨了苹果搭载大模型的Siri的可能性。

• 📱 苹果计划在iPhone和其他设备中搭载AI功能

• 🤝 苹果正在与Google和百度等公司商讨合作事宜

• 💡 苹果在AI领域探索端侧大模型的可行性,将AI模型直接存储在闪存中

苹果的 AI,虽迟但到。


根据华尔街日报消息,苹果正与百度商讨,关于国内市场的 iPhone 以及其他设备中整合生成式 AI 的业务。


尽管目前还没有得到官方的确认,不过有两件事至此可以确定:


  • iPhone 16、iOS 18 和 MacOS 将会搭载 AI 功能;


  • iPhone 上的大模型,在国内外将由不同的厂商提供。



比起早已搭载 AI 助手的国内品牌,苹果这回又不出意外地晚了大半年,慢人一步似乎一直都是苹果的标签,只是它们总能在稳步前行中带来一些惊喜。


然而,AI 大模型的进步速度正以周、甚至以天计数,苹果的迟到,究竟是再一次后发先至,还是在新时代掉队的开始。


略显妥协的方案,先上车才是重点


上个月的最后一天,苹果用 12 分钟的短会宣布:放弃造车,All in AI,汽车团队的众多成员将被调往 AI 部门。


蛰伏十年的泰坦计划,倒在了入局新能源汽车的最后一年,对于未来百家争鸣的汽车市场而言,会有些许遗憾,但从一家科技公司长远的发展来看,这莫过于一个长远且正确的选择。



AI 是基础性的应用,在所有大公司都主动或被动拥抱 AI 的当下,苹果的“断舍离”顺应着时代。


而如何拥抱 AI?怎样的人工智能才能在逐渐被瓜分的市场里占得一席之地?是它们最先要解决的难题。    


针对国外市场,苹果正在与 Google 积极谈判,以便在 iOS 18 中加入 AI 大模型,实现其他品牌早就有的 AI 功能。


虽然目前“双方尚未决定人工智能协议的条款或品牌,也没有最终确定如何实施”,但在众多备选合作商(OpenAI 和 Anthropic)中,Google 和 Gemini,应该是最适合苹果和 iPhone 的那一个。


今年二月发售的三星 Galaxy S24 系列机型以 AI 功能出圈,通话翻译、创意写作等功能赶上了国内平均水平,即圈即搜缩短了搜索路径,也极有可能成为今后 AI 手机的主要发展路线。


海外版的 S24 系列,就是通过大模型 Gemini 支持,才得以完成上述功能。


从经验讲,Google 已在全球出货量最高的旗舰机型上,完成了初步尝试,相比于在 PC 或 Web 端大火的厂商,它们更知道手机大模型的操作习惯、使用场景、适配应用应该怎么做。



再者,Google 本身也更渴望得到苹果的项目


根据国际数据公司 IDC 的统计,三星在 2023 年全球智能手机市场占有率达到了 19.4%,苹果则成功登顶达到了 20.1%。



若是拿下苹果,Gemini 在全球范围内手机终端的搭载率将达到 4 成,这对于一家面临激烈竞争的 AI 大模型公司,极为利好。


在梦里笑醒的除了 Google,还有苹果。


和其他强调“自研”的厂商不同,苹果在一开始就以合作来达成 AI 上机,也有其自身的考量


首先,在本身起步晚进度慢的现状下,“拿来主义”是快速争夺市场的妙手,和 Google 的合作,在减小研发成本、收取高额坑位费的同时,还能缓解两家公司目前所面临的监管压力。


其次,AIGC 的技术很好,但在落地时却因道德、隐私等方面的缺陷被大量诟病,交给成熟的第三方,特别是已经在三星机型上试水成功的 Google,省力省心,且减小了舆论和责任风险。


这当中的另一道坎,是技术本地化。每个国家和地区对 AI 大模型的监管和相关法规都有着不同的要求,合法合规的落地才是争夺市场和发展技术的前提,因此才催生出了“国内+国际”双管齐下的路线。


按照三星与百度初见成效的合作,苹果才会选择这条已经被“验证为真”的路线。


国行版三星 S24 系列上的 AI 功能,实际上有多个厂家旗下的技术组成:即圈即搜功能由百度和京东提供;智能修图由美图秀秀的大模型 MiracleVision 完成;文章摘要、智能写作则采用了百度的文心一言大模型。


苹果是否也会与多家厂商合作,还要等待后续的消息,不过和百度的合作,已然板上钉钉。


最后,苹果要做的并非一个智能语音助手,而是整套 AI 终端。但根据 Macrumor 的爆料,以目前的自研进度和技术成果,苹果的大模型还远达不到 Google、OpenAI 等公司水准。


与其赶鸭子上架一个智能聊天机器人,不如先拿成熟的方案做过渡,为自研大模型争取更多的研究时间和进步空间。


当下的市场很重要,但未来的核心技术才是根本


合作,是苹果 AI 全球化的第一步,而最终的目标,是为了拥有全路自研的 AI 大模型。


这是一项烧钱且耗神的工程,别说退步,稍微进步的慢一点,都有可能在下周被淘汰。一个有竞争力的大模型,往往代表着今后在市场上的主导权与议价权。


库克认为:


生成式 AI 方面开辟新天地,我们相信这项技术可以重新定义未来。    


而苹果对于大模型的探索,其实一直都在日程表上。


本月 15 日,苹果工程师悄悄发布的一篇研究论文,当中详细介绍了一种名为 MM1 的新型生成式 AI 模型的开发过程。



MM1 是一个具有最高 30B(300 亿)参数的多模态 LLM 系列,这是苹果在多模态大模型的最新研究成果。


总的来说,苹果的自研模型在测试效果上,与 Gemini 和 GPT4V 还有一定的差距,也没有在生成结果上表现出如 Sora 一样惊人的效果,更没有探索出一条全新的技术路线。



但是,它能通过控制各种数据变量,在对比中找出影响模型生成效果最关键的那几个因素,简单来说,它天生不强大,不过善于观察、实践和总结,在一次次的尝试中,也能取得不错的成绩。


MM1 由密集模型和 MoE(混合专家)变体组成,当指令进入 MoE 后,究竟应该去“东市买骏马”还是“西市买鞍鞯”,都会被这个指令中心安排的明明白白的。


问题被细化和分类的同时,也提升了计算效率,节约了运行能耗。



这篇论文,代表苹果在 AI 领域探索的阶段性成果,虽然 MM1 没有颠覆行业更没有惊艳世界,但在晦涩难懂的专业术语里还是能看出它们的进步:


我们的工作模式一直是先做工作,然后再谈论工作,而不是在自己面前出言不逊。—— Tim Cook    


没有透露过多技术细节的苹果,其实还在盘算着另一步棋:端侧大模型



早在去年底,苹果在名为《闪存中的大型语言模型:在有限内存下高效的大型语言模型推理》的论文中,就提出了大模型落地 iPhone 等“内存有限”设备的方法。


研究人员称,他们通过最新的闪存技术,在 iPhone 和其他内存受限的设备上成功部署了 LLM(大语言模型)



这个项目被称为 Apple GPT,最大的作用是将 LLM 数据直接存储在闪存中,比如整合在 Siri 内部,相较于传统的运行方法,新技术使 CPU 和 GPU 的推理速度,最大提升了 5 倍和 25 倍。


研究人员称,开发的这些效率型方法使得 AI 模型能够在 iPhone 当前内存的两倍范围内运行。


也就是说,侧端搭载大模型有了可行性,通过减少闪存传输的数据量、提高每次传输的吞吐量,让 LLM 的数据直接储存在闪存中。


撇开技术,Siri 是我们和 AI 的桥梁


进度缓,消息少,布局大。这是苹果探索 AI 的概况。


每每看到苹果的某项技术落后于市场和竞争对手,都会给人一种“起步太晚”的错觉,实际上在翻看相关新闻和专利文件的时候,又会发现它往往是最早布局的那一批,甚至那一个。


截止到 2023 年,苹果总共收购了 32 家 AI 公司,位列科技巨头中收购榜第一。


而收购 Siri,应该可以算作苹果入局 AI 的开端。



2010 年的乔布斯打给“Siri 之父”Dag Kittlaus 的一通电话,让 Siri 以超过 2 亿美元的身价,加入苹果,走上 iPhone。


Siri 最初的定位是一个快速准确获取信息的助手,或是处理复杂任务的助理。



在最原始的版本里,Siri 可以与 42 个网络服务相连接——从餐馆点评网站 Yelp、售票网站 StubHub,到电影点评网站 Rotten Tomatoes 和数学计算网站 Wolfram Alpha。


根据提示,Siri 会将各种信息整合,并回复用户。无需打开其他的应用软件,Siri 就可以帮助用户买票、订餐馆或叫出租车。


这些如今被 AI Pin 和其他智慧助手大力宣扬的“AI 功能”,似乎只是十多年前 Siri 的“基础操作”。


但 Siri 的实际体验,已经在 AI 大模型爆炸式发展的当下,被拉开了不小差距。



智能助手,是对人的被动模仿,有问必答,有求必应。


而 AI 终端,则是对人的主动接近。根据用户的个人习惯、喜爱偏好,总结以往、推理以后,在不同的时间地点给予你最合适的建议和答案,并且能够不断地学习优化,成为“私人专属”。


从整体上看,苹果的迟到只是相对的晚,因为 AI 手机,还处于发展的早期阶段。


的确,大部分国产品牌已经在 AI 终端的阶段发力,功能大体相同,特长各有侧重。


但各家大模型的可用性只能算达到及格线,除了像 OPPO 相册的 AI 消除、三星通话的实时翻译、小爱同学的 AI 通话等细分功能,大部分的体验目前还是与独立的 AI 应用有些差距。    


这当中,除了厂家的技术突破,也和 App 开放的接口有关,比如不支持微信语音通话摘要的模型,在日常生活中,就少了一大块的应用空间。


因此,大模型和系统、App 的整合,以及对全新交互方式的探索,还有很长的路要走。在此之前,AI 功能还没能达到影响消费者购机决策的程度。


在 AI 上机的元年,Siri 的目标是和其他 AI 助手抹平这半年多的差距;而作为苹果布局未来的重要部分,我们更期待 6 月份的 Siri,会带来怎样的“One more thing”。


本文来自微信公众号:爱范儿 (ID:ifanr),作者:肖凡博

本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系hezuo@huxiu.com
如对本稿件有异议或投诉,请联系tougao@huxiu.com
正在改变与想要改变世界的人,都在 虎嗅APP
赞赏
关闭赞赏 开启赞赏

支持一下   修改

确定