本文来自微信公众号:降噪NoNoise,作者:刘诗雨,头图来自:AI生成
向来以“克制”著称的微信,终究是向外部Agent低了头。
此前,用户翘首以盼腾讯版“龙虾”QClaw与WorkBuddy,重要原因之一便是只有它们可以通过微信调用。怎料微信选择亲自“拆墙”,推出“ClawBot”插件,接纳包括OpenClaw在内的一众外部Agent。
一夜之间,技术平权了。
不过,微信目前向外部Agent开放的仅是消息通道,并未像飞书、钉钉等企业协作平台一样开放各种内部能力——即便是腾讯版“龙虾”也无法接触微信聊天记录、公众号内容等核心数据。
看来“权限与操作”的能力,只能盼望微信正在研发的内部Agent来实现了。
放到更大视角来看,Agent时代,大厂这样“拆墙”又“建墙”正在成为常态,而第一批碰壁者已经出现了。
一、Agent撞上“权限之墙”
最近,AI创业圈有个论调:“MCP已死,CLI称王。”
原因是钉钉、飞书、企业微信等互联网大厂们纷纷选择开源了自家的CLI(命令行),而非MCP(模型上下文协议)。
简单说,CLI和MCP都是Agent与外部系统的“管道”。
不同于人类靠GUI(图形用户界面)与应用打交道,Agent可以通过“屏幕识别”和“模拟点击”等方式来完成任务。但这种方式低效且极易被系统识别为“非真人操作”而禁止使用——这正是豆包手机助手遭遇的困境。
更讲武德的方式是走API(应用程序接口),跳过繁琐的图形渲染,直接与应用后台对话一一这就需要应用供应商授权,而各家API接口协议不一样,为了让这种调用不各自为战,Anthropic推出MCP(Model ContextProtocol),是当前AI领域公认的统一接入标准,常被比作AI界的“type-C接口”。
换句话说:API 是业务能力,MCP 是 AI 接入业务能力的标准化插座。
而CLI算是“前朝遗老”,早期计算机交互的主要方式,用文字指令操作软件,因为其结构化、无冗余的特性,正在成为PC端Agent最顺手的操作方式。
但无论是MCP、CLI,还是API,它们都只是调用方式——是工具层的问题,能否真正实现,还要取决于双方的意愿。
开放决定着“龙虾”等Agent的技能上限。
目前来看,用户并非每次指使“龙虾”干活时都能找到解决方法,比如说“点外卖”“打车”这类基础需求,在阿里的AI应用“千问”、美团的AI应用“小美”中可以轻易完成,“龙虾”却苦于权限问题只能干瞪眼。
而且“龙虾”与“龙虾”之间也有能力差异:阿里的B端AI应用 “悟空”将淘宝、天猫、1688、支付宝等阿里生态的B端能力统一封装为可被AI直接调用的Skill和技能包;字节的ArkClaw深度集成飞书办公套件,还能调用抖音、今日头条的独家插件,飞书也是OpenClaw官方默认的即时通讯(IM)应用;腾讯专注于打造“龙虾天团”和上线“龙虾池”SkillHub,暂未发现其Agent拥有独家Skill。
在大洋彼岸,国外的AI御三家虽未跟风推出“龙虾”产品,但也在逐步将“办事”的能力集成到已有的产品中:在OpenAI撤回直接购物功能的同时,Gemini正尝试帮用户订餐、买菜和打车(目前仅限于Pixel或三星手机的Gemini应用中),而Claude干脆像OpenClaw一样可以自动操控用户的电脑执行任务。
很明显,现阶段Agent的能力上限,不仅与所用的大模型有关,还取决于Agent的权限边界。
面对Agent“敲门”,各家应用厂商们也是各怀心思。比如相同的搜索业务,百度大门敞开欢迎外部AI工具调用——在OpenClaw的官方技能商店 ClawHub上,百度搜索Skill下载量超4.5万次;谷歌却早早地删除 num=100参数,使得AI工具一次只能抓取前10个结果。
那么问题来了,面对外部Agent,为什么有人“拆墙”,有人“筑墙”?
二、墙的本质是商业模式之争
起初,Agent代理商们信奉着“用户授权,即可操作”的原则,试图造出“AI大一统入口”。不过,现实很快给出了答案:墙,不是技术问题,而是利益问题。
在国内,家喻户晓的冲突便是豆包手机助手与腾讯、阿里系应用之间的纷争。前者与手机厂商合作,获得硬件层面系统级的调度与操作应用的权限。结果上线几天便被腾讯、阿里系应用封杀,银行APP也弹出了风险提示。
在国外,典型案例便是亚马逊起诉AI搜索公司Perplexity,前者指控后者的AI浏览器Comet伪装成谷歌用户访问网站并完成购物流程,认为这是“欺诈”“违反使用条款”“危害用户的数据安全”。
表面上看,豆包被封是风控问题,Perplexity被告是合规问题。但本质指向同一个问题:当Agent替用户完成操作时,平台的价值链被截断了。
Agent每替用户完成一次操作,平台就少了一次广告曝光、一次数据采集、一次用户触达。Perplexity在反击文章里指出:AI只是用户的工具,企业无权干涉用户如何使用自己的账号;亚马逊的真正意图是把用户数据牢牢握在手中,卖出更多广告,是“霸凌者”。

Perplexity在博客更新《霸凌不是创新》,称亚马逊为“霸凌者”
2026年3月,美国地方法院裁定支持亚马逊,后Perplexity提起上诉,请求撤销或暂停执行禁令,目前上诉法院暂时中止了该禁令。
这意味,在法律层面,Agent想要操作应用,尚未规定必须获得用户以及应用开发者的双重授权。
目前,苹果、小米、三星等硬件厂商在做Agent时都采用了“双重授权”这一策略,通过系统级接口封装和标准化协议,让智能体在规范、可控的路径下操作应用。
而软件大厂们既是应用供应商,又是Agent代理商,是否为外部Agent“筑墙”取决于它的“命门”在哪儿。
比如同样是电商平台,亚马逊和Shopify对待外部Agent的态度截然相反。亚马逊不惜与Agent代理商打官司,Shopify则与Google、Walmart推出通用商业协议(UCP),主动给外部Agent开放标准化接口。
因为亚马逊是平台,卖流量;Shopify是服务商,卖交易。前者主要的盈利来源于广告,依赖用户在平台上的每一次点击与停留;而后者主要依靠促成交易抽佣,从商家GMV增长中实现增收。
对比中美两国,大厂“筑墙”固然是商业本能,但墙的“高度”取决于生态结构。美国平台多为垂直分工、各守一方;中国的移动互联网生态则由多个超级APP主导,大厂通过横向扩张、纵向整合,把社交、支付、内容、电商、本地生活等多项功能放进同一体系。
在这种结构下,超级应用的“命门”不再是单一业务,而是整套用户关系与数据。外部Agent一旦介入,冲击的不只是广告流量或一次交易,可能改变整个生态内部的逻辑。这也使得国内大厂对外部Agent的防御更为系统性。
此前就有某知名日用消费品集团的消费者体验负责人告诉“降噪NoNoise”,他们在海外已经看到一个品牌Agent可以实现跨平台服务的案例,这是因为很多国外用户习惯购物前先上Google搜索;但中国市场,线上购物场景分散、用户的消费习惯是直接到各电商平台站内搜索,电商平台也更注重把控站内流量,所以很难出现一个品牌Agent跨平台服务用户。
站在品牌角度,该负责人认为,通过一个个品牌知识库接入平台Skill,是更现实的实现方式。
三、Agent的诸侯割据
在科幻电影里,贾维斯可以连接任意终端,操控斯塔克住宅的每一台设备,还能调度钢铁战甲内部系统。但在现实的商业版图中,这种跨平台、跨终端的Agent“大一统”的幻想正在让位于“诸侯割据”的现实。
可以判断,在未来的很长一段时间内,中国很难出现代表“个人操作系统”的通用Agent,倒是平台内部的“统一入口”会加速成熟。
从国内大厂的近期布局来看,这种趋势日渐清晰。
阿里发力C端的千问锚定“AI办事”,在集成购物、外卖、订票等能力之后,又与自家的高德合作,提供AI“打车”服务;发力B端的“悟空”,用AI将自家的钉钉重做了一遍,并将阿里的to B能力统一放进去。
字节的豆包仍是中国第一大AI原生应用、也是字节C端规模最大的Agent。豆包与抖音、剪映、今日头条等字节系应用深度打通,目前还在内测购物功能。而吃到这波“龙虾”很大一部分流量的飞书,也推出了AI助手aily,加速B端AI商业化。
腾讯则押注“龙虾”全家桶,连“元宝派”里也可以创建龙虾bot。在“龙虾赛马”的同时,腾讯内部正在开发的专属于微信场景的AI Agent,应该具有更大的想象力。
微信早已打通社交、内容和支付三大场景,又通过小程序和视频号发力电商,产品月活超过11亿。在此基础上,微信Agent计划调用平台内数百万个小程序,让用户在聊天框内就能丝滑完成网约车、外卖、酒店预订、生活缴费等全场景服务。这意味着,微信或将能成为AI时代最高频的超级入口。
百度已不再执着于在应用端争夺AI入口,而是侧重于通过AI解决方案和大模型平台调用,对外输出AI能力。在“龙虾潮”中,百度不仅端出全家桶,还将核心的百度搜索打造成OpenClaw官方技能商店上全球下载量最大的搜索Skill。
这一路径选择同样基于现实:在这个字节、阿里与腾讯的年利润动辄以千亿计、AI资本开支同样以千亿计算的时代,百度不足200亿元的利润规模、十年千亿元AI投入的处境,已经被彻底挤出头部阵营。
落到AI应用层,打造一款好用的通用AI助手需要在应用场景、用户体验、投入资源上无短板,但文心一言基本都不占优势。所以外界会看到,百度正收拢此前分散的入口,将文心助手深度集成于百度App,并加强百度文库、网盘的资源投入,在B端则通过Token调用收费实现AI商业化。
这种战略选择有其合理性:当AI 迅速从“回答问题”走向“完成交易”,百度天然站在链路更靠后的位置,此时百度App可利用AI助手直接输出整合后的答案,自然嵌入符合筛选条件的商业服务,如用户搜机票后,可在搜索结果页完成机票的比价、预订、支付全流程。而百度此前的全栈AI投入亦可以在新到来的Token商业模式中发挥作用,因为自研芯片、框架与模型性能的配合度,将实际影响到每一个Token的价值高低。
在这些AI大厂之外,硬件厂商们也正在试图通过系统级AI Agent,重新定义AI时代的交互入口。相比软件大厂之间的剑拔弩张,掌握底层的硬件厂商们可能会有更多的跨应用、跨终端“办事”的优势。
近日就有市场传闻称,豆包二代AI手机暂定今年第二季度上新,目前TOP5手机厂商有两家在与豆包方面洽谈。
至于更进一步的Agent to Agent协作——即贾维斯式的Agent,主流大厂短期内不会放开这个口子,但注定会产生裂缝。
16世纪中叶,英国的一位剪绒工人发明了能够“代替手工”的起毛机,效率高到让同行恐慌。很快,英国国王就颁布了“起毛机禁令”。不过,随着第一次工业革命的到来,新机器如潮水般涌入纺织业,“起毛机禁令”也渐渐成了一纸空文。
“墙”,或许只能延缓冲击到来的时间,却无法阻止那个迟早会来的世界。
本文来自微信公众号:降噪NoNoise,作者:刘诗雨
