本文来自微信公众号: 秦朔朋友圈 ,作者:汪潇
这几个月,中国AI圈最有戏剧性的一幕,不在实验室,也不完全在资本市场,而在一个原本带有极客色彩的开源项目身上。
一只“龙虾”突然红了!它真正点燃的,不只是流量,而是一种新的预期:AI也许已经不再只是“会说”,而开始进入“会做”的阶段。
但真正值得追问的,不是OpenClaw火不火,而是它到底代表了什么。它是不是很多人口中的Agent时代已经到来?
如果把今天AI Agent的演进压缩成一句话,大概可以这样概括:
第一类是Copilot,核心是“懂你”;
第二类是API Orchestration,核心是“替你”;
第三类是AI-native Agent,核心则是“先于你”。
问题是,“先于你”从来不是一个功能点,而是一个结构问题。
OpenClaw为什么突然火了
首先,它击中了中国市场对“单人能力放大器”的强烈需求。企业在降本增效,个人在寻找超级个体路径,地方政府在找“AI+”的新抓手,平台在找新的分发入口。OpenClaw恰好站在这些力量的交叉点上。它让很多人第一次直观看到:AI不只是陪聊、写文案、做图,也可以替你整理邮件、调度日程、串起工作流。它不再只是“会说话的模型”,而是“开始会办事的代理人”。

其次,它的扩散方式很有中国市场特征。它不是先靠宏大发布会出圈,而是先靠“能不能用、值不值钱、能不能帮我干活”扩散。安装服务、教程、云端接入、企业试用一起出现,说明这类产品的普及,不是先从概念认同开始,而是先从动作价值开始。
第三,它让很多人第一次感受到:AI的价值不在答案,而在动作。过去两年,大模型的典型关系是“你问,我答”;OpenClaw往前推了一格:你说,我办。前者是经验,后者才开始接近真正的生产率工具。
然而,近几日频频出现的警示类报道,如流量资金消耗、动作失误、敏感目录访问、数据泄露、越权访问和被攻击风险等,表明了三个问题:
第一,安全问题已经从模型答错,升级为真实动作失控。
第二,AI越能办事,越需要边界。
第三,开源繁荣与社会治理之间的张力,已经提前到来。
所以,OpenClaw的火,不只是一个工具爆红,而是一次认知转换。AI的下一轮竞争,不只是模型会不会说,而是能不能真正替人调动系统和世界。
为什么说OpenClaw属于第二类
很多人看到OpenClaw能调邮箱、调日历、调浏览器、调系统,就容易直接把它置于“真正自主智能”的位置上。
但更准确地说,它属于第二类,也就是API Orchestration/接口式编排范式。
第二类AI的本质,不是创造新能力,而是把既有能力重新组织起来。用户之所以觉得它“全能”,并不是因为它自己什么都会,而是因为它把原本散落在日历、邮件、支付、浏览器、数据库和工具链里的能力,重新编成了一条更顺的动作链。
所以第二类AI给用户的核心感受是:
更省心,更全能。
OpenClaw、Manus、CoPaw:同属第二类,但分工不同。
把OpenClaw、Manus、CoPaw放在一起看,会更清楚。
OpenClaw更像“开放编排层”。它擅长把聊天入口、工具、模型和系统连起来,本质上像底盘、像接线板。
Manus更像“第二类的产品完成态展示”。它把任务拆解、工具调用、执行过程做得更可见,所以更容易让用户直观感受到“一个AI真的在替我工作”。
CoPaw则更像“平台型工作台”。它强调多渠道接入、模块化、可控、本地或云部署,更像一台工程化的个人agent控制台。
而这三者放在一起,会导出第二类下一步最重要的一个方向:
第二类AI的演进,不只是越来越会替你做事,还要越来越向用户透明化、可视化“它究竟怎样替你做事”。
为什么这点重要?
因为一旦agent真正连系统、走流程、发动作,用户自然会问:它刚才调了哪些系统?哪一步是我授权的?哪一步是它自己判断的?如果错了,我怎么回退?
Manus更容易被理解,恰恰就在于它把“替你”的过程做得更可见。
所以第二类真正成熟的标志,不只是“替你”,而是把替你的过程做成可视、透明、可追溯。
第三类在哪里
如果说OpenClaw让我们看到了第二类的突然具象化,那么MiniMax则代表了中国公司里最有野心的一种尝试:从模型公司走向平台公司,再向第三类AI-native Agent逼近。
MiniMax最值得看的,不只是产品线,而是它对自己位置的清醒。
闫俊杰有几句话非常关键。他说,像海螺AI这种智能助手“其实是没有定义的”“我们的产品都是撞出来的”;
他又提出MiniMax要从一家模型公司迈向“AI时代的平台型公司”,并把平台价值概括为:
智能密度×Token吞吐量。
这几句话放在一起,其实表达得很清楚:
MiniMax知道行业形态还没稳定,也知道单靠用户数并不能定义未来,它真正想做的是一个可持续输出智能的平台。
为什么说它在逼近第三类?
第一,它已经出现了主动性的萌芽。Talkie/星野这类产品已经不只是被动等你说话,而会主动发起问候、调用长期记忆,且根据你的情绪和上下文调整互动。
第二,它走的是全模态路线。语言、视频、语音、音乐一起做,意味着它并不想停在文本对话层,而是想建立更完整的智能底座。闫俊杰明确说过,多模态融合是持续提升智能的基本前提。
第三,它已经把自己当作AI-native组织试验场。内部agent覆盖近90%员工日常工作场景,员工正在从“教Agent如何工作”转向“观察Agent如何工作”。这说明AI在MiniMax这里,不只是产品,也在变成一种组织方式。
但为什么又说它还没到?
因为第三类真正成立,不只要“更主动”,还要跨过三道坎。
第一,主动性还不够深入。今天MiniMax的主动性更多还是场景内主动性,比如主动问候、主动延续对话,而不是目标驱动的主动发现。
真正的第三类,应该能基于你的状态、日程、行为变化,发现你没有显式说出口的问题。
第二,它还缺少现实行动闭环。MiniMax的很多亮点仍然主要停留在虚拟空间里的认知增强和内容生产,而第三类真正的关键,是能不能跨平台、跨系统、跨现实动作形成闭环。
第三,也是最关键的一点:它还没有真正完成2C底座。真正的第三类AI不可能裸奔。在消费场景里,它必须建立在法律规则、伦理边界、平台制度、个体授权和风险治理之上。MiniMax自己其实已经意识到了这一点,并明确提到“构建完善的2C底座,是向更高阶AI Agent演进的必经之路”。
所以,对MiniMax最准确的评价不是“已经是第三类”,而是:它已经具备第三类的技术前兆、产品倾向和组织意图,但还没有完成第三类所要求的主动性深度、现实行动闭环,以及社会化底座整合。
MiniMax与Kensho:一个在逼近第三类,一个更接近第三类的局部现实
如果要给MiniMax找一个更有启发性的对照对象,我认为是Kensho。
因为Kensho更接近第三类的定义本身。它的价值不在于更会聊天,而在于更擅长在高价值垂直场景中整合多源信息、发现人类未显式提出的问题,并在边界内实施动作。
这也是它与MiniMax最重要的差别。
MiniMax更像通用能力平台向第三类逼近的冲刺者。它的优势在于广,在于它想覆盖更普遍的用户世界和更通用的agent场景。
Kensho则更像垂直高价值场景里的“第三类局部完成态”。它不一定有更强的大众产品心智,但在特定行业里更接近“主动发现问题+边界内行动”这一核心。
换句话说:
MiniMax更像“面向第三类的通用冲刺者”;Kensho更像“在垂直场景里更接近第三类的先行样本”;但两者也有一个非常关键的共性问题。
那就是:它们都不能只靠模型和agent本身成立。
只要AI开始从“替你做”走向“先于你发现并行动”,就都会碰到同一个根本问题:
谁来托底?
对MiniMax,这个问题表现为2C底座。它必须知道什么能做、什么不能做、什么要二次确认、什么涉及隐私、财务、伦理和未成年人边界。
对Kensho,这个问题表现为行业底座。在金融复杂决策场景里,它同样不能裸奔,而必须建立在规则引擎、数据治理、知识图谱、权限控制、风控与审计之上。
所以,MiniMax和Kensho虽然分属不同赛道,一个更通用,一个更垂直,但它们最终都指向同一个结论:
第三类AI不是模型问题,而是底座问题。
结语:真正到达第三类,还缺什么
OpenClaw让我们看见了第二类的爆发,MiniMax让我们看见了第三类的轮廓,但从第二类通向第三类,真正缺的不只是更强模型,而是更完整的结构。
这个结构至少包括四个要素:
第一,有更强的行动能力。
不是更长上下文,而是更稳定的工具调用、搜索、记忆、计划和多agent协同能力。
第二,有更深的系统接入能力。
第二类不会被第三类消灭,反而会成为第三类的前提。没有API Orchestration,第三类只能空转。
第三,有更成熟的2C底座或行业底座。
在消费场景中,需要法律、伦理、授权和风险治理;在高价值垂直场景里,需要规则引擎、知识图谱、风控与审计。就如同在工业场景里,这个结构会越来越像一个整合工业物理、工艺规则、设备状态、管理逻辑和权限控制的“泛工软平台”。没有底座,第三类AI就只能聪明,无法可靠。
第四,要从“规则触发”走向“认知驱动”。
不仅仅是更积极主动一点,而是真的能在持续互动中发现问题、提出你没说出口的需求,并在边界内采取动作。
这就如同你是需要一个仅仅能说会道、调动情绪的伙伴,还是一个能够踏实做事、始终陪伴、坚定可靠,同时又能及时发现甚至解决问题,与你产生真正有价值互补性的伙伴群体?
也就是说,真正的第三类,不是一个更自动化的工作流,也不是一个更会聊天的助手,而是一种新的行动基础设施。
所以,今天看OpenClaw,不该只看到热度;看MiniMax,也不该只看到估值和产品线。
真正应该看到的,是这条越来越清晰的进化链:
从懂你,
到替你,
再到先于你。
