中国AI Agent发展进入新阶段，从"懂你"的Copilot到"替你"的API编排，再到"先于你"的AI-native Agent，OpenClaw和MiniMax分别代表了第二类和第三类的探索，但真正实现跃迁需要解决行动能力、系统接入、社会底座等结构性挑战。 ## 1. OpenClaw爆红背后的市场逻辑 - 满足中国市场对"单人能力放大器"的强烈需求，企业、个人、政府都在寻找AI+新抓手 - 扩散方式体现中国特色：先验证实用价值而非概念认同，通过安装服务、教程、企业试用快速普及 - 让用户首次意识到AI价值从"答案"转向"动作"，从"你问我答"升级为"你说我办" ## 2. 第二类Agent的本质与演进方向 - OpenClaw属于API Orchestration范式，本质是重组现有能力而非创造新能力 - 同类产品分工差异：OpenClaw是开放编排层，Manus展示执行过程，CoPaw是模块化工作台 - 关键演进方向是透明化"替你"的过程，需实现动作可视化、可追溯，目前内部agent已覆盖MiniMax近90%员工场景 ## 3. 第三类Agent的三大门槛 - MiniMax展现第三类雏形：具备主动性萌芽（如Talkie主动问候）、全模态路线、内部AI组织试验 - 但未跨过关键门槛：目标驱动的主动发现能力不足，缺少现实行动闭环，2C底座尚未完善 - Kensho在金融垂直领域更接近第三类，体现"主动发现问题+边界内行动"核心能力 ## 4. 实现跃迁的四大结构要素 - 行动能力：需稳定工具调用、多agent协同，而不仅是长上下文 - 系统接入：第二类API编排是第三类的基础前提 - 社会底座：消费场景需法律/伦理框架，垂直领域需规则引擎/风控体系 - 认知驱动：要超越规则触发，实现未声明需求的主动发现与边界内行动

2026-03-18 00:08

“养虾”之后，AI Agent如何跃迁？

秦朔朋友圈

速览

本文来自微信公众号：秦朔朋友圈，作者：汪潇

这几个月，中国AI圈最有戏剧性的一幕，不在实验室，也不完全在资本市场，而在一个原本带有极客色彩的开源项目身上。

一只“龙虾”突然红了！它真正点燃的，不只是流量，而是一种新的预期：AI也许已经不再只是“会说”，而开始进入“会做”的阶段。

但真正值得追问的，不是OpenClaw火不火，而是它到底代表了什么。它是不是很多人口中的Agent时代已经到来？

如果把今天AI Agent的演进压缩成一句话，大概可以这样概括：

第一类是Copilot，核心是“懂你”；

第二类是API Orchestration，核心是“替你”；

第三类是AI-native Agent，核心则是“先于你”。

问题是，“先于你”从来不是一个功能点，而是一个结构问题。

OpenClaw为什么突然火了

首先，它击中了中国市场对“单人能力放大器”的强烈需求。企业在降本增效，个人在寻找超级个体路径，地方政府在找“AI+”的新抓手，平台在找新的分发入口。OpenClaw恰好站在这些力量的交叉点上。它让很多人第一次直观看到：AI不只是陪聊、写文案、做图，也可以替你整理邮件、调度日程、串起工作流。它不再只是“会说话的模型”，而是“开始会办事的代理人”。

其次，它的扩散方式很有中国市场特征。它不是先靠宏大发布会出圈，而是先靠“能不能用、值不值钱、能不能帮我干活”扩散。安装服务、教程、云端接入、企业试用一起出现，说明这类产品的普及，不是先从概念认同开始，而是先从动作价值开始。

第三，它让很多人第一次感受到：AI的价值不在答案，而在动作。过去两年，大模型的典型关系是“你问，我答”；OpenClaw往前推了一格：你说，我办。前者是经验，后者才开始接近真正的生产率工具。

然而，近几日频频出现的警示类报道，如流量资金消耗、动作失误、敏感目录访问、数据泄露、越权访问和被攻击风险等，表明了三个问题：

第一，安全问题已经从模型答错，升级为真实动作失控。

第二，AI越能办事，越需要边界。

第三，开源繁荣与社会治理之间的张力，已经提前到来。

所以，OpenClaw的火，不只是一个工具爆红，而是一次认知转换。AI的下一轮竞争，不只是模型会不会说，而是能不能真正替人调动系统和世界。

为什么说OpenClaw属于第二类

很多人看到OpenClaw能调邮箱、调日历、调浏览器、调系统，就容易直接把它置于“真正自主智能”的位置上。

但更准确地说，它属于第二类，也就是API Orchestration/接口式编排范式。

第二类AI的本质，不是创造新能力，而是把既有能力重新组织起来。用户之所以觉得它“全能”，并不是因为它自己什么都会，而是因为它把原本散落在日历、邮件、支付、浏览器、数据库和工具链里的能力，重新编成了一条更顺的动作链。

所以第二类AI给用户的核心感受是：

更省心，更全能。

OpenClaw、Manus、CoPaw：同属第二类，但分工不同。

把OpenClaw、Manus、CoPaw放在一起看，会更清楚。

OpenClaw更像“开放编排层”。它擅长把聊天入口、工具、模型和系统连起来，本质上像底盘、像接线板。

Manus更像“第二类的产品完成态展示”。它把任务拆解、工具调用、执行过程做得更可见，所以更容易让用户直观感受到“一个AI真的在替我工作”。

CoPaw则更像“平台型工作台”。它强调多渠道接入、模块化、可控、本地或云部署，更像一台工程化的个人agent控制台。

而这三者放在一起，会导出第二类下一步最重要的一个方向：

第二类AI的演进，不只是越来越会替你做事，还要越来越向用户透明化、可视化“它究竟怎样替你做事”。

为什么这点重要？

因为一旦agent真正连系统、走流程、发动作，用户自然会问：它刚才调了哪些系统？哪一步是我授权的？哪一步是它自己判断的？如果错了，我怎么回退？

Manus更容易被理解，恰恰就在于它把“替你”的过程做得更可见。

所以第二类真正成熟的标志，不只是“替你”，而是把替你的过程做成可视、透明、可追溯。

第三类在哪里

如果说OpenClaw让我们看到了第二类的突然具象化，那么MiniMax则代表了中国公司里最有野心的一种尝试：从模型公司走向平台公司，再向第三类AI-native Agent逼近。

MiniMax最值得看的，不只是产品线，而是它对自己位置的清醒。

闫俊杰有几句话非常关键。他说，像海螺AI这种智能助手“其实是没有定义的”“我们的产品都是撞出来的”；

他又提出MiniMax要从一家模型公司迈向“AI时代的平台型公司”，并把平台价值概括为：

智能密度×Token吞吐量。

这几句话放在一起，其实表达得很清楚：

MiniMax知道行业形态还没稳定，也知道单靠用户数并不能定义未来，它真正想做的是一个可持续输出智能的平台。

为什么说它在逼近第三类？

第一，它已经出现了主动性的萌芽。Talkie/星野这类产品已经不只是被动等你说话，而会主动发起问候、调用长期记忆，且根据你的情绪和上下文调整互动。

第二，它走的是全模态路线。语言、视频、语音、音乐一起做，意味着它并不想停在文本对话层，而是想建立更完整的智能底座。闫俊杰明确说过，多模态融合是持续提升智能的基本前提。

第三，它已经把自己当作AI-native组织试验场。内部agent覆盖近90%员工日常工作场景，员工正在从“教Agent如何工作”转向“观察Agent如何工作”。这说明AI在MiniMax这里，不只是产品，也在变成一种组织方式。

但为什么又说它还没到？

因为第三类真正成立，不只要“更主动”，还要跨过三道坎。

第一，主动性还不够深入。今天MiniMax的主动性更多还是场景内主动性，比如主动问候、主动延续对话，而不是目标驱动的主动发现。

真正的第三类，应该能基于你的状态、日程、行为变化，发现你没有显式说出口的问题。

第二，它还缺少现实行动闭环。MiniMax的很多亮点仍然主要停留在虚拟空间里的认知增强和内容生产，而第三类真正的关键，是能不能跨平台、跨系统、跨现实动作形成闭环。

第三，也是最关键的一点：它还没有真正完成2C底座。真正的第三类AI不可能裸奔。在消费场景里，它必须建立在法律规则、伦理边界、平台制度、个体授权和风险治理之上。MiniMax自己其实已经意识到了这一点，并明确提到“构建完善的2C底座，是向更高阶AI Agent演进的必经之路”。

所以，对MiniMax最准确的评价不是“已经是第三类”，而是：它已经具备第三类的技术前兆、产品倾向和组织意图，但还没有完成第三类所要求的主动性深度、现实行动闭环，以及社会化底座整合。

MiniMax与Kensho：一个在逼近第三类，一个更接近第三类的局部现实

如果要给MiniMax找一个更有启发性的对照对象，我认为是Kensho。

因为Kensho更接近第三类的定义本身。它的价值不在于更会聊天，而在于更擅长在高价值垂直场景中整合多源信息、发现人类未显式提出的问题，并在边界内实施动作。

这也是它与MiniMax最重要的差别。

MiniMax更像通用能力平台向第三类逼近的冲刺者。它的优势在于广，在于它想覆盖更普遍的用户世界和更通用的agent场景。

Kensho则更像垂直高价值场景里的“第三类局部完成态”。它不一定有更强的大众产品心智，但在特定行业里更接近“主动发现问题+边界内行动”这一核心。

换句话说：

MiniMax更像“面向第三类的通用冲刺者”；Kensho更像“在垂直场景里更接近第三类的先行样本”；但两者也有一个非常关键的共性问题。

那就是：它们都不能只靠模型和agent本身成立。

只要AI开始从“替你做”走向“先于你发现并行动”，就都会碰到同一个根本问题：

谁来托底？

对MiniMax，这个问题表现为2C底座。它必须知道什么能做、什么不能做、什么要二次确认、什么涉及隐私、财务、伦理和未成年人边界。

对Kensho，这个问题表现为行业底座。在金融复杂决策场景里，它同样不能裸奔，而必须建立在规则引擎、数据治理、知识图谱、权限控制、风控与审计之上。

所以，MiniMax和Kensho虽然分属不同赛道，一个更通用，一个更垂直，但它们最终都指向同一个结论：

第三类AI不是模型问题，而是底座问题。

结语：真正到达第三类，还缺什么

OpenClaw让我们看见了第二类的爆发，MiniMax让我们看见了第三类的轮廓，但从第二类通向第三类，真正缺的不只是更强模型，而是更完整的结构。

这个结构至少包括四个要素：

第一，有更强的行动能力。

不是更长上下文，而是更稳定的工具调用、搜索、记忆、计划和多agent协同能力。

第二，有更深的系统接入能力。

第二类不会被第三类消灭，反而会成为第三类的前提。没有API Orchestration，第三类只能空转。

第三，有更成熟的2C底座或行业底座。

在消费场景中，需要法律、伦理、授权和风险治理；在高价值垂直场景里，需要规则引擎、知识图谱、风控与审计。就如同在工业场景里，这个结构会越来越像一个整合工业物理、工艺规则、设备状态、管理逻辑和权限控制的“泛工软平台”。没有底座，第三类AI就只能聪明，无法可靠。

第四，要从“规则触发”走向“认知驱动”。

不仅仅是更积极主动一点，而是真的能在持续互动中发现问题、提出你没说出口的需求，并在边界内采取动作。

这就如同你是需要一个仅仅能说会道、调动情绪的伙伴，还是一个能够踏实做事、始终陪伴、坚定可靠，同时又能及时发现甚至解决问题，与你产生真正有价值互补性的伙伴群体？

也就是说，真正的第三类，不是一个更自动化的工作流，也不是一个更会聊天的助手，而是一种新的行动基础设施。

所以，今天看OpenClaw，不该只看到热度；看MiniMax，也不该只看到估值和产品线。

真正应该看到的，是这条越来越清晰的进化链：

从懂你，

到替你，

再到先于你。

AI创投日报频道: 前沿科技

本内容来源于网络原文链接，观点仅代表作者本人，不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com，我们将及时核实并处理。

正在改变与想要改变世界的人，都在虎嗅APP