OpenClaw到底是个啥,以及它要干嘛?
2026-03-02 08:36

OpenClaw到底是个啥,以及它要干嘛?

本文来自微信公众号: 叶小钗 ,作者:叶小钗,原文标题:《祛魅!OpenClaw 到底是个撒,以及他要干嘛?》,题图来自:AI生成


前阵子刷社交平台,我也经历了那种“以为苹果又开发布会”的错觉:一堆人晒 Mac mini 下单截图,理由不是剪视频、不是编译项目,而是为了跑一个开源 AI 助理 OpenClaw!



更离谱的是,各种传言在同一时间爆炸:


1. OpenClaw 帮自己做量化交易。

 

2. OpenClaw 组建了一个多智能体团队,自动跑通跨境电商全流程。


3. OpenClaw 让我从此不用再回邮件、排日程、订机票。


然后上周,去年类似 DeepSeek 一体机事件爆发,我朋友拿着尘封的 Mac Mini 装了小龙虾,调价后居然卖爆了,这东西确实吓人......


因为其中信息真真假假、虚虚实实,如果你把这些话全当真,那确实容易焦虑:是不是又一个AI 时代,你不学就会被淘汰的版本?



年前,我花了两天调研加亲手实测,再根据最近做Agent的心得,最后得到一个更冷静、但我认为更重要的结论:


OpenClaw 并没有带来什么技术革命,它更像一次“工程能力 + 产品叙事”的胜利:


把一堆早就存在的能力(模型、工具调用、记忆、插件、消息入口、权限)串成了一个可见、可用、可扩展的整体。


它火,不是因为 AI 突然更聪明了,而是因为 AI 的能力第一次被“做成了一个能交付的系统”。


本文不是部署指南,也不是“又菜又爱玩”的硬核教程;它只做一件事:把 OpenClaw 这波热度背后真正有价值的东西拆开讲清楚:


它是什么、为什么像“能做事”、它和其它 AI 工具到底差在哪儿、以及你该如何避免把它变成一颗定时炸弹。


所以,OpenClaw 到底的什么?


OpenClaw是什么?


首先概括下:更像“智能体网关”,不是“又一个聊天机器人”。


官方开始的名称是 Clawdbot,有点碰瓷 Claude Code,随后改名 Moltbot,依旧不行才改名OpenClaw,大家也可以想想这么改名都还火爆,可见其受欢迎程度了。


官方的定位很直白:


个人 AI 助理,或者说 AI 智能体网关。


它更像一个“总控台”,负责接入你的聊天入口:WhatsApp、Telegram、Discord、iMessage,你常用哪个,就让它住在哪;


  • 它负责把你的指令转成可执行的流程:发消息、查资料、跑脚本、写文件、调用 API;

 

  • 它负责“记住你”,把对话里的关键信息沉淀成长期记忆,之后继续用得上;

 

  • 它还负责把能力拆成插件或技能,你想做什么,就装什么,甚至可以让它去写新的技能。

 

OpenClaw 不是“更会聊天的 AI”,而是“让指令能跑起来”的执行框架。


过去两年我们见到的大多数 AI 产品,他们多数还是“对话器”:你问,它答;你再追问,它再答;它可能给你一份很漂亮的步骤清单,但中间那段执行链路,仍然要你自己去点、去填、去跑、去验证。


OpenClaw 想解决的恰恰是这段“中间环节”:把“建议”变成“交付”。


这里也产生了一个特别容易被误解的点:“本地运行”不等于“模型推理都在本地算”。


OpenClaw 更多像一个“跑在你机器上的管家/调度器”。真正烧钱的是推理,通常还是由 OpenAI、Anthropic 等云端模型完成;


你的设备主要做的是收发消息、调用 API、运行一些脚本和工具。所以大家在晒的 Mac mini 并不是必须。能跑 Node.js 的设备就能跑它。



对大多数人来说,一台轻量级云服务器,或者家里一台 24 小时开机的旧电脑就够用了。


那为什么 Mac mini 会被带火、甚至“买断货”?答案其实很朴素:因为这东西确实不安全。


很多人买一台“专门跑它的机器”,本质是在用硬件隔离降低风险。


从这里就可以看出它的暂时真正定位了:用来做实验、做Demo,搞点噱头,这其中也包含了它为什么这么火的原因。


OpenClaw为什么这么火?


首先,我们不能对 AI 火爆的事物有偏见,但也不能过分拔高,要理解:焦虑和好奇心只是表层,更深层是“能力具象化”。


OpenClaw 这次出圈的传播路径非常典型,而且几乎是爆款模板:


1. 入口足够日常,你不用打开一个“AI 工作台”,而是像发消息给同事一样发指令;


2. 过程足够可视,浏览器窗口自己打开、点击、输入、翻页,视觉冲击拉满;


3. 结果足够具体,不是“给你建议”,而是“给你搞定了一件事”。


对非技术人来说,AI “会写作文”已经不稀奇;AI “会操作电脑”才像科幻片穿模。于是焦虑感和好奇心一起被点燃:好奇心是它还能做什么,焦虑感是我现在做的这些跑腿活会不会被替代。


但我更愿意把它理解为一种“生产力工具的交付方式升级”:不是“AI 变聪明了”,而是“AI 终于更像一个可用的系统”。


过去你很难向普通人解释“函数调用”“工具执行”、“agent loop”、“RAG”这些词有什么意义;


但当他看到浏览器自己完成值机、把摘要发回 Telegram,他会瞬间理解:原来 AI 真的可以替我跑腿。


这就是“能力具象化”的力量:它把抽象概念变成了肉眼可见的流程。


这里就开始涉及其底层四大实现了:入口、执行、记忆、扩展。


OpenClaw四大核心能力


如果用一句话概括 OpenClaw 的价值,那便是:它把“自然语言”变成“可以持续运行的自动化工作流”,并且把这个工作流放进你的日常沟通入口里。下面我们把这四块拆开看。


入口


AI 不再被锁在“盒子”里,而是如影随形。



很多 AI 工具的问题不是能力不够,而是入口不顺手——你要刻意打开一个 App 或网页,在工具上下文和真实工作上下文之间来回切换。


OpenClaw 的做法是把入口放回聊天软件:你用 Telegram 发消息,它就从 Telegram 回你;


你用 Discord 说一句,它就在 Discord 里汇报进度。这带来的体验变化很明显:AI 从“你想起它才用”变成“随时在线可叫”,从“对话窗口”变成“你的工作流的一部分”。


它入口不别扭、可主动、有长期记忆、插件化扩展强、权限够高——这些点叠加起来,才构成它的传播势能。


PS:其实从这里也可以看出,腾讯因为坐拥微信,是很可能在AI领域后发先至的,因为入口就在那。


执行


浏览器加文件加命令加 API,才是“能做事”的真内核。


真正让 OpenClaw 看起来像“活人助理”的,是它具备执行能力:


1. 能操作浏览器,打开网页、点击按钮、填写表单、抓取信息、提交流程;能读写文件,整理文档、生成报告、批量处理素材;


2. 能跑命令或脚本,执行自动化任务、调用 CLI 工具、跑一段流程;


3. 能调用外部 API,把“动作”扩展到各种服务,比如邮箱、日历、IM、项目管理等。


 

这些能力不是魔法,本质是工程:把工具封装成可调用的动作,再让模型去选择、组合、验证。


但“本质不魔法”并不影响“体验像魔法”,因为对大多数人来说,关键就一句话:我少做了很多重复动作。


实测也很好地支撑了这一点:比如让它下载图片保存到本地、用 Skill 管理 QQ 邮箱——这不是“模型更聪明”,而是“系统真的能动手”。


当然,不可避免的是:这东西依旧是AI最本质泛化能力的体现,用 Token 去换架构,只不过成本能不能打平可能是很大的问题。


记忆


把“下一次又失忆”的通病,变成可控的文件系统。


OpenClaw 对“记忆”的处理方式很朴素,但很有效:把记忆落在本地工作区的 Markdown 文件里。



典型结构是 memory/YYYY-MM-DD.md 做每日运行日志,MEMORY.md 做整理后的长期记忆,并强调“文件才是事实来源”。


这种设计的好处是透明,你可以直接打开文件看它“记了什么”:


1. 可控:你可以删、改、重写,甚至版本管理;


2. 可迁移:不被某个厂商的黑箱记忆绑死;


当然代价也很清楚:记忆写入和检索质量依赖模型,记忆越多,索引、检索、注入上下文的成本越高,记忆是“资产”,也是“泄露面”。


但至少它把“AI 记忆”从玄学变成了工程问题:能看见,就能优化。


而且实际实操下来,这东西与 Manus 等Agent类似:简单任务、单轮对话还好,但多轮对话、复杂任务就够呛了。


扩展


Skills 生态让它从“会几招”变成“越来越能干”。



OpenClaw 的 Skills(技能/插件)生态,是热度放大的第二引擎。Skills 的心智模型更接近“装浏览器插件”或“装 npm 包”,而不是“抄一段提示词”。


核心原因在于:Skills 本质是代码、脚本、配置加操作说明。它教会 OpenClaw:要完成某件事,应该调用哪些命令、哪些 API,需要哪些参数、依赖、环境变量,要注意什么安全边界、失败如何回滚。


技能越多,能做的事越多 → 能做的事越多,越多人愿意用 → 越多人用,越多人贡献技能,形成正反馈。


这也是为什么我更愿意把这波爆火理解为“生态爆发”,而不是一次短暂营销:它把“工具调用”变成了可分享、可复用、可迭代的社区资产。


另外也可以看出:OpenClaw 爆发的基础在某些程度是依赖 Skills 的,而其背后的本质是 Workflow 的迁移。




比之ChatGPT、Claude如何


一个常见误解是:OpenClaw 很强,所以它的“模型”很强。


但实际上它的强,更多来自系统形态:强模型擅长“思考/表达”,但不擅长“交付”;OpenClaw 的目标是把强模型接到“手”和“脚”上,让它能完成闭环。


用流程对比最直观。传统 AI 工具:你提出问题,AI 给你建议,你自己动手执行,遇到问题再问 AI,AI 再给你建议,如此循环。


OpenClaw 想实现:你给一个任务,它自己拆解任务,它自己找信息、选工具、写脚本,它自己执行并自检,它把最终结果交付给你。


中间最大的区别是“中间环节”:传统 AI 的中间环节是对话,OpenClaw 的中间环节是执行。


这也解释了为什么很多人第一次用它会觉得“像有个真人助理在后台干活”:因为它真的在后台干活,而不是在聊天窗口里给你写 SOP。


这里可能也就是最大的成本问题所在了,它本质依旧在用循环(成本)换 SOP的泛化,可以说是 Agentic Workflow 的进一步体现:





为什么又慢又贵


只要你让一个智能体真正“去做事”,它就不可能像“单轮问答”那么快。


因为做事意味着要拆解问题(这一步就可能来回推演多轮),要获取信息(浏览网页、查 API、读文件),要执行动作(每一步都可能失败),要验证结果(验证失败就要回滚或重试)



这会带来一个很现实的副作用:token 消耗会比聊天大得多。



你问“今天天气如何”,可能一两次调用就结束;但你让它“规划一次旅行并完成订票流程”,背后可能是十几轮思考、十几次工具调用,甚至还要不断回看上下文、写入记忆。


因此 OpenClaw 经常给人一种“左右脑互搏”的感觉:它像在后台自己跟自己对话,直到把路径跑通。


从产品角度看,这是必要的“自治成本”;从用户角度看,就是两件事:等待时间更长,token 账单更大。


所以更现实的定位是:把 OpenClaw 当作长期在线、能跑腿的执行框架,而不是“免费的万能劳动力”。


这里也要涉及 OpenClaw,或者说 AI 最不愿面对的问题了:风险!


高权限=危险


OpenClaw 最大胆、也最有争议的地方,是它敢于把“系统权限”作为卖点之一。



当一个工具可以读写你的文件、控制你的浏览器、执行你的命令、调用你绑定的邮箱、日历、IM、第三方服务时,它就不再是一个普通应用,而是一个“权限入口”。


同样一句“它能做事”,在不同人听来会有两种完全不同的解读:生产力派觉得太爽了,终于有人把链路打通;安全派觉得太危险了,你这是把自己交出去了。


而风险并不抽象。尤其当 Skills 生态开始爆炸后,“插件供应链”会成为最薄弱的一环:恶意技能、提示注入、权限误配、对外暴露端口……


任何一个环节出问题,都可能不是“工具不好用”,而是“资产直接受损”。


OpenClaw 最强的一面,恰恰也是最危险的一面:它能做的事太多了。把它当“聊天机器人”,你会低估风险;把它当“系统入口”,你才会建立正确的安全心智。


所以,我们该如何使用 OpenClaw 呢?


助理 VS 上帝


OpenClaw 这种系统形态,确实代表了一种未来:AI 不再只给建议,而是能把任务跑完。但要让它可控,需要你从一开始就用“安全优先”的方式去设计它的使用姿势。


首先,分离工作区:助理的电脑不等于你的主力电脑。


如果条件允许,让 OpenClaw 跑在一台单独的机器上,比如旧电脑、小主机或云服务器,或者一个隔离的虚拟机、容器、沙箱环境。


这样就算它误操作、或者某个技能带恶意行为,损失也会被限制在隔离区内。也正因为这个原因,很多人才会去买一台专门跑它的设备:不是算力刚需,而是隔离刚需。


其次,权限最小化:先从“低风险闭环”开始。


最容易跑通且风险相对低的任务通常是信息整理,比如抓链接、提取要点、生成 markdown;


固定格式写作,比如日报、周报、会议纪要;轻量脚本,比如批量重命名、生成清单、同步文件。


相对不建:


1. 上来就做金融相关操作:比如转账、交易、下单;

 

2. 具有不可逆后果的操作,比如删库、批量删除文件、群发;


3. 需要强隐私的场景,比如完整邮箱、完整聊天记录全量开放;


总而言之:先让它在低风险场景形成闭环,再逐步放权。


最后,把 Skills 当作软件安装:先审,再装,再上生产。


Skills 本质是“可执行资产”,不是“提示词收藏”。你需要在安装前至少做到:


  1. 看一眼它要什么环境变量,意味着要什么权限或凭据;


2. 看一眼它会调用哪些命令或脚本,意味着会做什么动作;


3. 优先选择维护者清晰、更新频繁、评价可信的技能;


你越把它当“插件生态”,你就越要用“供应链安全”的方式对待它。


然后,再说说其直接“竞品”,另一个 AI 明星 Manus:



OpenClaw VS Manus


很多人会把 Manus、Cowork、OpenClaw 放在一起比较。这里有一个很好用的区分维度:工作发生在哪里。整理成三类“工作形态”:


1. 云端远程型:给它一台云电脑,任务在云端跑。优势是不用暴露你的本地文件和权限,适合跨网站流程,比如订票、填表、信息搜集。

 

2. 本地协作型:在你划定的工作区干活。优势是人类监督强,更像“同事”,适合写作、资料整理、代码协作、办公流自动化。 


3. 网关长期在线型:入口在聊天软件里,能力靠技能扩展。优势是随时接活、能执行、扩展自由,风险是权限更直接,资产触达面更大。


OpenClaw 更偏第三种:入口更生活化、链路更长、扩展更自由,风险也更直接:你给它什么权限,它就能触及什么资产。


相较于 Manus,OpenClaw 多出来的是更近的聊天 IM 以及更大的权限。


这其实并没有什么技术门槛,全是看谁胆子大罢了。技术门槛不高,但工程完整度、产品叙事、生态组织能力才是真正门槛。


从这里大家应该都发现了,其实 OpenClaw 也是Agent,架构上没太大区别,但你去看它的代码,挺优雅的。



这里一定就有人开始焦虑了:OpenClaw 这么“强”,我会失业吗?


失业警告


每次看到有人说AI 要让我失业了,然后直接点名 OpenClaw,我都想替它喊个冤:真没这么夸张。


OpenClaw 这玩意儿,说白了,就是让那些本来就能被流程化的事情,变得更自动化了一点。


什么样的工作容易被盯上?


1. 就是那种目标清清楚楚,我要什么你给我什么;

 

2. 干得好不好一眼能看出来,对错有标准;

 

3. 天天干、月月干,重复度高;

 

4. 能拆成一堆小块,小动作拼成大活儿。

 

所以最容易被波及的往往是大量重复的运营活儿、助理跑腿活儿;标准化的信息搜集、整理、归档;没啥风险的流程执行,比如提交表单、搬运数据、生成周报。


但你要说它能把人全换了,我也不信。


因为真实工作里,最难的根本不是“干活儿”那一下,而是需求说不清楚,“我也想要个那样的,你懂吧?”;


目标说变就变,早上定好的下午就推翻;出了问题谁背锅,你敢让 AI 负责吗?要跟人拉扯、沟通、博弈,AI 哪儿懂这些。


我更愿意把它看成一个执行力爆表的小弟:你把话说清楚,边界划明白,它就是你最靠谱的帮手;你自己都稀里糊涂,全扔给它,它就成了一个你根本管不住的变量。



但是,大家还是需要足够小心的,因为国内各个老板都有点“资本家气质”,傲慢且愚蠢,他们可能真的认为 OpenClaw 可以干掉很多人,并且他们真的会去做,所以大家要小心阵痛!


说实话,OpenClaw 这波热度,你要是只把它当成一阵风,可能就真错过了点有意思的东西。我觉得它真正指向的,是一种新的计算形态:


过去这二十年,我们和软件的关系一直很固定:人操作 App。你想干嘛,得先找到对的 App,打开它,在里面点来点去,搞完这个再切到另一个 App,自己把结果拼起来。


OpenClaw 这类系统让我看到的,是一个新画面:AI 操作世界。你只需要说一句话,AI 在后台自己打开网页、调用接口、操作软件,你面前的屏幕从“必须亲手操作的界面”变成“只看结果、偶尔盯一下”的地方。


听起来科幻,但真正要补的课,反而不是“再多写一行提示词”,而是三个系统层面的东西:


1. 权限管理:能看到什么、不能看什么,什么时候需要你点头,做完能不能追溯。


2. 记忆管理:分层存、能回滚、能审计,能解释“你当时为啥这么干”。

 

3. 供应链安全:技能/插件越来越多,如何验证、如何信任、如何阻断恶意行为。



智能体时代真正要补的,其实是安全与治理。至此,我们应该将 OpenClaw 这玩意说清楚了......


结语


OpenClaw 之所以值得写一篇长文,不是因为它“比所有 AI 都聪明”,而是因为它把一个事实变得无法忽视:


1. AI 的下一步不是更会聊天,而是更会交付;

 

2. 不是更像百科全书,而是更像一个能跑腿的系统。

 


你可以不追这波热度,但你很可能会在未来一年不断遇见它的同类形态:更多入口、更强执行、更深权限、更丰富插件、更复杂安全。


所以最好的姿势也许是:


1. 不神化:它不是神奇助理,只是把链路工程化了;


2. 不恐慌:它不会一夜之间让所有人失业,但会加速流程化工作的自动化;

 

3. 不放权:把它当成“沙箱里的助理”,而不是“主机里的上帝”。


浪潮还会继续。你可以站在沙滩上看,但别把家门钥匙扔在门口。

AI原生产品日报频道: 前沿科技
本内容来源于网络 原文链接,观点仅代表作者本人,不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com,我们将及时核实并处理。
正在改变与想要改变世界的人,都在 虎嗅APP
赞赏
关闭赞赏 开启赞赏

支持一下   修改

确定