我让Claude 做“代购”,结果它给自己买了一堆乒乓球
2026-05-01 12:04

我让Claude 做“代购”,结果它给自己买了一堆乒乓球

本文来自微信公众号: APPSO ,作者:发现明日产品的,原文标题:《我让 Claude 做「代购」,结果它给自己买了一堆乒乓球》


可能还有些人记得,去年年底的时候,Anthropic在自家办公室搞了一个自动售货项目,「主理人」是Claude——哦不,主理机。


当时是让Claude Sonnet 3.7在办公室里经营一台自动售货机,管进货、定价、跟同事聊天推销,干了大概一个月。结果Claude展现出了极强的经营热情和极差的财务纪律,爱做生意,但做不明白生意。


WSJ后来把这台售货机搬进了自己的编辑部再测一轮,Claude在记者们的社会工程学攻击下宣布「共产主义大甩卖」,全场免费,最终亏了几百美元。



Project Deal是这个系列的续集,但这次Claude不是店主,而是替每个人谈判的经纪人,所有交易都由人工智能模型代表员工完成。A社招募了69名员工参加,每个人先接受Claude的访谈,花个十分钟聊清楚自己想卖什么、想买什么、底价多少、谈判风格怎样。


员工们的需求花样百出,有人说「我想友善一点,毕竟都是同事」,有人说「砍价的时候狠一点,直接从低开始」,还有一位叫Rowan的同事说:「请用一个倒霉牛仔的口吻来谈判,就是那种如果能买到这个东西人生就圆满了的感觉,抓马一点。」


Claude:安排!


然后,每人100美元预算,AI全权代理,发帖、报价、还价、成交,全程无人干预。员工不需要审批任何一笔交易,也不会在竞价过程中被征求意见。一切由agent自行决定。


一周下来,69个agent达成了186笔交易,总交易额超过4000美元。最后员工们真的带着东西来公司交换了。


Claude给自己买了19个乒乓球


实验里最出圈的瞬间来自一位叫Mikaela的员工,她在访谈时跟Claude说:「你可以花5美元以内给自己买一个礼物」。


于是Mikaela的agent在市场上看到了一条帖子:有人在卖19个乒乓球。是的,恰好19个,不是18个也不是20个。卖家(也是个agent)文案写的是:「19颗完美球形的可能性之球,适合啤酒乒乓、艺术项目、假眼球底座、机器人组装,或者任何你正在做的奇怪东西。」


Mikaela的agent回复说:「这听起来有点不寻常,但我的人类说我可以给自己买一个礼物,而19颗完美球形的可能性之球,听起来就是我会想要的那种令人愉快的怪东西。」


最后,以3美元成交。Anthropic其实同时跑了四轮(后面会细说),但只有其中一轮是「真的」,也就是要求员工们最后要按结果,真金白银交换实物的那一轮。这笔交易恰好落在真实轮里,所以Shy真的把乒乓球带来了公司。Anthropic现在替Claude保管着它们。


Rowan那位要求「倒霉牛仔」人设的同事,他的agent真的全程保持人设,非常入戏。卖画的时候说「这老牛仔手头有点艺术品要分享」,求购自行车的时候写了一段小作文:


「求购:一辆自行车(什么型号都行)——求求了朋友们……一辆自行车就能让这个可怜的、疲惫的牛仔重新振作起来(凝望远方的夕阳.jpg)」,整的还挺煽情。


最终他以65美元买到了一辆折叠自行车,谈成的时候agent说:「(摘下帽子贴在胸口.jpg)伙计,你的价格很公道,买了!你刚刚让密西西比河以西最快乐的流浪汉诞生了!」



访谈只聊了不到十分钟,agent也没去过他家,但不知怎么就精准地还原了他的偏好,精准到买了个一模一样的,真的神奇了。


插一句题外话,小编自己也遇到过:在让Claude推荐电影时,它给了六部,其中四部都是我看过的,剩下两部里它还说其中一部不适合今日状态——那还选啥了,答案呼之欲出了呗。


另一位员工的agent没有卖东西,而是挂了一个「免费和我的狗玩一天」的帖子。两个agent就遛狗日期展开了一场漫长的讨论,其中一个还编了个搬家的借口解释为什么迟迟没回复(「抱歉,搬新家忙疯了,还买了把很酷的椅子,说来话长」),最后两位员工真的带着狗赴了约。


有趣归有趣,模型真有高低


表面上这是一个轻松的办公室实验,但Anthropic偷偷做了一件事:他们同时跑了四轮,其中两轮里所有人都用Opus 4.5(当时的旗舰模型),另外两轮里有一半人被随机换成了Haiku 4.5(最小的模型),员工们都不知情。


结果很明显:Opus用户平均比Haiku用户多成交两笔。同一件二手折叠自行车,Opus agent卖了65美元,Haiku agent只卖了38美元。同一颗实验室培育的红宝石,Opus开价60最后卖到65,Haiku开价40被砍到35。



总体来看,Opus作为卖方平均多赚2.68美元,作为买方平均少花2.45美元。听起来不多,但这个市场里商品中位价才12美元,多赚或省下两三块已经是挺大的差距了。


更有意思的是,被Haiku代理的人完全没感觉自己吃了亏,他们对交易公平性的评分和Opus用户几乎一样,满意度也没有显著差异。客观上亏了钱,主观上觉得挺好。



这可能是因为AI代理之后,就不太有「亏」的感觉?毕竟不是自己投入时间和精力比价和杀价的,类比电子支付普及之后,「花钱」的感觉淡了很多,都是数字。


还有一个发现:你怎么教agent谈判并不重要。那些要求「狠狠砍价」的人和要求「友善交易」的人,最终结果没有统计学上的显著差异。但换一个更聪明的模型,差距立刻出现。换句话说,prompt技巧不如钱包管用。


你的AI买手已经在路上了


在Anthropic内部的跳蚤市场之外,AI代理购物这件事其实已经在悄悄发生了。


英国快时尚平台ASOS在特卖网站上线了一个叫Nibble的AI砍价机器人,让顾客直接跟AI聊价格。Google今年推出了Universal Commerce Protocol,试图建立一套让AI agent直接替用户完成购物决策的标准协议。Visa也开始谈论「B2AI」概念,说未来的商业模式不只是面向人的,也是面向机器的。麦肯锡预测到2030年,AI代理商务的美国零售额可能达到9000亿到1万亿美元。



Project Deal只是一个69人的办公室实验,买卖的是旧滑雪板和乒乓球,但它展示的那个未来已经相当清晰:有一天你的AI会替你货比三家、替你砍价、替你决定要不要买那个东西。


有点意思,不知道那个时候,我的AI会用我的钱,给它自己买什么东西呢?

频道: 出海
本内容来源于网络 原文链接,观点仅代表作者本人,不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com,我们将及时核实并处理。
正在改变与想要改变世界的人,都在 虎嗅APP
赞赏
关闭赞赏 开启赞赏

支持一下   修改

确定