本文来自微信公众号: 陆三金 ,作者:陆三金,原文标题:《听完 Andrej Karpathy 的访谈,我不焦虑了》
今天才有时间看完Andrej Karpathy在No Priors播客上的访谈,聊点感受。
这种播客还是建议人肉去听,不建议看AI总结版,我发内容也只是记录自己的视角,不是给大家总结。
Andrej在心态上还是有点焦虑的。
-担心自己不在行业最前沿
-担心自己的订阅token没花完
-担心自己是瓶颈
他现在游离于前沿实验室之外,算是个AI独立探索者,他有着自己的取舍。
Andrej认为在前沿实验室,人无法做到独立自主,你无法自由说话,不能想说什么说什么,同时很多话在那个语境下你又得被迫说,而且在那个环境中,你也无法真正说了算。总之,少了点自主。
但坏处是自己离一线远了,无法真正了解到在发生什么,也不能很好预测未来。
所以,他倒是希望和前沿实验室有一些合作。未来也不排除再进入前沿AI实验室。
另外一层的焦虑,可能是Agent现在这个阶段带来的。
Andrej讲了他自己玩coding agent时的状态,跟很多人可能很像。
不再手写,给定框架,让agent完成,自己再来验证,但自己又不能完全跳脱这个循环,所以在这种循环下,人是瓶颈,有一种无形压力。
我有个形象的例子,不一定恰当:这就像一台有发动机的车,但是没有轮子,轮子是你的腿,AI推着你向前,你被迫跑步来适应巨大的推力。
他这次观点里最广为流传的应该就是关于软件和agent的看法了。
我们其实不需要这么多特制的app,例如智能家居app,为什么不直接提供几个api,让agent直接来处理呢?
我们生产了太多不需要的app,agent正在将他们揉碎,他们只需要暴露api,agent重新粘合一切。
他用OpenClaw控制智能家居的例子来说明这些观点,像这些产品,不应该由软件来管理,应该由agent来管理。
他也讲了OpenClaw为什么会那么火?
因为OpenClaw满足了人们的期待,人们一直对LLM有着不切实际的幻想,实际上它本身稍显粗糙,并不能直接满足人类幻想,但OpenClaw通过人格、记忆等系统满足了人类的幻想,让它成为一个契合人类幻想的产品。
他又再次提及模型的锯齿状智能,这是大模型公司决定的。他们如何训练模型,如何使用数据,如何进行RL。
例如ChatGPT不会讲笑话,是因为这是在RL之外,没有经过RL优化。而模型现在做agent loop的能力很强,是因为模型被这样训练。
他也不赞成一个能在coding上实现通用能力的模型是全方位的AGI(有一些模型公司认为coding agi就是agi)。
讲到vibe coding,Andrej认为vibe coding是有门槛的,是属于少数人的游戏,可能不会普及。
他自己的autoresearch项目,则是希望构建一个循环,人不在环,人只需要启动,系统完全自动化。他甚至设想通过这种完全自动化,让模型训练的模型,超越前沿模型。
开源和闭源,他支持开源,认为目前这种6-8个月的差距也挺好,简单用例用开源模型,复杂用例用闭源模型,防止了垄断。
访谈也讲了机器人与自动驾驶,还是那个说法,物理世界AI更慢,但市场前景更大。
这场访谈主要还是围绕agent,可以说是一节面对agent时代的思维转变课。
Andrej Karpathy访谈给我两个启示:
-agent现在这个阶段,并不能完全自主,不能端到端地实现我们的任务,人要在环,所以,人会很累,因为你的转速是无法匹配ai的。Andrej做过自动驾驶,他知道L4是人类不在环的,他在agent上的观点也更倾向于以后会有更高级别的自动化。所以,其实不用太焦虑,真的是学的慢,就不用学了,因为ai完全可以自己办到了。
-现在这个阶段,重要的是要做转变思维,以前你做的产品是面向人的,以后你做的产品、内容是面向agent的,要让agent可以理解、执行,才算是完成工作。
不要问agent能为你做什么,先看看你能为agent做什么。
