当前AI已开始参与自我构建，本文解析AI自我改进与递归进化的差异，提示递归进化的风险，明确人类需守住进化目标的决定权。 ## 1. 当前AI制造能力现状截至2024年5月，Anthropic八成以上代码已由AI编写，人类工程师代码产出量约为两年前的八倍。Claude的“研究判断”能力已接近人类，而该能力长期被视为人类独有。 ## 2. AI可控的自我改进 AI自我改进指人类利用AI打造更强AI，AI可编写训练脚本、生成训练数据、自动修复代码缺陷，提升开发效率。演化目标仍由人类设定，核心控制权掌握在人类手中。 ## 3. AI自主的递归自我改进递归自我改进是AI自行改进自身，每一代改进后的AI都会成为下一轮改进的主体，改进速度会越来越快。演化目标由AI自行设定，和可控自我改进的核心区别在于目标设定权归属。 ## 4. 递归自我改进的核心风险递归改进缺乏“研究判断”所需的即时可信外部反馈，容易出现“模型崩溃”：AI自我训练空转，账面分数极高但实际能力急剧退化。微小的错置目标会经世代迭代以指数级放大，改进突破是突变式的“相变”，积累到临界点会骤然质变。 ## 5. 递归进化的预测与人类定位 Jack Clark预测，2028年底前出现完全自主递归AI的概率约为六成，其实现依赖底层算法突破，也取决于人类是否允许。若实现，最强AI将是机器自我演化产物，人类无法读懂其内部运作，人类心智价值将收敛到设定目标、把握方向，人类需守住“决定制造什么”的核心权力。

2026-06-16 08:25

机器开始制造机器：从自我改善到递归进化

孤独大脑

速览

本文来自微信公众号：孤独大脑

Anthropic在报告中说：截至今年五月，其八成以上代码已由AI编写；人类工程师当下的代码产出量，约为两年前的八倍。这意味着，机器已开始制造机器。

报告还发现，Claude的“研究判断”能力，比想象中更接近人类——而这一直被视为人类独有的能力。

由此引出当前AI的两个核心命题。

一、AI的自我改进

即人类利用AI将AI打造得更强。模型可以飞速编写底层训练脚本、生成海量数据，甚至自动修复代码缺陷。这就像一位铁匠用手中的锤子，打出一把更称手的新锤子，次日打铁的效率显著提升——但决定权还在人类铁匠手中。

二、AI的递归自我改进

想象一下，那把锤子开始自作主张，自行调控炉温、修改桌上的图纸，再开动机器锻造出一把“更擅长修改图纸”的锤子。下一把锤子诞生后立刻接管工坊，越改越快。当新一代模型接管、重投循环，改进者同时也成了被改进者。

二者的根本区别在于：演化的目标，究竟由谁设定？

其中的鸿沟，在于一种被称为“研究品味”与“大局观”的抽象特质。

从底层机制看，递归改进缺一个即时且可信的裁判。代码飞轮之所以转得动，是因为有廉价而密集的“可验证奖励”——代码敲下，编译运行，对错当场分明。

但“研究判断”没有这种信号：一条技术路径是否值得走，答案往往要等数月甚至数年。一旦失去外部真实的对错反馈，AI的自我训练便会空转——自己出题、自己批卷、自己打满分，账面分数极高，能力却急剧退化。这叫“模型崩溃”。

更需警惕的是：一旦启动彻底的递归，一个极其微小的错置目标，经由代代相传，偏差会以指数级放大。

通往递归的路不像攀爬缓坡，更像在炉火上烧水：长久不见波澜，积累到某一临界温度，整壶水骤然沸腾。此谓“相变”。

Jack Clark预测，2028年底前出现完全自主递归的概率约有六成。这既需要底层算法的突破，也取决于人类是否“允许”。

一旦实现，未来的最强模型不再由人类心智写就，而是机器自我演化的产物。人类将无法读懂其内部的神经运作，只能观察其行为，推断其习性，为其划定边界。

那时，人类心智的价值将向两端收敛：一是追问意义的源头，二是在不确定的路口，凭直觉与大局观押下方向。其余的，交付机器。

机器正在飞速学习如何制造机器。

人类要守住的，是决定这个世界究竟该制造什么。

至于普通人会如何，这是个谜。

AI原生产品日报频道: 前沿科技

孤独大脑

这里本来有条个人简介

认证作者

已在虎嗅发表 220 篇文章

本内容来源于网络原文链接，观点仅代表作者本人，不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com，我们将及时核实并处理。

正在改变与想要改变世界的人，都在虎嗅APP

赞赏

支持一下修改

确定