当前AI已开始参与自我构建,本文解析AI自我改进与递归进化的差异,提示递归进化的风险,明确人类需守住进化目标的决定权。 ## 1. 当前AI制造能力现状 截至2024年5月,Anthropic八成以上代码已由AI编写,人类工程师代码产出量约为两年前的八倍。Claude的“研究判断”能力已接近人类,而该能力长期被视为人类独有。 ## 2. AI可控的自我改进 AI自我改进指人类利用AI打造更强AI,AI可编写训练脚本、生成训练数据、自动修复代码缺陷,提升开发效率。演化目标仍由人类设定,核心控制权掌握在人类手中。 ## 3. AI自主的递归自我改进 递归自我改进是AI自行改进自身,每一代改进后的AI都会成为下一轮改进的主体,改进速度会越来越快。演化目标由AI自行设定,和可控自我改进的核心区别在于目标设定权归属。 ## 4. 递归自我改进的核心风险 递归改进缺乏“研究判断”所需的即时可信外部反馈,容易出现“模型崩溃”:AI自我训练空转,账面分数极高但实际能力急剧退化。微小的错置目标会经世代迭代以指数级放大,改进突破是突变式的“相变”,积累到临界点会骤然质变。 ## 5. 递归进化的预测与人类定位 Jack Clark预测,2028年底前出现完全自主递归AI的概率约为六成,其实现依赖底层算法突破,也取决于人类是否允许。若实现,最强AI将是机器自我演化产物,人类无法读懂其内部运作,人类心智价值将收敛到设定目标、把握方向,人类需守住“决定制造什么”的核心权力。
机器开始制造机器:从自我改善到递归进化
2026-06-16 08:25

机器开始制造机器:从自我改善到递归进化

本文来自微信公众号: 孤独大脑


Anthropic在报告中说:截至今年五月,其八成以上代码已由AI编写;人类工程师当下的代码产出量,约为两年前的八倍。这意味着,机器已开始制造机器。


报告还发现,Claude的“研究判断”能力,比想象中更接近人类——而这一直被视为人类独有的能力。


由此引出当前AI的两个核心命题。


一、AI的自我改进


即人类利用AI将AI打造得更强。模型可以飞速编写底层训练脚本、生成海量数据,甚至自动修复代码缺陷。这就像一位铁匠用手中的锤子,打出一把更称手的新锤子,次日打铁的效率显著提升——但决定权还在人类铁匠手中。


二、AI的递归自我改进


想象一下,那把锤子开始自作主张,自行调控炉温、修改桌上的图纸,再开动机器锻造出一把“更擅长修改图纸”的锤子。下一把锤子诞生后立刻接管工坊,越改越快。当新一代模型接管、重投循环,改进者同时也成了被改进者。


二者的根本区别在于:演化的目标,究竟由谁设定?


其中的鸿沟,在于一种被称为“研究品味”与“大局观”的抽象特质。


从底层机制看,递归改进缺一个即时且可信的裁判。代码飞轮之所以转得动,是因为有廉价而密集的“可验证奖励”——代码敲下,编译运行,对错当场分明。


但“研究判断”没有这种信号:一条技术路径是否值得走,答案往往要等数月甚至数年。一旦失去外部真实的对错反馈,AI的自我训练便会空转——自己出题、自己批卷、自己打满分,账面分数极高,能力却急剧退化。这叫“模型崩溃”。


更需警惕的是:一旦启动彻底的递归,一个极其微小的错置目标,经由代代相传,偏差会以指数级放大。


通往递归的路不像攀爬缓坡,更像在炉火上烧水:长久不见波澜,积累到某一临界温度,整壶水骤然沸腾。此谓“相变”。


Jack Clark预测,2028年底前出现完全自主递归的概率约有六成。这既需要底层算法的突破,也取决于人类是否“允许”。


一旦实现,未来的最强模型不再由人类心智写就,而是机器自我演化的产物。人类将无法读懂其内部的神经运作,只能观察其行为,推断其习性,为其划定边界。


那时,人类心智的价值将向两端收敛:一是追问意义的源头,二是在不确定的路口,凭直觉与大局观押下方向。其余的,交付机器。


机器正在飞速学习如何制造机器。


人类要守住的,是决定这个世界究竟该制造什么。


至于普通人会如何,这是个谜。

AI原生产品日报频道: 前沿科技
本内容来源于网络 原文链接,观点仅代表作者本人,不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com,我们将及时核实并处理。
正在改变与想要改变世界的人,都在 虎嗅APP
赞赏
关闭赞赏 开启赞赏

支持一下   修改

确定