本文来自微信公众号: 未尽研究 ,作者:未尽研究,原文标题:《为什么开放模型会拉开与封闭模型的差距 | 笔记》
Nathan Lambert是美国艾伦实验室的研究员,他训练并跟踪开放权重模型,去年的报告和榜单,宣告了中国的开放模型已经全面超过了美国,引起了中美两国各自的轰动。
最近,他对开放模型与封闭模型之间的竞争,产生了新的想法,其中一些判断,与我们去年底对今年开源模型的展望不谋而合。
中国开放模型总体上保持领先的同时,美国的开放模型也在形成新的阵型,如Nemotron,Gemma等,可能会收复一些失地。
2026,对AI的10个展望
2026/12/21阅读全文>
此外,由于封闭模型在智能体性能和经济性上的持续优化能力,以及开放模型缺乏商业支持,美国封闭模型将会明显拉开领先优势。

下面是Nathan Lambert的文章:
我们正身处这样一个阶段:我们将会知道,开放模型能否跟上封闭实验室的步伐。显而易见的答案是否定的。
这种回答其实是在说,它们不可能在所有领域都跟上。这种说法排除了一个流行的预测,即开放模型会彻底追平,所有模型都会趋于饱和,开放与封闭模型只会变得越来越相似。而在亲历这一过程时,我们显然还很难看清,能力上的长期稳定均衡究竟会在何时稳定下来。
这是一个极其复杂的动态过程,我们关注的核心点,是模型之间的能力差距。与此同时,这一差距又与多种不断演化的动态交织在一起,包括开放模型的资金供给、由谁来构建开源模型、蒸馏这类支持快速跟进的技术如何迁移到新的应用领域、可能妨碍开源AI生态系统的监管,当然还有,究竟是谁在实际使用开放模型。
能力差距只是纷繁复杂力量中的一个信号,这些力量正把供给与需求推向不同的形态。在许多情况下,需求端,也就是显然有大量个人、组织和主权实体期待或需要开放模型,与供给端大体上是分离的。供给完全由经济因素决定。“哪些商业策略能够支持发布开放模型”这个问题,至今仍悬而未决。
面对这种复杂性,我想把自己的核心看法提炼成一份清晰的清单。这些判断来自我今年春季围绕开源模型写作或录制的10多篇内容。
1.令人惊讶的是,即使考虑到训练和研究上的算力差异,顶级封闭模型也没有表现出相对于开源模型不断扩大的能力优势,尤其是在2025年下半年以及直到今天。
2.开源模型实验室在既有基准测试上保持同步方面,技术实力非常强。这种情况会持续下去,反映出一种平衡:既有充足的人才,也有足够的算力。
3.中国的开源权重实验室,相比美国同类封闭实验室,略微更聚焦于基准分数。蒸馏帮助中国的大语言模型公司做到这一点,但它并不是万能药。蒸馏动态的变化,例如监管,不会成为决定能力平衡的关键因素。对基准分数关注度的提升,自然是其激励的结果,因为维持“正在追赶前沿”的叙事,对AI的融资和采用都至关重要。
4.到目前为止,封闭模型往往比得分相近的开源模型更稳健、也更具通用性。封闭模型拥有一些难以衡量的特质,并没有被当前或过去的基准测试很好地捕捉到。这将成为封闭模型主导某些市场的关键。在这些市场中,单个用户会不断提出新的需求,也就是把模型作为直接助手来支持知识工作者。
5.通过基准测试来观察,开源与封闭模型的竞赛,在市场结构收缩之前,很大程度上将是一场关于经济续航能力和快速跟进的游戏。我预计,中国的开源权重实验室会最先面临融资困难,最早可能就在今年晚些时候。3到9个月之后,融资困难将体现为能力轨迹出现分化。
6.以强化学习为主导的训练时代,分发到真实世界使用场景,在持续能力提升中成为一个关键因素。这些任务就是用户直接使用Claude Code或Codex这类工具,通过智能体来解决工作中的问题。这是封闭实验室首次在一个明确的技术领域里,有可能在能力上压倒开放权重模型,并且可能直接利用基于用户反馈的在线强化学习。
7.开放模型将越来越多地被用于重复性自动化任务,这会体现在整个生态系统中API市场份额的相对占比上,尤其是在重复性任务方面。其形式包括大量新的AI原生应用、企业后台自动化等等。这方面的成功,将推动对特定领域、高效率开放模型的更多投资。
这是一幅复杂的图景,其长期轨迹更多是一个经济问题,而不是一个能力问题。许多其他渠道可以讲述一个更简单的叙事,比如“中国AI必然会追上我们”,并因此获得更多传播,因为那是一个简单的故事。现实却很复杂。只有真正的AI收入,才能带来更多投资,而最终,这又会与模型能否持续快速改进的能力相挂钩。到目前为止,经济现实尚未对开放模型扩展造成普遍影响。
这种以经济为中心的视角,也关系到我对更广泛开源模型生态系统的立场。
8.要求禁止某些类型开放模型的呼声还会持续出现,但在实践中根本无法实施。训练强大的AI模型,也就是接近但尚未达到前沿水平的模型,其成本与大规模部署相比其实相对较小。比如说,如果美国禁止超过某个算力阈值的开放模型,另一个主权实体最终也会训练出这类模型并公开发布,而这些模型将以更少监管的方式进入美国市场。
9.对开源模型影响的“二阶导数”已经发生了变化,而美国将从2027年初开始,在开源模型的采用指标上缓慢收复失地。中国速度的放缓,再到趋势反转,需要很长时间。例子包括Google的Gemma 4,它取得了惊人的成功,以及Nvidia的Nemotron和Arcee AI。
10.随着越来越强大的封闭模型被构建、预览和发布,还会出现更多安全冲击,认为最强AI模型的开放权重版本绝不能被允许存在,类似于人们对Claude Mythos的反应。这些都可能推动针对开源模型的繁重监管。
11.与此同时,市场对开放模型的长期兴趣也会增加,因为主权实体和现有权力结构会逐渐意识到,即将到来的超级强大AI工具,不能只落在一家公司或少数几家公司手中。这些实体会把开放模型视为一种不同的治理范式。
12.新的开放模型融资结构将会出现,因为许多利益相关方会意识到,让获取智能的渠道依赖于单一、以盈利为目的的公司,并不可靠。
13.本地智能体、OpenClaw以及其他个人智能体,代表着一个迄今为止在很大程度上被忽视的开放模型使用市场。它有点像暗物质,普遍存在,并且对开放与封闭模型力量对比具有巨大的潜在影响。
有一个词支配着这篇文章,而且我是有意反复使用它的,那就是:复杂。
正是这种复杂的现实,促使我更深入地思考,如何清晰描述开放模型的差距,以及为什么我会在脑中同时保持这样一种判断:尽管已经有相当明确的证据支持近期开放权重模型的能力,我仍然预计美国的封闭实验室会明显拉开领先优势。
--
原文:
https://www.interconnects.ai/p/my-bets-on-open-models-mid-2026