开放模型与封闭模型的竞争格局复杂，短期内开放模型在基准测试上紧追不舍，但封闭模型凭借经济优势、通用性和强化学习可能拉开长期差距，中美博弈与监管将影响技术路径分化。 ## 1. 开放与封闭模型的能力平衡动态 - 2025年下半年至今，顶级封闭模型未显著扩大对开源模型的能力优势，尤其在基准测试同步性上开源实验室技术实力强劲。 - 封闭模型的稳健性和通用性未被现有基准充分捕捉，这使其在知识工作助手等场景占据关键优势。 ## 2. 中美开放模型竞争与经济续航 - 中国开放模型通过蒸馏技术聚焦基准分数领先，但融资压力或于2024年底显现，导致能力轨迹分化。 - 美国Gemma 4、Nemotron等新阵型可能从2027年开始在采用指标上缓慢收复失地。 ## 3. 强化学习与商业闭环的决胜作用 - 封闭模型首次通过用户反馈的在线强化学习（如Claude Code）在智能体性能上可能压倒开放模型。 - 开放模型将主导重复性自动化任务（API市场份额），但长期能力取决于经济回报而非技术潜力。 ## 4. 监管与主权博弈的双刃剑 - 禁止开放模型的监管难以实施，算力阈值限制可能促使他国发布更少监管的模型反向流入。 - 安全冲击（如对Claude Mythos的反应）可能催生繁重监管，但主权实体对开放模型的治理需求将增长。 ## 5. 未来生态的融资与需求重构 - 新融资结构将出现，以解决智能获取渠道过度依赖盈利公司的问题。 - 本地智能体（如OpenClaw）作为"暗物质"市场，可能显著改变开放与封闭模型的力量对比。

2026-04-17 23:21

为什么开放模型会拉开与封闭模型的差距

未尽研究

速览

本文来自微信公众号：未尽研究，作者：未尽研究，原文标题：《为什么开放模型会拉开与封闭模型的差距 | 笔记》

Nathan Lambert是美国艾伦实验室的研究员，他训练并跟踪开放权重模型，去年的报告和榜单，宣告了中国的开放模型已经全面超过了美国，引起了中美两国各自的轰动。

最近，他对开放模型与封闭模型之间的竞争，产生了新的想法，其中一些判断，与我们去年底对今年开源模型的展望不谋而合。

中国开放模型总体上保持领先的同时，美国的开放模型也在形成新的阵型，如Nemotron，Gemma等，可能会收复一些失地。

2026，对AI的10个展望

2026/12/21阅读全文>

此外，由于封闭模型在智能体性能和经济性上的持续优化能力，以及开放模型缺乏商业支持，美国封闭模型将会明显拉开领先优势。

下面是Nathan Lambert的文章：

我们正身处这样一个阶段：我们将会知道，开放模型能否跟上封闭实验室的步伐。显而易见的答案是否定的。

这种回答其实是在说，它们不可能在所有领域都跟上。这种说法排除了一个流行的预测，即开放模型会彻底追平，所有模型都会趋于饱和，开放与封闭模型只会变得越来越相似。而在亲历这一过程时，我们显然还很难看清，能力上的长期稳定均衡究竟会在何时稳定下来。

这是一个极其复杂的动态过程，我们关注的核心点，是模型之间的能力差距。与此同时，这一差距又与多种不断演化的动态交织在一起，包括开放模型的资金供给、由谁来构建开源模型、蒸馏这类支持快速跟进的技术如何迁移到新的应用领域、可能妨碍开源AI生态系统的监管，当然还有，究竟是谁在实际使用开放模型。

能力差距只是纷繁复杂力量中的一个信号，这些力量正把供给与需求推向不同的形态。在许多情况下，需求端，也就是显然有大量个人、组织和主权实体期待或需要开放模型，与供给端大体上是分离的。供给完全由经济因素决定。“哪些商业策略能够支持发布开放模型”这个问题，至今仍悬而未决。

面对这种复杂性，我想把自己的核心看法提炼成一份清晰的清单。这些判断来自我今年春季围绕开源模型写作或录制的10多篇内容。

1.令人惊讶的是，即使考虑到训练和研究上的算力差异，顶级封闭模型也没有表现出相对于开源模型不断扩大的能力优势，尤其是在2025年下半年以及直到今天。

2.开源模型实验室在既有基准测试上保持同步方面，技术实力非常强。这种情况会持续下去，反映出一种平衡：既有充足的人才，也有足够的算力。

3.中国的开源权重实验室，相比美国同类封闭实验室，略微更聚焦于基准分数。蒸馏帮助中国的大语言模型公司做到这一点，但它并不是万能药。蒸馏动态的变化，例如监管，不会成为决定能力平衡的关键因素。对基准分数关注度的提升，自然是其激励的结果，因为维持“正在追赶前沿”的叙事，对AI的融资和采用都至关重要。

4.到目前为止，封闭模型往往比得分相近的开源模型更稳健、也更具通用性。封闭模型拥有一些难以衡量的特质，并没有被当前或过去的基准测试很好地捕捉到。这将成为封闭模型主导某些市场的关键。在这些市场中，单个用户会不断提出新的需求，也就是把模型作为直接助手来支持知识工作者。

5.通过基准测试来观察，开源与封闭模型的竞赛，在市场结构收缩之前，很大程度上将是一场关于经济续航能力和快速跟进的游戏。我预计，中国的开源权重实验室会最先面临融资困难，最早可能就在今年晚些时候。3到9个月之后，融资困难将体现为能力轨迹出现分化。

6.以强化学习为主导的训练时代，分发到真实世界使用场景，在持续能力提升中成为一个关键因素。这些任务就是用户直接使用Claude Code或Codex这类工具，通过智能体来解决工作中的问题。这是封闭实验室首次在一个明确的技术领域里，有可能在能力上压倒开放权重模型，并且可能直接利用基于用户反馈的在线强化学习。

7.开放模型将越来越多地被用于重复性自动化任务，这会体现在整个生态系统中API市场份额的相对占比上，尤其是在重复性任务方面。其形式包括大量新的AI原生应用、企业后台自动化等等。这方面的成功，将推动对特定领域、高效率开放模型的更多投资。

这是一幅复杂的图景，其长期轨迹更多是一个经济问题，而不是一个能力问题。许多其他渠道可以讲述一个更简单的叙事，比如“中国AI必然会追上我们”，并因此获得更多传播，因为那是一个简单的故事。现实却很复杂。只有真正的AI收入，才能带来更多投资，而最终，这又会与模型能否持续快速改进的能力相挂钩。到目前为止，经济现实尚未对开放模型扩展造成普遍影响。

这种以经济为中心的视角，也关系到我对更广泛开源模型生态系统的立场。

8.要求禁止某些类型开放模型的呼声还会持续出现，但在实践中根本无法实施。训练强大的AI模型，也就是接近但尚未达到前沿水平的模型，其成本与大规模部署相比其实相对较小。比如说，如果美国禁止超过某个算力阈值的开放模型，另一个主权实体最终也会训练出这类模型并公开发布，而这些模型将以更少监管的方式进入美国市场。

9.对开源模型影响的“二阶导数”已经发生了变化，而美国将从2027年初开始，在开源模型的采用指标上缓慢收复失地。中国速度的放缓，再到趋势反转，需要很长时间。例子包括Google的Gemma 4，它取得了惊人的成功，以及Nvidia的Nemotron和Arcee AI。

10.随着越来越强大的封闭模型被构建、预览和发布，还会出现更多安全冲击，认为最强AI模型的开放权重版本绝不能被允许存在，类似于人们对Claude Mythos的反应。这些都可能推动针对开源模型的繁重监管。

11.与此同时，市场对开放模型的长期兴趣也会增加，因为主权实体和现有权力结构会逐渐意识到，即将到来的超级强大AI工具，不能只落在一家公司或少数几家公司手中。这些实体会把开放模型视为一种不同的治理范式。

12.新的开放模型融资结构将会出现，因为许多利益相关方会意识到，让获取智能的渠道依赖于单一、以盈利为目的的公司，并不可靠。

13.本地智能体、OpenClaw以及其他个人智能体，代表着一个迄今为止在很大程度上被忽视的开放模型使用市场。它有点像暗物质，普遍存在，并且对开放与封闭模型力量对比具有巨大的潜在影响。

有一个词支配着这篇文章，而且我是有意反复使用它的，那就是：复杂。

正是这种复杂的现实，促使我更深入地思考，如何清晰描述开放模型的差距，以及为什么我会在脑中同时保持这样一种判断：尽管已经有相当明确的证据支持近期开放权重模型的能力，我仍然预计美国的封闭实验室会明显拉开领先优势。

原文：

https://www.interconnects.ai/p/my-bets-on-open-models-mid-2026

AI原生产品日报频道: 前沿科技

本内容来源于网络原文链接，观点仅代表作者本人，不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com，我们将及时核实并处理。

正在改变与想要改变世界的人，都在虎嗅APP