2026-05-27 13:52

天下苦黄仁勋久矣

01Founder©

本文来自微信公众号： 01Founder ，作者：一直在路上的Max

2006年的那个冬天，黄仁勋做了一个华尔街认为极其愚蠢的决定。

他要求英伟达全线产品必须支持一种叫CUDA的技术。

为了这个毫无盈利希望的项目，这家卖显卡的公司每年的研发开支飙升到5亿美元，利润常年在地板上摩擦。

股东们在痛骂，媒体嘲笑他这是对一个不存在的市场的盲目投资。

老黄没有停。他骨子里是个赌徒。

后来的故事，大家都知道了。

今天硅谷的巨头们为了抢夺英伟达的显卡，几乎要把头挤破。

马斯克把十万张卡塞进得州的机房，然后转手以12.5亿美元一个月的价格租给了Anthropic。

扎克伯格甚至会在Meta的财报里炫耀自己囤了三十万张H100。

大模型行业诞生了一条极其粗暴的铁律：Scaling Law（规模法则）。

模型越大越好，算力越多越好。

英伟达吃掉了行业里绝大部分的利润，云厂商买下昂贵的显卡，再把算力切碎，按Token向创业者和普通用户收租。

每一次AI的思考，都在燃烧英伟达的算力，都在向硅谷的铁王座上贡。

天下苦黄仁勋久矣。

历史的剧本写到这里，通常是一个死局。

但有些人决定要反抗。

PART.01

算力

THUMB

STOPPING

反抗的第一枪，只能打在最硬的硅片上。

昨天，很多人都在转发华为那篇关于芯片的论文。

最近的国产芯片也取得非常多的突破，至少股市是这样的。

但如果去问真正跑在大模型前线的开发者，他们会告诉你一个残酷的真相：老黄脚下，还有一条深不见底的护城河。

这条河叫CUDA。

英伟达花了15年，让全世界几百万程序员在这个生态里试错、填坑，砸出了一条极其丝滑的高速公路。

平心而论，华为的昇腾亦或是其他的国产显卡依然很难用。

算力参数上去了，但因为缺乏软件生态，模型跑在上面动不动就断点、崩溃。

很多拿着热钱的大厂，捏着鼻子转身又去特殊渠道上高价买英伟达了。

但硬骨头总得有人啃。

在这场算力大逃亡里，有极少数几家中国公司，选择了最难走的那条泥泞小路。

比如名震硅谷的DeepSeek。

为了死磕国产算力，把模型硬生生跑通在华为等国产卡上，他们不惜抽调了最核心的工程团队，去一行一行地重新手写底层算子。

这种在泥泞里打滚的代价，

是整个模型发布节奏的严重延迟。

这是一个令人敬佩的孤勇者故事。

但这也暴露了一个残酷的现实：

如果中国大模型只能靠顶尖工程师拿命、拿时间去填英伟达15年的生态坑，那我们什么时候才能真正翻盘？

也许有别的路子。

PART.02

模型

THUMB

STOPPING

后端的算力护城河正在被瓦解，但这还不够。

如果你翻翻几家科技巨头的财报，你就会发现一个极其荒诞的现象。

无数的高管和产品经理天天掉头发，思考怎么让用户多对话、多生图，怎么多卖API、多卖会员。

为了抢地盘，大厂之间甚至打起了残酷的、近乎白给的API价格战。

但背后大部分利润都付给了英伟达或者云厂商。

说白了，整个AI行业都在给黄仁勋一个人打工。

黄仁勋和云厂商们的最终幻想，是把所有的高级智能都锁在云端数据中心里，让你永远交网费、交Token费。

只要模型还在云端一天，推理的计费表就永远在转。

哪怕这个行业的API价格战打得再凶，只要英伟达的显卡还要通电，边际成本就永远降不到零。

天下苦黄仁勋久矣。但怎么反抗？

要彻底终结这种垄断，就必须把战场转移。

转移到黄仁勋的显卡永远触达不到的地方——端侧模型。

所谓端侧模型，其实就是在你自己的设备里运行模型。

把那个绝顶聪明的大脑，直接摁进你口袋里的手机、桌上的旧笔记本，甚至手腕上的一块智能手表里。

这会带来两个好处：

第一是成本。

一旦模型在本地跑起来，云端的Token计费器就彻底哑火了。

你不需要再为每一次提问心惊肉跳地算钱，你让它去读几十万字的研报、帮你写一整夜的代码，边际成本统统是零。

没有中间商赚算力差价，更不需要向任何二道贩子交过路费。

第二是隐私。

巨头们再也无法通过云端偷窥你的数据，公司的机密财务表、个人的私密日记，都被死死锁在了物理隔绝的设备里。

即便你坐在毫无网络信号的高铁钻山洞，它依然能为你全速运转。

但这条路，太难走了。

其实在过去两年，行业里也曾涌现过一大批喊着要做端侧、要把大模型装进手机的团队。

但资本是极其现实的。

当大家在泥潭里滚了一圈后发现，做端侧不仅要跟物理硬件的极限死磕，而且利润薄得像刀片。

更要命的是，它完全破坏了那种躺在云端按API收租的完美商业模式。

于是，人群很快就散了。

大家一窝蜂地调转车头，回去继续卷千亿万亿参数的云端巨兽。

潮水褪去后，这个赛道显得无比空旷和寂寥。

放眼全球，如今还愿意在这个边缘战场上逆行的人，寥寥无几。

比如美国巨头谷歌的Gemma团队、微软的Phi团队、阿里的Qwen团队等等。

有趣的是，就连卖铲子的英伟达，他们自己的研究院也发过一篇论文，直言不讳地说‘小语言模型才是未来’。

巨头们虽然下了场，但端侧对他们来说，更像是为了补全模型版图的防御性任务。

毕竟，让他们彻底砸碎自己躺着赚钱的云端收租盘，太难了。

但与这些巨头的防御性任务不同。

很多人对桌宠的记忆，还停留在二十年前只会吃饭睡觉的QQ宠物、电子鸡，或者是那个偶尔在屏幕上翻跟头、打呼噜的瑞星小狮子。

PART.03

明天

THUMB

STOPPING

昨天，很多人都在为华为的一篇论文激动。

大家似乎看到了掀翻英伟达帝国的曙光。

但今天老黄依然穿着他那件标志性的黑皮衣，他依然是硅谷的唯一神明。

很多人问，中国的大模型什么时候能真正超越美国？

答案或许根本不在于谁能买到更多的显卡，或者谁能用更多的钱堆出一个更大的参数怪物。

真正的超越，往往发生在游戏规则被颠覆的那一刻。

大模型的上半场，是人肉写代码的手工作坊，是买卡囤卡的冷兵器时代。

大家比的是谁的钱包厚，谁能从那个穿皮衣的男人手里买到更多的硅片。

但下半场，规矩变了。

在这场天下苦老黄久矣的突围战中，华为在最底层的硅片上凿冰，DeepSeek在算法的极限上压榨算力。

不盲从巨头的暴力美学，不在旧规则里内卷，而是直接掀翻牌桌。

很多年后，当我们回头看当下发生的这些事，可能会发现这是一个静水流深的分水岭。

现在的硅谷依然热闹，纳斯达克的数字依然在跳动，老黄的饭局上依然坐满了求购芯片的大佬。

那个穿着皮衣的男人依然站在顶端，受万人膜拜。

巨头们也依然在为了云端的算力焦虑地厮杀。

但在他们看不见的地方，旧秩序的基石，已经被悄然抽走了几块。

在那条极其拥挤、昂贵、还随时可能被封锁的英伟达高速公路旁边，有一群中国造反者不再按喇叭催促了。

他们转过身，开始自己修路。

频道: 游戏娱乐

本内容来源于网络原文链接，观点仅代表作者本人，不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com，我们将及时核实并处理。

正在改变与想要改变世界的人，都在虎嗅APP

赞赏

支持一下修改

确定