天下苦黄仁勋久矣
2026-05-27 13:52

天下苦黄仁勋久矣

本文来自微信公众号: 01Founder ,作者:一直在路上的Max


2006年的那个冬天,黄仁勋做了一个华尔街认为极其愚蠢的决定。


他要求英伟达全线产品必须支持一种叫CUDA的技术。


为了这个毫无盈利希望的项目,这家卖显卡的公司每年的研发开支飙升到5亿美元,利润常年在地板上摩擦。


股东们在痛骂,媒体嘲笑他这是对一个不存在的市场的盲目投资。


老黄没有停。他骨子里是个赌徒。


后来的故事,大家都知道了。


今天硅谷的巨头们为了抢夺英伟达的显卡,几乎要把头挤破。


马斯克把十万张卡塞进得州的机房,然后转手以12.5亿美元一个月的价格租给了Anthropic。


扎克伯格甚至会在Meta的财报里炫耀自己囤了三十万张H100。


大模型行业诞生了一条极其粗暴的铁律:Scaling Law(规模法则)。


模型越大越好,算力越多越好。


英伟达吃掉了行业里绝大部分的利润,云厂商买下昂贵的显卡,再把算力切碎,按Token向创业者和普通用户收租。


每一次AI的思考,都在燃烧英伟达的算力,都在向硅谷的铁王座上贡。


天下苦黄仁勋久矣。


历史的剧本写到这里,通常是一个死局。


但有些人决定要反抗。


PART.01


算力


THUMB


STOPPING


反抗的第一枪,只能打在最硬的硅片上。


昨天,很多人都在转发华为那篇关于芯片的论文。


最近的国产芯片也取得非常多的突破,至少股市是这样的。


但如果去问真正跑在大模型前线的开发者,他们会告诉你一个残酷的真相:老黄脚下,还有一条深不见底的护城河。


这条河叫CUDA。


英伟达花了15年,让全世界几百万程序员在这个生态里试错、填坑,砸出了一条极其丝滑的高速公路。


平心而论,华为的昇腾亦或是其他的国产显卡依然很难用。


算力参数上去了,但因为缺乏软件生态,模型跑在上面动不动就断点、崩溃。


很多拿着热钱的大厂,捏着鼻子转身又去特殊渠道上高价买英伟达了。


但硬骨头总得有人啃。


在这场算力大逃亡里,有极少数几家中国公司,选择了最难走的那条泥泞小路。


比如名震硅谷的DeepSeek。


为了死磕国产算力,把模型硬生生跑通在华为等国产卡上,他们不惜抽调了最核心的工程团队,去一行一行地重新手写底层算子。


这种在泥泞里打滚的代价,


是整个模型发布节奏的严重延迟。


这是一个令人敬佩的孤勇者故事。


但这也暴露了一个残酷的现实:


如果中国大模型只能靠顶尖工程师拿命、拿时间去填英伟达15年的生态坑,那我们什么时候才能真正翻盘?


也许有别的路子。


PART.02


模型


THUMB


STOPPING


后端的算力护城河正在被瓦解,但这还不够。


如果你翻翻几家科技巨头的财报,你就会发现一个极其荒诞的现象。


无数的高管和产品经理天天掉头发,思考怎么让用户多对话、多生图,怎么多卖API、多卖会员。


为了抢地盘,大厂之间甚至打起了残酷的、近乎白给的API价格战。


但背后大部分利润都付给了英伟达或者云厂商。


说白了,整个AI行业都在给黄仁勋一个人打工。


黄仁勋和云厂商们的最终幻想,是把所有的高级智能都锁在云端数据中心里,让你永远交网费、交Token费。


只要模型还在云端一天,推理的计费表就永远在转。


哪怕这个行业的API价格战打得再凶,只要英伟达的显卡还要通电,边际成本就永远降不到零。


天下苦黄仁勋久矣。但怎么反抗?


要彻底终结这种垄断,就必须把战场转移。


转移到黄仁勋的显卡永远触达不到的地方——端侧模型。


所谓端侧模型,其实就是在你自己的设备里运行模型。


把那个绝顶聪明的大脑,直接摁进你口袋里的手机、桌上的旧笔记本,甚至手腕上的一块智能手表里。



这会带来两个好处:


第一是成本。


一旦模型在本地跑起来,云端的Token计费器就彻底哑火了。


你不需要再为每一次提问心惊肉跳地算钱,你让它去读几十万字的研报、帮你写一整夜的代码,边际成本统统是零。


没有中间商赚算力差价,更不需要向任何二道贩子交过路费。


第二是隐私。


巨头们再也无法通过云端偷窥你的数据,公司的机密财务表、个人的私密日记,都被死死锁在了物理隔绝的设备里。


即便你坐在毫无网络信号的高铁钻山洞,它依然能为你全速运转。


但这条路,太难走了。


其实在过去两年,行业里也曾涌现过一大批喊着要做端侧、要把大模型装进手机的团队。


但资本是极其现实的。


当大家在泥潭里滚了一圈后发现,做端侧不仅要跟物理硬件的极限死磕,而且利润薄得像刀片。


更要命的是,它完全破坏了那种躺在云端按API收租的完美商业模式。


于是,人群很快就散了。


大家一窝蜂地调转车头,回去继续卷千亿万亿参数的云端巨兽。


潮水褪去后,这个赛道显得无比空旷和寂寥。


放眼全球,如今还愿意在这个边缘战场上逆行的人,寥寥无几。


比如美国巨头谷歌的Gemma团队、微软的Phi团队、阿里的Qwen团队等等。


有趣的是,就连卖铲子的英伟达,他们自己的研究院也发过一篇论文,直言不讳地说‘小语言模型才是未来’。


巨头们虽然下了场,但端侧对他们来说,更像是为了补全模型版图的防御性任务。


毕竟,让他们彻底砸碎自己躺着赚钱的云端收租盘,太难了。


但与这些巨头的防御性任务不同。


很多人对桌宠的记忆,还停留在二十年前只会吃饭睡觉的QQ宠物、电子鸡,或者是那个偶尔在屏幕上翻跟头、打呼噜的瑞星小狮子。


PART.03


明天


THUMB


STOPPING


昨天,很多人都在为华为的一篇论文激动。


大家似乎看到了掀翻英伟达帝国的曙光。


但今天老黄依然穿着他那件标志性的黑皮衣,他依然是硅谷的唯一神明。


很多人问,中国的大模型什么时候能真正超越美国?


答案或许根本不在于谁能买到更多的显卡,或者谁能用更多的钱堆出一个更大的参数怪物。


真正的超越,往往发生在游戏规则被颠覆的那一刻。


大模型的上半场,是人肉写代码的手工作坊,是买卡囤卡的冷兵器时代。


大家比的是谁的钱包厚,谁能从那个穿皮衣的男人手里买到更多的硅片。


但下半场,规矩变了。


在这场天下苦老黄久矣的突围战中,华为在最底层的硅片上凿冰,DeepSeek在算法的极限上压榨算力。


不盲从巨头的暴力美学,不在旧规则里内卷,而是直接掀翻牌桌。


很多年后,当我们回头看当下发生的这些事,可能会发现这是一个静水流深的分水岭。


现在的硅谷依然热闹,纳斯达克的数字依然在跳动,老黄的饭局上依然坐满了求购芯片的大佬。


那个穿着皮衣的男人依然站在顶端,受万人膜拜。


巨头们也依然在为了云端的算力焦虑地厮杀。


但在他们看不见的地方,旧秩序的基石,已经被悄然抽走了几块。


在那条极其拥挤、昂贵、还随时可能被封锁的英伟达高速公路旁边,有一群中国造反者不再按喇叭催促了。


他们转过身,开始自己修路。

频道: 游戏娱乐
本内容来源于网络 原文链接,观点仅代表作者本人,不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com,我们将及时核实并处理。
正在改变与想要改变世界的人,都在 虎嗅APP
赞赏
关闭赞赏 开启赞赏

支持一下   修改

确定