本文来自微信公众号:龙门阵尔,作者:筱姨妈,题图来自:AI生成
本文撰写滞后了两(三)周,由于最近沉迷大刘科幻作品,写作内容会时不时穿插大量胡言乱语。
本公众号一字一句完全UGC,除配图不含任何AI成分。保留一下人类在AI时代最后的一点坚持。
在硅谷呆了一个月。基本上一周半分配给了产业的同学,半周分配给了我自由的灵魂,一周在All in Podcast Liquidity Summit和一些Tech Conf见世面,一周在闲聊/组织Hiking/发呆。
3月份的时候也来过,正值OpenCLaw带来的Hype Cycle Peak,结合最近发生的各种事情,以及和3月时候的对比,分享一些take away:
0/ AGI会非常快。不要质疑、不要质疑、不要质疑!3月份的感受是,作为白领/知识工作者的我们已经被AI 替代50%,Researcher 被AI 替代30%;现在的感受是知识工作者被替代80%,Researcher 被替代50%,Infra 的Ai自动化也开始了,定性感受是10-20%;
不同researcher都表达了Scaling law还远远没有到头,不管是数据余量、算法还是Infra的优化,都还有很大的headroom。当然,模型的进步已经是只属于少部分人的事情了,和大部分人都无关。
1/ 之前觉得LLM吃掉80%的应用的价值,现在觉得可能是90%+。不过这是一个量的概念,90%的应用都没有价值。剩下的10%有杠杠可撬,最终可以释放出来的价值未必低,我甚至觉得在这里有机会出现非常大的公司。
刘慈欣在《吞食者》里面写到,文明是什么?文明就是吞食,不停地吃啊吃,不停地扩张和膨胀,其他的一切都是次要的。而自己生存是以征服和消灭别人为基础的,这是这个宇宙中生命和文明生存的铁的法则,谁要首先不遵从它而自省起来,就必死无疑。吞食者是依靠不断吞食行星来扩张的一种文明,在吞噬行星后会与它依靠相互引力作用保持同等速度运行,进行长达一个世纪的消化。
行星对抗吞食者有三种态:1. 归属;2. 平行;3. 逃逸。
归属是一种活路。
平行必然意味着被消化,被毁灭;
第三种,吞食者最终会因为自身结构膨胀到达一个加速度的物理极限,这是最终人类对抗吞食者,以及所有行星的潜在“逃生速度”,其实也是应用类型公司对大模型的“逃生速度”。
这部小说的点睛之笔在于,吞食者其实和人类同源,吞食者就是恐龙。无限制吞食自带的负反馈平衡机制,使得地球上的文明生物有越来越小的趋势,恐龙——人——然后可能是蚂蚁,甚至最后是草。虽然在变小,但是生态系统的强度和韧性并不见得低。
大模型是一种新的不断吞食的超级文明,但这种文明本身也存在物理极限的“加速度”,越是无限制扩张越会存在内生结构的脆弱性。应用类型的公司可以靠给自己疯狂“加”速度来实现逃逸 ——最终极的答案可能是一种数据上的加速度。
至于怎么加杠杆的问题我们下次再说(嘿嘿)。
2/Coding model能力在快速收敛:1)是头部模型之间的追及问题;2)开源和闭源之间的追及问题(本质是中国和美国之间的追及问题)。但是Coding Model格局 ——> Coding 格局咋翻译,没完全想明白,之前在硅谷和各路企业、创业者、开发者聊下来的感受是:
1)Coding 很容易切换,但是Agentic Workflow没那么容易;
2)个人开发者和创业团队很容易切换,但是Enterprise 不容易(第一是价格敏感,第二是都在担心自己工作要丢,切换工具的成本很高,犯不着)。
3/ 企业AI需求是最大的盲区。
企业需求的特点是:
1)Adoption curve 是阶梯跳跃式;一方面是人才结构更复杂,学习能力不同,一方面要看预算来源:1.1 来源于IT budget(作为成本中心),是线性变化的;1.2 来源于业务部门预算(作为潜在营收中心),会非线性变换;
2)模型能力不是卡点,但模型理论能力和实际能力之间的Gap会更大,企业落地需要对AI、企业Workflow和管理都懂的复合型人才;
3)价格并不敏感;
生产力进步会带动生产关系进步;生产关系变革会反作用于生产力变革。此时正处于两句话的交界处。
企业需求的结构是,模糊不清的结构:
1)100% cloud:云infra+云LLM;——> CSP、Neocloud、头部LLM
2)Hybrid:本地Infra + 云LLM;——> 某些ODM/OEM服务器玩家、头部LLM
3)100% 本地:本地Infra + 本地LLM(开源);——> 某些ODM/OEM服务器玩家、开源LLM
倒回到10年前的SaaS 时刻,请问长期到底有多少会彻底云化,多少是留在本地的需求?黑箱啊黑箱,但是很大就对了,都在猛猛增长就对了。
4/马上会进入模型分层的时代,Model Routing是接下来的超级简单题,比纯粹价格战有意义100倍;
哈耶克有一篇论文是《知识在社会中的运用》,以前因为知识的分布是零碎的,价格信号成为了知识运用的最大杠杠,所以广告是最好的商业模式。但是有了AI,知识的分布可以被逆向工程,意味着知识可以直接被定价。
但是现在的问题很大:token就是信息和知识的载体,但token 目前是平权的;生产不同知识凝结的劳动力是不同的,但现在不同任务都是用的一套模型。为什么我做一个简单的搜索和知识问答也需要Opus 4.8呢?
Token 定价是下一个重要议题。
并不认为现下的盲目价格战有太大的意义,两个差不多的模型,如果价差只有30-50%,其实很容易被infra和token efficiency的优化吃掉。做好Model routing是线下更简单且直接的策略。
模型一旦分层, 给中国选手留出的TAM会打开得巨大。
《朝闻道》里面,南方古猿开始仰望星空,真理之门就此打开了,从此以后人类就会踏上不断求索的道路。朝闻道,夕死可矣。
大刘通过宇宙文明的准则,同时也揭露了顶级闭源模型和开源模型之间的关系。Fable无论怎么封锁都是没有用的,上士闻道中士闻道下士闻道,大刘说得比这更有暴力美学。

6/ 这其中,Harness和数据 is Key。
好的Model routing意味着对于workflow的价值需要有正确度量,一个超级中心化、集权制的模型公司,未必会有这样的能力。
那么,是否存在这样的机会呢:一方面,大模型不断拓展知识的边界,当算力足够的时候连人类的Taste也没有价值(因为Taste本质也是一种有偏分布,算力不够的时候AI 无法充分捕捉所有的Outlier);但是一方面,在垂直领域留下了一部分知识的定价套利空间?


在和一些前沿lab 聊的时候了解到,目前海内外数据已经可以占到大模型训练(Pre train+post train)的1/10,意味着1T的Capex,训练占30%,数据市场规模可以有30bn。大模型在不断通过数据去扩充知识边界,反过来想,这里是不是大量垂直公司的机会,以及是不是会出现新的平台和生态?
综上一下吧:
1. Tokenmaxxing是一个局部问题,不用刻意夸大;
2.但从科技先驱-> 企业深水区,大模型增长斜率会迎来一个“Reset 时刻”,此后继续健康发展(3/)
3. 中国开源模型未来会有非常巨大的空间(严重看好China AI,具体什么投资机会欢迎大家来讨论)(2/,3/和4/)
4. 不在任何阵营头部梯队的LLM公司,和应用公司无差别(1/和4/)。要么go top,要么go cheap,中间一点机会都没有(2/和4/)
5. Model routing和Token重定价带来的变化和机会,需要持续关注
再说说在Liquidity event和某行Tech conf上的见闻吧,尤其是老外咋看的。
1. 存储 > CPU >> 光。
存储= 学一个票;
CPU = 学3个Maybe 4个;
光 = 学???;太难了;NVDA和AMD的会上一半时间都在讨论CPU而不是GPU;
2. 老外已经进入自我强化模式。
印象最深刻是某global cross-over fund parter的分享,大概意思是GPU是有fab和foundry两种biz model的,但是Memory 没有TSMC,没有Broadcom,所有Memory公司都是端到端的没有第三方平台,所以Memory的估值倍数应该更高。
总结来说,每次在硅谷呆着AI信仰会暴力充值到200%,回国了会被理性拉回来一部分。深入第一线的时候才会感受到涌现的魅力。
本文来自微信公众号:龙门阵尔,作者:筱姨妈
