DeepSeek V4开源标志着中国大模型生态的繁荣,多款国产模型能力逼近国际旗舰,开源协作推动技术进步,但中美估值差距显著,开源模式被视为AGI发展的关键路径。 ## 1. DeepSeek V4开源与生态繁荣 - DeepSeek V4发布引发全球开发者快速部署,与同期开源的Kimi K2.6形成技术互补,后者采用DeepSeek的MLA注意力机制并支持多模态。 - 开源生态中技术流动高效,如V4采用月之暗面改进的Muon优化器,而K2.6的KV Cache压缩率达93%,体现协作优势。 ## 2. 中美大模型估值差距悬殊 - DeepSeek估值超400亿美元,但仍远低于OpenAI(8500亿)和Anthropic(1万亿),中国头部模型公司(智谱500亿、MiniMax 300亿、Kimi 200亿)估值仅为美国同行的"零头"。 - 差距源于美国市场的"叙事溢价"和IPO预期,但中国模型能力接近国际水平,估值差距或不可持续。 ## 3. 开源与闭源的技术路线之争 - Anthropic的封闭安全策略引发担忧,OpenAI稍显开放但仍不足;文章主张开源是避免技术垄断、实现AGI普惠的关键。 - 中国开源社区(如DeepSeek、Kimi、GLM)的协同创新对比美国闭源内卷,展现更健康的生态发展模式。 ## 4. 国产芯片适配的紧迫性 - 国内算力短缺导致推理成本上涨,DeepSeek等积极适配昇腾芯片,万亿模型国产化对生态普及至关重要。 - 硬件自主化意义被强调为"比指标进步更重要",关乎技术主权与产业落地。 ## 5. 从"屠龙少年"到群体崛起 - 三年内中国从大模型空白到多款万亿参数开源模型涌现,DeepSeek、Kimi等共同构成技术矩阵,标志国产AI进入新阶段。
DeepSeek V4开源,但这次不止一位屠龙少年
2026-04-25 18:59

DeepSeek V4开源,但这次不止一位屠龙少年

本文来自微信公众号: AGENT橘 ,作者:AGENT橘


屠龙少年终于归来


DeepSeek上一次让全世界瞩目,还是在去年的春节前发布V3和R1。


这一年多,圈子里反复问同一个问题:DeepSeek什么时候发新模型?


每次有风吹草动就一群人转发,每次都是误报,甚至还有一些公司等不及了开始公开喊话。


DeepSeek俨然已经成为大模型开源社区的精神图腾。


4月24日,DeepSeek V4开源。屠龙少年终于回来了。


它一发布,全球开发者几小时内就开始部署、微调、评测,连我们的程序员都自发地连夜接入到ColaOS。


但和去年V3发布的时候比,今天的大模型的开源社区已经变得更加繁荣,Qwen、Kimi、GLM、MiniMax,在过去的一年里都在疯狂地迭代和开源。


两个模型,一个生态


就在V4发布的同一周,Kimi K2.6也刚开源,两者有很多相似之处,同样是万亿参数,32B激活,同样是在Coding和Agent能力方面已经逼近海外旗舰模型。


在很多朋友的测试中,V4似乎还存在不少的bug,可能和新上线部署未调试完成有关,总体口碑K2.6的整体效果比V4要更好一些,同时支持多模态,不需要再衔接一个图片处理模型,方便了很多。


有趣的是,K2.6用了DeepSeek开源的MLA注意力机制,把KV Cache压缩率做到93%以上的架构,已经从DeepSeek的原创变成了业界标准。


V4用了Muon优化器。这个优化器最早是独立研究者提出的,月之暗面团队做了关键改进,在万亿参数规模上验证了稳定性,预训练全程零Loss Spike。



因为开源,技术自然流动。


相比美国那边A社和OpenAI都在闭源中互卷,开源生态里是一副和谐促进的景象。


大模型估值的迷思


前天跟朋友吃饭才知道,DeepSeek最新估值是400多亿美金,并不是之前传闻的100亿。


100亿对于DeepSeek的价值来说,确实也太少了。


看看其他的几家模型公司,已经上市的,智谱500亿美金估值,MiniMax 300亿美金估值。


即将在港股上市的Kimi现在大约200亿美金估值。


朋友们开玩笑说,错过了MiniMax和智谱,不能再错过Kimi,都等着打新。


我们再看看海外,OpenAI 8500亿美金估值,Anthropic甚至达到了离谱的一兆美金估值。


中国这几家大模型公司的价格,只不过是个零头而已。


这中间的差异是20-50倍,远远超过一个汇率。


到底是美国贵了,还是中国便宜了呢?


两边的市场自有各自的道理。


美国那边的估值里有太多叙事溢价和IPO预期,但中国这边也确实被低估了。当模型能力已经逼近甚至持平海外旗舰,当开源让全球开发者都在用你的模型,20-50倍的估值差距,显然无法持续。


中美,开源与闭源


说到美国那边,不得不聊几句我最近的担忧。


Anthropic现在的状态确实很猛,Claude Code的能力有目共睹,产品发布速度也极快。但他们的价值观让人有点害怕,那种"只有我们能定义模型安全"的傲慢姿态,背后是对控制权的执念。


OpenAI这边,虽然以前大家调侃它是ClosedAI,但比起Anthropic的封闭姿态都显得要好一些了。


只是"好一些",还远远不够。


通向AGI的大模型技术,如果由两家闭源模型公司垄断,那将是全人类的最大的风险。


模型必须开源开放,世界才有美好的未来。


还有一件不能忽略的事,就是国产芯片的适配。


现在国内缺卡现象太严重了,最近各家的Coding Plan都在纷纷涨价。


万亿大模型适配国产卡,是关乎整个生态能不能真正普及的问题。


DeepSeek、Kimi等模型都在积极地做昇腾适配,这件事的意义甚至比模型的指标进步意义更大。


三年前,中国的大模型公司大多还未成立。


三年后,万亿参数的模型纷纷发布并开源。


屠龙少年,终于归来,不过这次,不止一位。

AI创投日报频道: 前沿科技
本内容由作者授权发布,观点仅代表作者本人,不代表虎嗅立场。
如对本稿件有异议或投诉,请联系 tougao@huxiu.com。
正在改变与想要改变世界的人,都在 虎嗅APP