DeepSeek凭借低成本高利润的V3/R1模型震惊AI界，但一年后核心人才遭巨头高薪挖角，陷入困局。这揭示了国产AI初创公司在巨头资源碾压下，技术理想在人才被精准定价的现实面前脆弱不堪。 ## 1. 人才流失动摇根基 - DeepSeek团队不足200人，核心研发约百人，5名核心成员的离职覆盖了基座模型、推理、OCR、多模态四条核心技术线。 - 团队极为年轻且精干，导致每个核心研究员都是单点依赖，流失一人即意味着整条技术线出现断层。 ## 2. 薪资的数学题：情怀不敌2到3倍溢价 - DeepSeek绝对薪资不低，但竞争对手开出的条件普遍高出2到3倍，部分甚至提供8位数总包，如罗福莉被雷军以千万年薪挖走。 - 公司缺乏长期激励，未融资导致期权估值不明、流动性几近于零，相比大厂成熟的股票激励体系毫无竞争力。 ## 3. 结构性矛盾：不止是钱的问题 - **算力鸿沟**：转向国产算力后，DeepSeek创始人承认与海外顶尖水平存在4倍算力消耗差距，而大厂拥有万卡级集群。 - **生态落差**：初创公司缺乏像字节、阿里、腾讯那样数亿用户的即时验证场景，技术商业化路径漫长。 - **信心动摇**：V4模型一再推迟发布，内部在竞争加剧下看不到明确节点，导致人才对技术前景产生怀疑。 ## 4. 系统性劣势与创始人的妥协 - 人才流动是双向的，但大厂凭借薪酬、算力和生态的“硬通货”，在交换中始终处于净流入端。 - 创始人梁文锋从拒绝资本转向寻求以超100亿美元估值融资，标志着技术理想主义开始向现实妥协。 - 融资后DeepSeek将面临更棘手的平衡：如何在引入资本后避免大厂化，并将技术领先性转化为商业壁垒。 ## 5. 行业镜鉴：技术理想主义的生存空间 - 当核心人才可以被8位数总包精准定价时，技术理想成了最廉价的留人工具。 - 个体的技术突破可被复制，但系统的资源优势不可逾越，行业需思考如何在巨头碾压下为理想主义保留火种。

2026-04-18 11:26

当核心人才可以被精准定价：DeepSeek遭遇人才困局

老解

速览

本文来自微信公众号： ICT解读者，作者：ICT解读者老解

2025年1月，DeepSeek-R1横空出世，560万美元的训练成本、545%的成本利润率，一串数据炸穿了中美AI圈对大模型研发的常识。美国风投家马克·安德森称之为AI领域的"斯普特尼克时刻"。梁文锋登上《时代》周刊全球100影响力人物榜单，《自然》年度十大科学人物榜单上赫然在列。

但一年后的2026年4月，故事急转直下。

据晚点LatePost报道，2025年下半年至今，DeepSeek至少5名核心研发成员确认离职——第一代大语言模型核心作者王炳宣去了腾讯，V3核心贡献者罗福莉被雷军千万年薪挖至小米，R1核心研究员郭达雅以传闻近亿元总包入职字节跳动Seed团队，OCR系列核心作者魏浩然和多模态成果核心贡献者阮翀也先后离开。5个人，覆盖了基座模型、推理、OCR、多模态四条核心技术主线。

与此同时，DeepSeek被曝正与投资人洽谈首次外部融资，寻求以超100亿美元估值筹集至少3亿美元——这个曾经拒绝过多家顶级VC和科技巨头投资邀约、坚持"纯搞AGI创新"的技术理想主义者，终究开始向资本低头。V4模型从原定2026年2月中旬一推再推，至今仍未正式发布。

这不是一个人的理想妥协，这是整个国产AI硬科技初创公司在巨头碾压下的一面镜子。

200人的团队，走了几个就能动摇根基

DeepSeek总共不到200人，核心研究团队约100多人，基模架构团队仅小几十人。更关键的是，这支团队的构成极为年轻：本科和硕士占比超七成，30岁以下超七成，几乎不社招，以应届生和实习生留任为主。

在这样一支规模不到大厂十分之一、人均工作时长不到大厂一半的精锐团队中，每一个核心研究员的权重都被放大到了极致。王炳宣参与过历代模型训练，是DeepSeek从0到1的基座搭建者；郭达雅是V2、V3、R1系列模型的核心作者，一个人横跨推理、代码两大方向；罗福莉是V3模型的关键开发者，被雷军亲自下场招募。

对大厂而言，流失一个核心研究员是局部损失；对DeepSeek而言，流失一个核心研究员意味着整条技术线出现断层。这不是夸大其词，而是小团队的先天脆弱性——人少意味着每个人都是单点依赖，没有人可以被"替代"。

薪资的数学题：情怀打不过2到3倍

人才为什么走？先算一笔账。

据多方信源，DeepSeek的绝对薪资并不低，但竞争对手开出的条件"翻2到3倍问题不大"，部分甚至给出8位数总包（含股票/期权）。罗福莉的案例最具代表性——雷军以千万年薪加码招募，亲自盯这件事。郭达雅虽被字节官方否认"亿元年薪"，但多路信源指向其总包远超DeepSeek的薪酬体系。

再对比AI行业的整体薪酬水平：大模型算法工程师月薪中位数已达24760元，顶尖人才年薪逼近200万元。北京海淀区官方发布的紧缺岗位目录显示，人工智能领域整体平均年薪为48.14万元，而芯片算法与设计优化工程师年薪已突破百万元。

DeepSeek的另一重劣势在于长期激励的缺失。2023年后，DeepSeek未再进行外部融资，员工期权协议没有明确的公司估值支撑，流动性几近于零。梁文锋曾以类似OpenAI与微软的"回报上限"协议尝试接触投资人，没有机构接受。没有估值、没有上市预期、没有期权变现通道——这纸期权在账面上可能是天文数字，在现实中是一张无法兑现的期票。

大厂则恰恰相反。字节跳动已上市，期权有明确的流通渠道；腾讯的股票激励体系成熟；小米在港股上市，薪酬+期权的组合包可以做到精准定价。当一个95后研究员面临"DeepSeek的无限可能"和"字节的8位数确定性"二选一时，理性的选择并不难做。

不只是钱的事：算力、生态和"被替代"的恐惧

如果把DeepSeek的人才困境归结为"给不起钱"，就低估了问题的复杂性。薪资只是表面，背后是三层结构性矛盾的叠加。

第一层：算力鸿沟。大模型训练的本质是算力竞赛。DeepSeek V3的训练成本是560万美元，但那是基于英伟达架构的极致效率优化。V4转向国产算力适配后，梁文锋自己承认了一个残酷事实：国内最好的水平和海外最好相比，模型结构和训练动力学上可能有一倍差距，数据效率上也有一倍差距，"合起来就要多消耗4倍算力"。而大厂——字节跳动Seed团队规模上千人，阿里达摩院、腾讯AI Lab同样拥有万卡级算力集群——在算力储备上，初创公司和大厂之间是一道量级级的鸿沟。

第二层：生态落差。大模型的价值不在于模型本身，而在于模型嵌入产业生态后的变现能力。字节有抖音、飞书等数亿级用户场景可以即时验证和落地；阿里有电商、云计算的完整AI商业化链路；腾讯有社交、游戏的庞大流量池。DeepSeek的技术再强，在商业化落地层面依然停留在API调用和开源模型输出，技术成果转化为商业价值的路径远长于大厂。对技术人员而言，研究成果能被数亿人使用，和研究成果停留在论文和排行榜上，职业成就感完全不同。

第三层：信心动摇。V4从2026年2月中旬一推再推，至今未正式发布。在AI行业，模型的发布节奏就是技术生命线。当OpenAI连续推出GPT系列迭代、Claude快速升级、字节豆包市场份额持续攀升时，DeepSeek在V3.2之后的"静默期"，对内部信心的侵蚀远超外部想象。一个没有明确绩效考核、没有DDL、每天下午6点下班的研究团队，当外部竞争压力加大、内部看不到新一代模型落地的节点时，人才出走只是时间问题。

双向流动的真相：巨头也在流血

值得注意的是，人才争夺战并非单向收割。过去一年，字节跳动Seed团队同样流失了近70名技术人才——近30人加入腾讯AI Infra团队，部分流向阿里、OpenAI、Google、Meta等。字节系前员工创办了30余家AI创业公司，覆盖Agent、多模态创作、具身智能等赛道。

而DeepSeek也在吸纳人才：从字节搜索团队挖来李宇琨（DeepSeek首位员工，负责预训练数据），从字节Seed Edge引入徐名宇（从事模型结构研发）。人才的流向从来不是单向的，但格局很清晰——大厂和初创公司之间的人才交换，大厂凭借规模和确定性，始终处于净流入端。

这意味着，DeepSeek面对的不是一个偶发的人才流失事件，而是一个系统性的竞争劣势：在人才市场的"汇率"中，大厂的薪酬包、算力储备和生态场景构成了"硬通货"，初创公司能打出的牌，只有技术理想和组织自由度——这两张牌，在现实面前越来越不好用。

梁文锋的妥协与代价

2025年下半年起，梁文锋开始发生转变：从技术理想主义者向商业化实践者靠拢。

具体动作包括：2025年秋天起频繁提及产品化和商业化方向，首次招聘"模型策略产品经理"等非研究岗，开始想办法给公司做估值、给团队更确定的预期。2026年4月17日，The Information报道DeepSeek正在以超100亿美元估值寻求至少3亿美元首轮融资。

这是一个标志性事件。2023年，梁文锋拒绝了所有外部投资，坚持独立发展。三年后，核心人才出走、V4迟迟难产、国产算力适配工程量远超预期——纯粹的技术理想，终究要为算力账单和人才账单买单。

但问题在于，接受融资只是第一步。融资到位后，DeepSeek将面临一个更棘手的平衡题：如何在引入资本后保持技术团队的专注力和自由度？如何在提升薪酬竞争力的同时避免大厂化的层级膨胀？在V4发布后，技术领先性能否转化为商业壁垒？

这些问题，没有一个是靠钱能解决的。

结语

DeepSeek的人才困局，给整个AI行业提了一个醒：当核心人才可以用8位数总包精准定价时，技术理想就成了最廉价的留人工具。

这不是对DeepSeek的否定。在不到200人的团队规模下，用远低于大厂的算力和人力，做出V3/R1这样震动行业的产品，本身就是中国AI硬科技实力的证明。但这也恰恰说明了一个残酷的现实——在技术密集型赛道上，个体的技术突破可以被复制，而系统的资源优势不可逾越。

对整个行业而言，需要思考的不是"DeepSeek能不能留住人"，而是"如何在巨头的资源碾压下，为技术理想主义留出生存空间"。这个问题，比任何一个模型的训练成本都更值得算清楚。

AI创投日报频道: 前沿科技

老解

自媒体-ICT解读者

微信号：thank_xie

认证作者

已在虎嗅发表 82 篇文章

本内容来源于网络原文链接，观点仅代表作者本人，不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com，我们将及时核实并处理。

正在改变与想要改变世界的人，都在虎嗅APP