近期市场传出DeepSeek拟融资70亿元，结合降价动作，本文分析其融资原因与定位转向，梳理AI大模型行业竞争逻辑变化。 ## 1. 融资消息核心信息近日有市场消息称，DeepSeek本轮融资目标约700亿元人民币，投后估值约3240亿元人民币，潜在投资方包括宁德时代、腾讯、京东、网易及多家投资机构，融资窗口全面打开。几乎同期DeepSeek宣布V4-Pro API价格永久下调75%，这并非普通降价，而是定位转变的信号。 ## 2. 初始状态：不缺资金的技术项目梁文锋旗下的幻方量化是国内头部赚钱量化私募，2025年收益均值约56.55%，管理规模超700亿元，浮盈接近400亿元。此前DeepSeek长期由幻方量化供血，不急于融资和商业化，更像是低调的内部技术实验室。 ## 3. 行业竞争逻辑已经转变 AI行业进入Agent时代后，同类任务的Token消耗达到传统ChatBot时代的数十倍甚至上百倍，行业竞争从比拼模型能力转向比拼低成本、稳定承载大规模推理需求的能力。当前头部大模型厂商都进入高频迭代状态，竞争压力远超此前，人才流失已是可见的直接挑战。 ## 4. DeepSeek定位转向AI基础设施 DeepSeek此前定位是聚焦模型能力的技术公司，如今转向争夺Agent时代调用量、开发者生态与Token入口的平台型AI基础设施。主动永久降价是基础设施厂商的典型竞争逻辑，和早期AWS、阿里云的发展路径相似，本轮融资将用于支撑电力、算力、数据中心等基础设施投入。

原创2026-05-24 19:01

梁文锋为什么需要700亿？

宋思杭

出品｜虎嗅科技组

作者｜宋思杭

编辑｜苗正卿

头图｜视觉中国

从DeepSeek R1到V4发布的这一年半里，梁文锋一直被外界认为是一个坚定的“技术理想主义者”。

后来，随着DeepSeek被传出开放融资消息，这个理想主义者的标签开始弱化。但至少从V4技术路线来看，梁文锋仍然是一位技术理想主义者。

近日，有市场消息称，宁德时代已决定参与DeepSeek首轮融资；另外，潜在的投资方还包括腾讯、京东、网易以及IDG、Monolith等机构。报道称，DeepSeek本轮融资目标约700亿元人民币，投后估值约450亿美元（约3240亿元人民币）。

从上述潜在投资方的类型来看，DeepSeek似乎正在全面打开融资窗口。

而几乎就在融资消息持续发酵的同时，另一件事也在发生。5月23日，DeepSeek宣布，V4-Pro API价格永久下调75%。

再结合近期持续发酵的融资消息，这并不像一次普通降价，而是DeepSeek彻底转变定位的信号。

过去，大模型公司的核心问题是谁的模型能力更强；但现在，越来越多公司开始意识到，真正决定行业格局的，可能已经不是模型能力本身，而是谁能承载越来越庞大的Token消耗、Agent调用，以及长期推理成本。

某种程度上，今天的DeepSeek也正在被推向这个新的位置——一个需要电力、算力、数据中心、产业资本共同支撑的AI基础设施。

梁文锋为什么需要700亿？

首先，一个毋庸置疑的事实是，梁文锋并不缺钱。

DeepSeek背后的幻方量化，长期以来都是国内最赚钱的量化私募之一。公开数据显示，2025年，幻方量化收益均值约56.55%，管理规模超过700亿元人民币。按此粗略计算，仅浮盈规模就接近400亿元。

这也是为什么，很长一段时间里，DeepSeek都不像一家严格意义上的AI公司。

它更像是幻方量化内部的“AI实验室”，或者说，一个由量化公司长期输血的技术团队。

在R1爆火之前，DeepSeek既不急于融资，也不急于商业化。相比一家典型创业公司，它更像一个以工程能力驱动的小团队：规模不算庞大，组织极度克制，甚至连对外PR都很少。

但现在，AI竞争格局已经开始变化。

人才流失，只是外界目前能看到的最直接问题。

而更大的变化在于，今天的大模型竞争格局，已经不是一年前的时候了。

过去一年里，OpenAI、Gemini、Qwen、Kimi以及MiniMax几乎都进入了持续高频迭代状态。尤其是在Agent爆发之后，模型公司之间竞争的，也已经不再只是模型能力本身，而是Token消耗。

而这也是V4发布的大背景。

一个越来越明显的变化是，AI行业真正暴涨的，开始变成Token消耗。

过去，一次普通聊天可能只涉及单轮推理；但Agent会自动拆解任务、调用工具、多轮验证、自主检查，甚至长时间运行。

这意味着，同样一个任务，Agent时代的Token消耗，很可能是传统ChatBot时代的数十倍，甚至上百倍。

而当Token调用开始指数级增长之后，大模型公司的竞争逻辑也会随之改变。

过去，比拼的是谁的模型更聪明；但现在，越来越多公司开始意识到，真正决定行业格局的，可能是谁能够以更低成本、更稳定的方式，承载越来越庞大的推理需求。

这也是为什么，V4-Pro永久降价75%，并不像一次普通降价。

因为对于今天的大模型公司而言，价格背后争夺的，已经不只是利润，而是未来Agent时代的调用量、开发者生态以及Token入口。

某种程度上，这也是DeepSeek如今突然需要700亿元融资的原因。

DeepSeek开始变了

梁文锋需要700亿的背后，也许意味着今天的DeepSeek，要改变定位了。

过去很长一段时间里，外界对于DeepSeek最核心的印象，始终是一家模型公司。它最重要的任务，是证明自己能够做出全球领先的大模型。

因此，无论是R1时期的低成本训练，还是V4阶段的Hybrid Attention、MegaMoE2以及国产卡适配，DeepSeek最核心的竞争力，始终还是模型能力本身。

但从最近这一系列动作来看，DeepSeek的定位似乎正在开始变化。

其中最明显的信号，就是V4-Pro的永久降价。

因为真正主动长期降价的，通常是平台型基础设施公司。比如早期的AWS和后来的阿里云，本质上都经历过类似阶段，它们争夺的并不是单次利润，而是未来更大的调用规模、开发者生态以及市场份额。

而今天，DeepSeek似乎也开始进入类似逻辑。

尤其是在Agent逐渐成为大模型行业下一阶段核心变量之后，模型公司真正争夺的是谁能够承载更多Agent运行。

因为Agent意味着：更长时间运行；更复杂的任务链；更频繁的工具调用；更庞大的Token消耗。

这意味着，未来的大模型竞争，可能会越来越像一场基础设施战争。

而这或许也是为什么，这次DeepSeek潜在投资方里，会同时出现宁德时代、京东、网易以及Monolith等不同类型公司的原因。

文章标题：梁文锋为什么需要700亿？

文章链接：https://www.huxiu.com/article/4861012.html

阅读原文：梁文锋为什么需要700亿？_虎嗅网

AI创投日报频道: 前沿科技

宋思杭

Less is more

sihang_orial

虎嗅团队

已在虎嗅发表 66 篇文章

本内容未经允许不得转载。授权事宜请联系 hezuo@huxiu.com。

正在改变与想要改变世界的人，都在虎嗅APP

赞赏

支持一下修改

确定