近期市场传出DeepSeek拟融资70亿元,结合降价动作,本文分析其融资原因与定位转向,梳理AI大模型行业竞争逻辑变化。 ## 1. 融资消息核心信息 近日有市场消息称,DeepSeek本轮融资目标约700亿元人民币,投后估值约3240亿元人民币,潜在投资方包括宁德时代、腾讯、京东、网易及多家投资机构,融资窗口全面打开。几乎同期DeepSeek宣布V4-Pro API价格永久下调75%,这并非普通降价,而是定位转变的信号。 ## 2. 初始状态:不缺资金的技术项目 梁文锋旗下的幻方量化是国内头部赚钱量化私募,2025年收益均值约56.55%,管理规模超700亿元,浮盈接近400亿元。此前DeepSeek长期由幻方量化供血,不急于融资和商业化,更像是低调的内部技术实验室。 ## 3. 行业竞争逻辑已经转变 AI行业进入Agent时代后,同类任务的Token消耗达到传统ChatBot时代的数十倍甚至上百倍,行业竞争从比拼模型能力转向比拼低成本、稳定承载大规模推理需求的能力。当前头部大模型厂商都进入高频迭代状态,竞争压力远超此前,人才流失已是可见的直接挑战。 ## 4. DeepSeek定位转向AI基础设施 DeepSeek此前定位是聚焦模型能力的技术公司,如今转向争夺Agent时代调用量、开发者生态与Token入口的平台型AI基础设施。主动永久降价是基础设施厂商的典型竞争逻辑,和早期AWS、阿里云的发展路径相似,本轮融资将用于支撑电力、算力、数据中心等基础设施投入。
梁文锋为什么需要700亿?
原创2026-05-24 19:01

梁文锋为什么需要700亿?

出品|虎嗅科技组

作者|宋思杭

编辑|苗正卿

头图|视觉中国

 

从DeepSeek R1到V4发布的这一年半里,梁文锋一直被外界认为是一个坚定的“技术理想主义者”。

 

后来,随着DeepSeek被传出开放融资消息,这个理想主义者的标签开始弱化。但至少从V4技术路线来看,梁文锋仍然是一位技术理想主义者。

 

近日,有市场消息称,宁德时代已决定参与DeepSeek首轮融资;另外,潜在的投资方还包括腾讯、京东、网易以及IDG、Monolith等机构。报道称,DeepSeek本轮融资目标约700亿元人民币,投后估值约450亿美元(约3240亿元人民币)。

 

从上述潜在投资方的类型来看,DeepSeek似乎正在全面打开融资窗口。

 

而几乎就在融资消息持续发酵的同时,另一件事也在发生。5月23日,DeepSeek宣布,V4-Pro API价格永久下调75%。

 

再结合近期持续发酵的融资消息,这并不像一次普通降价,而是DeepSeek彻底转变定位的信号。

 

过去,大模型公司的核心问题是谁的模型能力更强;但现在,越来越多公司开始意识到,真正决定行业格局的,可能已经不是模型能力本身,而是谁能承载越来越庞大的Token消耗、Agent调用,以及长期推理成本。

 

某种程度上,今天的DeepSeek也正在被推向这个新的位置——一个需要电力、算力、数据中心、产业资本共同支撑的AI基础设施。

 

 梁文锋为什么需要700亿?

 

首先,一个毋庸置疑的事实是,梁文锋并不缺钱。

 

DeepSeek背后的幻方量化,长期以来都是国内最赚钱的量化私募之一。公开数据显示,2025年,幻方量化收益均值约56.55%,管理规模超过700亿元人民币。按此粗略计算,仅浮盈规模就接近400亿元。

 

这也是为什么,很长一段时间里,DeepSeek都不像一家严格意义上的AI公司。

 

它更像是幻方量化内部的“AI实验室”,或者说,一个由量化公司长期输血的技术团队。

 

在R1爆火之前,DeepSeek既不急于融资,也不急于商业化。相比一家典型创业公司,它更像一个以工程能力驱动的小团队:规模不算庞大,组织极度克制,甚至连对外PR都很少。

 

但现在,AI竞争格局已经开始变化。

 

人才流失,只是外界目前能看到的最直接问题。

 

而更大的变化在于,今天的大模型竞争格局,已经不是一年前的时候了。

 

过去一年里,OpenAI、Gemini、Qwen、Kimi以及MiniMax几乎都进入了持续高频迭代状态。尤其是在Agent爆发之后,模型公司之间竞争的,也已经不再只是模型能力本身,而是Token消耗。

 

而这也是V4发布的大背景。

 

一个越来越明显的变化是,AI行业真正暴涨的,开始变成Token消耗。

 

过去,一次普通聊天可能只涉及单轮推理;但Agent会自动拆解任务、调用工具、多轮验证、自主检查,甚至长时间运行。

 

这意味着,同样一个任务,Agent时代的Token消耗,很可能是传统ChatBot时代的数十倍,甚至上百倍。

 

而当Token调用开始指数级增长之后,大模型公司的竞争逻辑也会随之改变。

 

过去,比拼的是谁的模型更聪明;但现在,越来越多公司开始意识到,真正决定行业格局的,可能是谁能够以更低成本、更稳定的方式,承载越来越庞大的推理需求。

 

这也是为什么,V4-Pro永久降价75%,并不像一次普通降价。

 

因为对于今天的大模型公司而言,价格背后争夺的,已经不只是利润,而是未来Agent时代的调用量、开发者生态以及Token入口。

 

某种程度上,这也是DeepSeek如今突然需要700亿元融资的原因。

 

 DeepSeek开始变了

 

梁文锋需要700亿的背后,也许意味着今天的DeepSeek,要改变定位了。

 

过去很长一段时间里,外界对于DeepSeek最核心的印象,始终是一家模型公司。它最重要的任务,是证明自己能够做出全球领先的大模型。

 

因此,无论是R1时期的低成本训练,还是V4阶段的Hybrid Attention、MegaMoE2以及国产卡适配,DeepSeek最核心的竞争力,始终还是模型能力本身。

 

但从最近这一系列动作来看,DeepSeek的定位似乎正在开始变化。

 

其中最明显的信号,就是V4-Pro的永久降价。

 

因为真正主动长期降价的,通常是平台型基础设施公司。比如早期的AWS和后来的阿里云,本质上都经历过类似阶段,它们争夺的并不是单次利润,而是未来更大的调用规模、开发者生态以及市场份额。

 

而今天,DeepSeek似乎也开始进入类似逻辑。

 

尤其是在Agent逐渐成为大模型行业下一阶段核心变量之后,模型公司真正争夺的是谁能够承载更多Agent运行。

 

因为Agent意味着:更长时间运行;更复杂的任务链;更频繁的工具调用;更庞大的Token消耗。

 

这意味着,未来的大模型竞争,可能会越来越像一场基础设施战争。

 

而这或许也是为什么,这次DeepSeek潜在投资方里,会同时出现宁德时代、京东、网易以及Monolith等不同类型公司的原因。

文章标题:梁文锋为什么需要700亿?

文章链接:https://www.huxiu.com/article/4861012.html

阅读原文:梁文锋为什么需要700亿?_虎嗅网
AI创投日报频道: 前沿科技
本内容未经允许不得转载。授权事宜请联系 hezuo@huxiu.com。
正在改变与想要改变世界的人,都在虎嗅APP
赞赏
关闭赞赏 开启赞赏

支持一下   修改

确定