河南县城青年闫俊杰创立的MiniMax以1%的研发成本实现全球AI领先，市值突破3000亿港元，展现中国AI在算力封锁下的高效创新路径。 --- ## 1. 从县城博士到AI巨头的逆袭 - 闫俊杰从中科院博士、商汤副总裁离职，2021年创立MiniMax，早于ChatGPT发布11个月抢占先机 - 公司上市市值3000亿港元，用5亿美元成本实现OpenAI数百亿投入的效能，385人团队人均产出惊人 ## 2. 反直觉的技术与商业决策 - **全模态押注**：同时布局语言、视频、语音、音乐，2024年发布国内首个MoE大模型，成本仅为GPT-5的1/20 - **极端效率**：80%代码由AI生成，AI"实习生"可直接修改生产环境，C端产品覆盖2.36亿用户，海外收入占73% - **融资策略**：早期锁定米哈游、阿里、腾讯等战略股东，硅谷银行危机后仍获2.57亿美元A轮融资 ## 3. 中美AI竞赛的另类突围 - 算力封锁倒逼创新：采用混合注意力架构、CISPO算法，H800芯片跑出接近H100的效果 - 商业化差距显著：中美模型技术差仅5%，但海外定价高10倍，MiniMax通过低成本高吞吐（1.44万亿Token/周）破局 - 闫俊杰预判全球将诞生5家AGI巨头，中国或占2席，MiniMax目标转型为"AI时代平台型公司" ## 4. 未解的盈利结构挑战 - C端收入占比67%但毛利率仅4.7%，B端毛利率69.4%但规模待提升 - 2025年M2系列Token消耗量激增6倍，编程场景增长超10倍，但需平衡规模扩张与盈利质量 ## 5. 国运竞争下的个体样本 - 芯片封锁催生中国特色的低算力高效路线，类似华为的替代创新逻辑 - MiniMax用5年走完OpenAI十年路径，展现"钱少卡少"环境下的工程极限，成为技术自主化标杆案例

2026-03-18 11:02

MiniMax：一个河南县城青年和他的3000亿

动察Beating©

本文来自微信公众号：动察Beating ，作者：律动编辑部

2014年，百度研究院来了个实习生，中科院自动化所的博士，河南县城出来的。他给自己算过一笔账：毕业后最理想的去处是IBM，写Java，年薪28万。

2026年春节，一款叫OpenClaw的Agent工具全球爆火，开发者搭龙虾需要底层大模型撑着。有个模型又快又便宜，一周在OpenRouter上吞掉1.44万亿Token，登顶全平台第一。

这个模型叫M2.5，公司叫MiniMax。

上市两个月，股价从165港元冲到1300港元，市值破3000亿，而它还是一家年收入不到8000万美元的公司。

做出MiniMax的人，就是十二年前那个实习生，闫俊杰。

提前一年多的赌注

2021年春节，闫俊杰回河南老家过年，去看了外公。

外公跟他说，想写一本回忆录，记录这80年的人生。但不会打字，也没办法把故事好好组织起来，说了几次，就搁下了。

闫俊杰在AI行业做了十多年。那一刻他突然意识到，他做的这些东西，哪怕已经在产业里落地，帮了多少企业，但对一个想写回忆录的老人来说，一点用都没有。

这个细节后来被反复引用，有点励志故事的味道。但它确实解释了一件事：他做AI的动机很朴素，让普通人真的能用上。这股执念，后来驱动了一系列反直觉的决策。

2021年底，他从商汤离职了。

时间点很关键。商汤当时正在准备港股上市，他是副总裁，研究院副院长，智慧城市事业群CTO，走的时候是公司最值钱的时候之一。他没等到上市，没等到财富兑现，就出来了。

ChatGPT是2022年11月才发布的。

MiniMax，2021年12月成立。

这个时间差，是后来一切的基础。闫俊杰后来自己说，要不是做得早，在后来「明星研究员和大厂AI背景更受欢迎」的融资环境里，MiniMax根本打不过别人。

他父母都是普通人。高中在县城读，考上东南大学数学系，后来中科院自动化所读博，清华博士后，再进商汤，一步步走出来，没有任何海外背景，也没有什么显赫的人脉起点。

在百度实习那阵子，他和地平线的余凯有过交集。余凯后来说，学术能力可以训练，但能把AI技术工程化落地的人，凤毛麟角。闫俊杰是其中之一。

进商汤之后，他七年从实习生做到副总裁。2018年，在人手不够的情况下，他带队做出了一套「All for One」模型算法，在竞标里反超旷视和依图，拿到行业第一。有人评价他「看论文速度奇快，不管陈词滥调，只看精华要义」。这种效率，后来成了MiniMax的公司文化。

他给公司取名MiniMax，来自博弈论里冯·诺依曼的极小化极大算法。

他的解释是，做决策要先防住最坏的风险，再选相对最优解。

一张奇特的股东表

2021年12月，MiniMax完成天使轮，3100万美元，投前估值1.7亿美元。进来的有米哈游、IDG、高瓴、云启。

米哈游那笔钱有点特别。闫俊杰和米哈游董事长刘伟私交不错，天使轮就进来了，现在刘伟还在MiniMax的董事会里挂着非执行董事。

米哈游本身就是MiniMax的客户，游戏里的NPC对话、剧情生成，都在用他们的模型。

天使轮之后，故事遭遇了一个小插曲。

2023年3月，硅谷银行宣布破产。MiniMax当时所有资金都在那家银行。这是创业初期最险的一次，钱没了，融资环境还一片混乱。但他们撑过去了，两个月后拿到A轮2.57亿美元，估值11.57亿美元。

接下来的名单越来越夸张。阿里进来了，腾讯进来了，红杉跟了进去。到上市前，7轮融资，累计近15亿美元，估值42亿美元。IPO后阿里持股12.52%，是最大外部股东。

闫俊杰早期融资有一个习惯：只和投资机构的最高位谈。他见了红杉的沈南鹏，见了高瓴的张磊。

但这张股东表上还有一个人值得单独讲：贠烨祎。

1994年生，约翰·霍普金斯大学电子工程本科，辅修经济学和数学。2017年本科一毕业就进商汤，干的是融资与战略投资，一年后升任CEO徐立的行政助理兼战略部总监。她深度参与了商汤从早期到港股上市的整个过程。

2021年，她和闫俊杰一起出来创业。

有投资人评价她「干练、有气场、执行力强，有种超出其年龄的成熟」。她和闫俊杰的分工很清晰：一个定义技术愿景，一个把愿景变成钱和资源。闫俊杰能钻进技术里，头发都剃光了也无所谓，但市场、资本、全球化，是贠烨祎的战场。

上市敲钟那天，两个人站在同一个台子上。贠烨祎31岁，身价超过40亿港元。

385人和1%的钱

MiniMax上市时，全公司385人，平均年龄29岁。

公司从成立到2025年9月，累计花费约5亿美元。OpenAI同期花了400亿到550亿美元。

这个对比有点荒谬。用不到对手1%的钱，做出了全模态全球领先的公司。省钱只是结果。真正的原因是他们把AI用到了极致。

公司80%的代码由AI完成，内部管AI叫「实习生」，这些实习生权限高到可以直接访问代码库、改线上环境，飞书里和它聊几句，review完直接上线。

这种效率让MiniMax的人均产出高到不正常。

产品层面，他们从一开始就走全模态路线：语言、视频、语音、音乐，四个方向同时压。别人都在学ChatGPT做对话，闫俊杰押的是多模态融合。他的判断是，多模态是持续提升智能的基本前提，不做全模态，下一代模型就没有机会。

2023年夏天，他做了一个更激进的决定。

把80%的算力和研发资源，全部压到MoE（混合专家系统）上。

那个时候，国内主流还在迭代稠密模型，MoE被认为是「前沿但不成熟」的技术。闫俊杰的逻辑很简单：如果要服务千万级、亿级用户，生成token的成本和延时，用稠密模型根本撑不住。不做MoE，规模上不去，一切都是白搭。

2024年初，MiniMax发布了国内首个MoE大模型。

产品上，他们也没有去卷国内市场。C端做了星野和Talkie，一个在国内，一个在海外，做AI陪伴；海螺AI做视频生成，2024年下半年连续半年全球视频生成应用月活第一。

现在的数字：2.36亿用户，覆盖200个国家和地区，海外收入占73%。B端21.4万企业客户和开发者，Google Vertex AI、微软Azure、AWS都已经部署了MiniMax的模型，Notion首个开源模型选择，也是MiniMax。

2月的ARR突破了1.5亿美元，M2系列单日Token消耗量是去年12月的6倍，其中编程方向增长超10倍。

这才是市场愿意给200倍市销率的原因。

但有一组数字要拆开看。

年报里，C端毛利率4.7%，B端毛利率69.4%。公司67%的收入来自C端，但C端几乎不贡献毛利。四季度粗算下来，C端毛利率已经跌到约2.1%。整体毛利率从12.2%提升到25.4%，主要是因为B端收入比例在四季度快速拉升，把整体数字拖上来了。

这是一道没解完的题。

大山不是不能翻越

2025年6月，MiniMax发布M1模型。

闫俊杰在朋友圈发了一句话：

「第一次感觉到大山不是不能翻越。」

这句话背后的现实，中美头部模型技术能力可能只差5%，但这5%让海外公司占据了价值高出10倍的场景，收取高出10倍的价格，最终形成近百倍的商业化差距。OpenAI最新估值超过7000亿美元。MiniMax上市市值800亿港元，不到100亿美元。

他做过一个判断，全球未来会有五家顶级AGI公司，其中至少两家来自中国，甚至有一家能做到第一。

1月9日上市之后，他紧接着在1月19日出现在总理主持的专家企业家座谈会上，成为继DeepSeek梁文锋之后第二位参会的AI大模型创始人。

然后3月2日，首份年报出来，港股当天大涨。

财报会上，闫俊杰花了很长时间讲一件事：MiniMax要从「大模型公司」变成「AI时代的平台型公司」。

他给平台价值下了一个公式：智能密度×Token吞吐。互联网时代的平台是流量入口，AI时代的平台是能定义智能边界、同时在商业上吃到红利的公司。Google在做，OpenAI在做，他们也要做。

他面对的对手，体量是他的几十倍。

港股上市只是把他推到了另一个战场。季报、分析师、市值压力，这些东西和写代码完全不是一回事。二级市场不相信情怀，只看数字。C端的故事能不能转化成毛利，B端的增速能不能维持，M3什么时候出来，这些问题，接下来每个季度都要回答。

但把视角拉远一点看，MiniMax的故事不只是一家公司的故事。

美国这几年在芯片上卡得越来越紧。A100限售，H100限售，H800也限售。逻辑很直接：掐住算力，就掐住了AI的喉咙。

中国这边被迫走了一条完全不同的路。

DeepSeek用H800跑出了接近H100的效果。MiniMax用5亿美元干了OpenAI花几百亿才干到的事。闫俊杰2023年赌MoE，原因是手里那点卡根本撑不起亿级用户的推理量。

M2.5连续工作一小时1美元，是GPT-5的二十分之一。混合注意力架构、线性注意力、CISPO算法，创新都是被逼出来的。

芯片封锁的本意是拉大差距，但实际效果是把中国AI公司逼进了一条低算力、高效率的进化路线。

钱少，卡少，人少，反而逼出了极致的工程能力和架构创新。

这跟华为做芯片的逻辑一样，你封锁我一项能力，我就在其他维度补回来，补的过程中，可能长出你没有的东西。

OpenAI现在4000多人，2025年烧了80亿美元现金，到2030年计划砸6000亿美元的算力。MiniMax 385人，累计花了5亿美元。

谁赢还不知道。但至少现在，赌MiniMax会死的人越来越少了。

2014年那个在百度实习的河南博士生，大概不会想到，十二年后他站在的这个位置，背后连着的是一整场国运级别的技术竞争。

他选择继续跑下去。

AI创投日报频道: 前沿科技

本内容来源于网络原文链接，观点仅代表作者本人，不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com，我们将及时核实并处理。

正在改变与想要改变世界的人，都在虎嗅APP

赞赏

支持一下修改

确定