本文介绍记忆3D记录产品Remy的商业模式与极致算力成本控制方案,为AI创业落地提供参考样本。 ## 1. 特殊的算力消耗逻辑与成本困境 Remy主打3D重建功能,每次用户扫描任务都需要从零开始独立训练,任务间无算力复用,每分钟都在消耗GPU时间,算力消耗比大模型对话更高,成本来自GPU显卡时间与电力,而非大模型的Token消耗。 上线初期流量波动极大:2025年10月上线后96小时内,预备的八九百张GPU迅速占满,最终扩容到1900张GPU才稳住,9天用户破百万;次年2月春节功能升级,流量再次暴涨,固定租卡成本极高且浪费。 ## 2. 弹性算力方案将成本可控化 Remy选择共绩科技的“算力滴滴”弹性算力模式,按需调度算力资源,峰值结束即可释放,价格为美国同类弹性算力公司的十分之一。 该方案将Remy每月算力成本控制在20万-30万元,远低于全月固定租1900张GPU所需的约50万元成本。 ## 3. 从工具到记忆媒介的商业模式转变 上线半年Remy用户达250万,运营数据显示日扫描数为日活的1/10,即九成用户登录后仅浏览历史记录,这让王正男将Remy定位从3D工具转向记忆媒介。 Remy用户记录记忆后打开浏览属于消费行为,对应流量广告模式,否定了适合生产力工具的订阅收费模式;未来需要提升留存,核心是引导用户从“拍”转向“看”。 ## 4. Remy的核心定位与未来目标 Remy的核心方向是**记录而非生成**:生成服务创作者,记录是全用户需求,人类一直在追求更真实的记录方式,Remy要做对抗时间、保存真实记忆的新载体。 当前最大产品挑战是提升用户使用频率,核心需要解决“3D内容对比2D内容的独特价值”问题;长期目标是1:1还原真实世界,争夺内容入口,和抖音、小红书竞争。
一场极致的算力成本压测
原创2026-06-17 15:05

一场极致的算力成本压测

出品|虎嗅科技组

作者|陈伊凡、解丹青

编辑|苗正卿

头图|AI生成


这是虎嗅WAIC“追踪Token商业新范式”系列文章第【01】期



“如果日均建模数80000次,每次两毛钱,每天花费16000元,如果是一个月,就是48万元。”

 

在说起算力消耗这个话题时,Remy创始人王正男掏出了手机,很认真地算了笔账,如果放在英伟达的显卡上跑,每个月固定消耗50万元。

 

对于一家创业公司来说,这笔Token消耗是不小的开销。这是建立在所有任务都跑在英伟达的显卡上。严格意义上说,Remy所做的事情跟Token的关系并不大,但Remy的生意,却与算力的消耗息息相关,甚至关系到这家公司的关键商业模式。王正男有他自己的一套控制成本的方法。


“我们从去年年底至今,半年时间,Remy的用户数达到了250万。”但王正男在思考另一件事,他就像一个精力无限的陀螺,语调昂扬,眼里有光。


Remy在2025年华为开发者大会(HDC2025)亮相


未来的Remy,要跟抖音和小红书争夺入口,这是个听起来“螳臂当车”的事,但并非不可能。我们在讨论这个极致算力成本控制案例时,也与王正男聊到了Remy的未来。


“我们从去年年底至今,半年时间,Remy的用户数达到了250万。”但王正男在思考另一件事,他就像一个精力无限的陀螺,语调昂扬,眼里有光。


Remy的算力账本


大模型烧Token,每次推理调用一次API,按调用量计费,可复用,可以并行,成本曲线相对可预测。Remy不是这个逻辑。

 

3D重建的每一次任务,都是一次独立的训练过程。用户扫了一个场景,服务器就要为这个场景从零开始跑一次高斯泼溅训练;下一个用户来了,再跑一次,两次之间毫无复用。Remy现在的三种模式里,物体模式平均5分钟出结果,人像模式10分钟,大场景40分钟——每一分钟,都在消耗GPU时间,对算力的消耗甚至比和大模型对话还多。


使用Remy记录下曾经陪伴寒窗苦读的课桌在B站获得大量观众共鸣


“我们的成本其实不是Token,而是GPU。”王正男说,“我们跑的是自己的高斯泼溅模型,购买的是显卡时间和电力。”

 

这就带来了一个普通SaaS公司不会遇到的麻烦:波峰和波谷。

 

2025年10月22日,Remy在国内首次上线。按王正男的话说,接下来96个小时堪称“失控”。上线第五秒,他们预备好的八九百张显卡全部拉满,排队任务数量眼看着直线往上涨。最终,他们在弹性算力平台上把算力扩到了1900张GPU,才勉强稳住局面。9天之后,Remy用户量突破100万。

 

"如果我去向大厂每个月租1900张GPU,显然不划算,因为峰值之后根本用不到这么多。"

 

所以,最划算的办法是把3D重建部署在弹性算力平台上,王正男选择了一家叫做共绩科技的公司,这种弹性算力的模式叫做“算力滴滴”,算力资源像打车一样,按需调度,用多少取多少,峰值结束就释放。价格是美国同类弹性算力公司的十分之一。这样,他每个月的算力成本可以控制在20万-30万元。

 

2月10日的那次功能升级,Remy推出了3D全家福和房间扫描功能,用户可以通过Remy 3D的记录自己曾经生活过的老房子以及与父母亲人团聚的时刻。正值春节,流量再次暴涨。每10分钟处理200次任务,每次大场景重建需要40分钟,这意味着任何时刻都有800张显卡没有停歇地在跑。但依然是,当春节接近尾声,用户的使用频率就会下降,如果按固定购买的逻辑囤卡,这个账根本没法算。


Remy的商业模式


王正男至今坚持不向用户收费。

 

王正男本人 图片由Remy提供


让王正男重新想清楚商业模式的,是一个意料之外的数字。Remy每日的3D扫描数,是日活用户数的1/10。

 

也就是说,十个打开Remy的用户里,九个在“看”,只有一个在“拍”。

 

这个比例,最初让他困惑。3D重建的直觉逻辑是:你来是为了记录,不记录来干嘛?但数据显示,大量用户登录之后,只是在浏览或者反复翻看自己此前留下的记录。

 

想明白这件事之后,他对Remy的定义发生了根本性转变:Remy不是一个工具,而是一种新的记忆媒介。


“工具产品解决效率问题,适合订阅收费。但Remy是在帮用户记录人生、保存记忆,这和效率没有关系。”

 

这个判断,直接否定了订阅模式。

 

订阅制的逻辑是:你付月费,我通过产品来提升你的效率。这是Photoshop的逻辑,是Notion的逻辑,是所有生产力工具的逻辑。但Remy的用户,记录一段孩子的童年、一套老房子的房间,然后打开来看,不是为了提高效率,他们在消费记忆。

 

消费行为,对应的是流量模式。

 

“广告一定是一个方向。包括开屏广告、上传等待广告。只要用户规模起来,就会产生商业价值。"他说,“我更相信流量模式,而不是订阅模式。"

 

虽然现在所有用户都会记录,但不会天天记录。记录天然是低频行为,因为用3D的方式来记录天然有门槛。想明白了这点,王正男决定,未来如果想提升留存率和用户价值,必须让用户从“拍”转向“看”。

 

最近Remy添加的沉浸声场功能,就是想让3D记忆有更多情感的元素。在 AI 时代,大模型模仿人说话、拍视频,但人类复杂的情感它们模仿不了。因为这是各种经历产生的“化学反应”,我们想用技术将这个“化学产物”保存下来。

最近Remy添加的沉浸声场功能,就是想让3D记忆有更多情感的元素。在 AI 时代,大模型模仿人说话、拍视频,但人类复杂的情感它们模仿不了。


王正男要解决的是,为什么这些人会每天打开Remy,而不是打开抖音或朋友圈?这个问题,他自己还没有完整的答案。“3D内容对比2D内容到底有什么独特的价值,这是我今年要重点回答的问题。”

 

以下为虎嗅的对话精选:


虎嗅:过去半年,你对Remy最大的认知变化是什么?

 

王正男:最大的变化是我越来越确定,Remy不是一个工具产品。过去大家会把它理解成3D扫描、3D重建或者空间记录工具,但现在我更愿意把它理解成一种新的记忆媒介。工具产品解决效率问题,因此适合订阅收费;而Remy是在帮助用户记录人生、保存记忆,这和效率没有关系。

 

虎嗅:为什么你反复强调“记录”而不是“生成”?

 

王正男:因为我认为生成是创作者的需求,记录是所有人的需求。生成式AI主要服务于创作者,他们用AI生成图片、视频、内容来表达和传播。但记录是所有人都会做的事情。我们会拍父母、拍孩子、拍毕业典礼、拍老房子,因为这些时刻以后可能再也不会出现。

 

虎嗅:很多人会问,照片和视频已经存在了,为什么还需要3D?

 

王正男:因为人类一直在追求更真实的记录方式。黑白照片变成彩色照片,照片变成视频,视频变成沉浸式内容,本质上都是同一个方向。

 

我经常讲一句话:记录也许是对抗时间唯一的武器。时间会带走很多东西,人们之所以记录,是因为知道很多场景不会再出现第二次。我们希望Remy能够让这些记忆保存得更真实。

 

虎嗅:为什么在Remy以前没有成功的3D内容社区?

 

王正男:因为没人回答一个问题:用户为什么要看3D内容。

 

如果只是把一个东西变成3D,那并不足以支撑消费行为。视频更方便,图片更轻量,传播效率也更高。

 

虎嗅:现在最大的产品挑战是什么?

 

王正男:使用频率。现在很多用户会记录,但不会天天打开。记录天然是低频行为,因为创作有门槛。未来如果想提升留存率和用户价值,必须让用户从“拍”转向“看”。

 

虎嗅:Remy未来的目标是什么?

 

王正男:不是生成一个不存在的世界,而是尽可能1:1还原真实世界。



AI 行业开始认真算账了。不是只看模型能力,而是看 AI 是否真正进入业务、产生结果、跑出回报。


这也是虎嗅想追问的:钱烧哪了?干成啥了?赚还是亏了?能复用吗?

 

围绕这四问,我们将深度对话AI产业链条上的重要公司,沉淀AI账本样本库;还将在7月WAIC期间推出系列直播、闭门会,与企业关键决策者共探AI生意。

 

详情请戳,一起见证AI时代商业落地的真实变化。

 



文章标题:一场极致的算力成本压测

文章链接:https://www.huxiu.com/article/4868069.html

阅读原文:一场极致的算力成本压测_虎嗅网
AI原生产品日报频道: 前沿科技
本内容未经允许不得转载。授权事宜请联系 hezuo@huxiu.com。
正在改变与想要改变世界的人,都在虎嗅APP
赞赏
关闭赞赏 开启赞赏

支持一下   修改

确定