DeepSeek真的带动GPU需求了吗?
2025-02-05 10:08

DeepSeek真的带动GPU需求了吗?

本文来自微信公众号:共识粉碎机 (ID:botaijin),作者:波太金,题图来自:AI生成


上周SemiAnalysis的文章里有这么一张图,提到Jevon's Paradox(杰文斯悖论)已经初见成效。H卡价格已经暴涨。



我们也非常感兴趣这个问题,看了开发者后台的价格变化。







上面的图片中:P5是H100,P4是A100,图片价格是8卡,west-2是俄勒冈,west-1是加州,east-1是北佛吉尼亚。


加州和俄勒冈确实已经看到价格提升了,普遍都比1月和12月明显要高,但还没有11月之前的价格高。东部北佛吉尼亚的影响还不大。


但这个就反映了Jevon's Paradox吗?


我们在之前的文章和算力租赁的季度路演中,都多次提到,算力租赁有三种定价方式:Contract、On-demand和Spot


通过开发者后台以及爬虫,只能看到Spot的价格趋势。


Spot其实是所有算力租赁比重中最小的,它的比例甚至小于5%,在类似AWS这种一线CSP中,Spot的比重只有2%~3%。本质是因为Spot是从已有客户没有充分利用的产能里面抠出来的,比如有客户租了1000张卡,没有用满,才会拿出来做Spot。


所以确实涨了,但没这么夸张。


这就不难解释,为什么Deepseek会把算力价格带这么多,因为我们对比的参照系是算力中最小的池子。


但在价格以外,我们聊到的CSP渠道也和我们提到,不光是Spot,行业的H100利用率也提高了10%,目前二线CSP的H100利用率都已经接近95%~100%了。


我们也针对这个问题和CSP做了调研:


确实短期的用量增加全部都是因为Deepseek,客户的主要诉求是把现有的API改成Deepseek看能否做得更好。


同时因为对Deepseek兴趣很大,也在咨询内存更大的卡,例如H200。


但需求实际上还是Double Purchase,客户是在保留之前API的同时,试用下Deepseek看看改善有多少,原来的Llama模型该用还是用。在试用结果确认后,会很快选定最终模型,高利用率可能不可持续。


这种状况在过去出闭源新模型的时候也见过,所以之前更多反馈在API的供给上。


到了开源模型带动算力租赁利用率,确实是第一次。


如果过了3~60天的模型热度,Spot价格还能这么高,那说明在Double Purchase后,需求也有很大的变化了。


目前我们聊下来的渠道还是觉得,更多是因为Double Purchase影响。

本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系hezuo@huxiu.com
如对本稿件有异议或投诉,请联系tougao@huxiu.com
正在改变与想要改变世界的人,都在 虎嗅APP