DeepSeek因算力压力临时限制重新生成、修改次数引发用户争议,这是大模型行业的普遍情况,用户更在意产品限制的透明度。 ## 1. DeepSeek突然限制重生成、修改次数引发用户争议 5月29日下午,不少用户发现DeepSeek悄悄对重新生成、修改功能加上限:普通对话重生成3-6次触达上限,专家模式仅约3次,修改输入上限一般为6次。 DeepSeek未发布正式公告和公开配额,API未受影响,突然限流让用户对服务缩水、后续收费产生担忧,引发社群热议。 ## 2. 限制为算力压力下的临时措施,新算力预计下半年扩容 小红书半官方账号“白墙”说明,本次限制是用户量激增、服务压力过大时的临时举措,目的是优先保障基础文字对话正常可用。 重新生成、修改消息对服务器而言都属于全新推理请求,大量用户反复操作会带来极高负载,近期专家模式文件传拿下架、智能搜索关闭也都是算力紧张导致。 白墙给出建议:触达上限后等待15-30分钟即可自动恢复,反复快速点击会延长限制;同时提到华为昇腾新卡正在部署,预计下半年上线完成算力扩容后将取消临时限制,该说法暂未得到DeepSeek官方确认。 ## 3. 算力绑定使用限制是AI行业普遍操作 不止DeepSeek,多家头部AI厂商都有类似操作:ChatGPT始终有消息上限,付费用户高峰期也会遇限,免费用户额度耗尽后会被切换到轻量模型;Anthropic为Claude不同档位设置使用预算,会随算力容量调整高频场景上限,算力扩容后放开额度,目前高消耗场景已逐步贴近token计量收费。 图像、视频生成类AI产品更常见,需求激增时普遍会收紧生成次数、缩减免费额度,“每一次推理都有成本”已是AI行业的既定现实。 ## 4. 用户可理解限制,更期待官方提前透明告知 用户对免费AI产品已形成“随便用”的使用习惯,平台收费或收紧功能很容易引发情绪反弹,本次争议的核心并非限制本身,而是官方未提前告知。 DeepSeek本次仅限制易产生高负载的非基础功能,保住了基础对话的可用性符合行业逻辑,但突然限流会引发用户不必要的猜测;当AI成为日常工具,用户对服务稳定性、信息透明度的要求正在提高,公开说明规则更易获得用户理解。
700亿融资赶紧到位吧,DeepSeek开始限制重生、修改次数了
2026-05-30 11:44

700亿融资赶紧到位吧,DeepSeek开始限制重生、修改次数了

本文来自微信公众号:字母AI,作者:袁心玥,题图来自:AI 生成


5月29日下午,不少网友发现,DeepSeek重新生成、修改有次数限制了。


连续修改或重新生成几次后,页面会提示达到上限。有网友反馈,在普通对话中,重新生成3到6次后就会达到上限;而在专家模式下,可能只有3次机会。修改输入次数上限一般是6次。



目前DeepSeek还没有发布正式公告,也没有公开固定配额表,但这件事已经在社群引发激烈讨论——毕竟DeepSeek有大量的忠实用户,包括我在内,平时偶尔遇到服务器繁忙、页面崩一下,大家还能体谅,但怎么说也不能一声不吭地加限制了吧,让人很慌啊。


API倒是没受什么影响,所以大概率还是基础设施的问题,熟悉的配方。



算力告急下的临时限流?


对于这次限制,小红书上的“半官方账号”白墙表示:别慌,这是暂时的。



按照它的说法,“修改消息”和“重新生成”突然被限制,并不是DeepSeek在做所谓“负优化”,只是算力压力太大之后采取的临时措施。


因为DeepSeek这段时间用户量增长很快,尤其是从5月29日下午开始,App端请求压力明显。为了优先保证最基础的文字对话还能正常使用,团队只能先对“修改消息”和“重新生成”这类高频操作做限制。


虽然在用户界面上,“重新生成”只是点一下按钮,“修改消息”也只是改一下原来的问题。但对服务器来说,这两件事都不是简单刷新,而是一次新的推理请求。用户每点一次重新生成,模型就要重新处理上下文、生成答案。修改消息也是一样,只要原问题变了,模型就需要基于新的输入再回答一遍。


所以,当大量用户同时反复点击,把“重新生成”当成无限抽卡按钮时,这部分请求就会变成很重的服务器压力。


这件事可以和DeepSeek近期的一些变化放在一起看。比如专家模式文件上传下架、智能搜索功能关闭,以及不时出现的“服务器繁忙”,背后的原因其实都是算力资源紧张,整体服务压力已经高到需要做取舍。



DeepSeek太好用了,底层基建要跟上啊。


对于“修改消息”或“重新生成”达到上限的情况,白墙给出的建议是,不要连续快速点击,可以先停下来,等15到30分钟后再试。按照该账号的说法,多数情况下限制会在等待后自动恢复;如果反复快速点击,反而可能被系统识别为异常高频请求,导致限制时间变长。


白墙同时还提到,华为昇腾超节点的新卡正在部署中,预计下半年上线,届时算力会大幅扩容,这些临时限制大概率会取消。


不过,DeepSeek官方暂时还没就此事发出公告。包括限制次数、恢复时间,以及下半年算力扩容后的具体变化,都还需要等待官方进一步确认。


DeepSeek不是孤例


其实DeepSeek并不是第一家这么做的AI公司。


大模型产品在算力紧张、用户暴涨或者高峰期压力过大的时候,常见做法就是限流、降级、排队,或者把一些高消耗功能单独拿出来限制。


ChatGPT就一直有消息上限,即使是付费用户,在高需求时期也可能遇到使用次数限制。免费用户达到高级模型额度后,也会被切换到更轻量的模型继续使用。


可以理解为一种“服务降级”,不是不让用,只是不能让所有人都无限使用最贵、最占资源的能力。



Claude也类似,Anthropic会给不同用户设置使用预算,Claude Code、API这类高频场景也会根据容量变化调整上限。算力宽裕的时候,额度可以提高;请求压力上来的时候,限制就会更明显。


5月6日,Anthropic还专门发文说,随着新的算力合作和容量增加,它提高了Claude Code和Claude API的使用上限。反过来也说明,使用上限和算力容量是直接挂钩的,算力紧张时就会收紧,算力扩容后才会放开。



不过Anthropic现在对不同订阅的额度都设置了更细的使用限制,Claude Code这类高消耗场景也越来越接近token计量收费的逻辑。


图像和视频生成产品就更典型了,Sora、Gemini的图像生成功能、以及其他AI视频工具,在需求激增时都出现过生成次数收紧、排队时间变长、免费额度减少的情况。


可以说,“每一次推理都有成本”已经成为AI产品难以避开的现实。


前段时间,豆包收费就引发过一轮讨论。“豆包,贵又难用”一度冲上微博热搜,它和DeepSeek这次限制功能不同,但用户反应背后的逻辑是相通的:大家习惯了AI产品便宜、随便用,一旦平台开始收费,或者开始限制某些功能,用户情绪很容易反弹。


对AI公司来说,基础能力免费,复杂能力开始收费,高成本功能设置额度,高峰期再做临时限流,其实是很常见的做法。


DeepSeek限制“重新生成”和“修改消息”的次数,放在整个AI行业里看并不算特殊。它限制的不是聊天入口或者模型本身,只是那些容易被用户高频点击、但每点一次都会重新消耗推理资源的操作。


因为基础对话必须尽量保住,这是用户还能不能用产品的底线;但重新生成、反复修改、文件上传、联网搜索、长上下文、多模态生成这些功能,都更容易在压力大时被限流或降级。


我觉得,这次争议的重点,其实不是“限多少”而是“怎么限”。


如果官方能早点说明,这是临时限流、多久恢复、哪些操作受影响,用户大概率会更容易接受。但在没有公告的情况下突然不能用了,大家当然会第一时间怀疑是不是功能在缩水、是不是以后要收费。


当AI产品从尝鲜工具变成日常工具,用户会越来越在意稳定性和透明度,限制本身可以理解,但最好不要让用户在弹窗里才第一次知道。


DeepSeek要知道,使用次数激增到需要被限额,同时也意味着,有很多用户正在等着你。


哪怕只是给个准信。


本文来自微信公众号:字母AI,作者:袁心玥

AI原生产品日报频道: 前沿科技
本内容由作者授权发布,观点仅代表作者本人,不代表虎嗅立场。
如对本稿件有异议或投诉,请联系 tougao@huxiu.com。
正在改变与想要改变世界的人,都在 虎嗅APP
赞赏
关闭赞赏 开启赞赏

支持一下   修改

确定