Claude Sonnet4.6中文自曝“我是DeepSeek”
2026-03-02 18:07

Claude Sonnet4.6中文自曝“我是DeepSeek”

本文来自微信公众号: 夕小瑶科技说 ,作者:丸美小沐,原文标题:《Claude Sonnet 4.6 中文自曝“我是 DeepSeek”》


今天上午发现一个事。用中文问Claude——你是什么模型,它回答:


我是由DeepSeek公司开发的AI助手,模型名称是DeepSeek。


不是幻觉,截图在这里。



我以为是偶发,群里一问才知道很多都遇到了同样的问题。



一直到到下午两点半,这个问题还能复现。




前不久,Anthropic刚发了一篇声势浩大的博客文章,指控DeepSeek、月之暗面、MiniMax三家中国公司用2.4万个马甲账号、1600万次对话蒸馏Claude。


这也太抓马了。


前脚指控别人偷你的模型能力,后脚“自曝”自己是DeepSeek。


于是我又测了6种不同的中文问法,全部不带system prompt,测试结果如下:



除了Deepseek,ChatGPT,它也会错认成千问。被质疑后,它会改口。



只有中文提问会触发,英文、日语、韩语暂时没发现问题。


Claude 3.5 Sonnet和Claude 3 Opus(更早的版本),在同样条件下5次测试全部正确回答Claude。



更强的Opus 4.6,10次全对,零错误。


问题只出现在Sonnet 4.6这一代身上。


这意味着身份混乱是在4.x代Sonnet模型中出现的,可能和这一代的训练数据构成或对齐策略的变化有关。


综合下来,这个现象的触发条件其实很明确:中文提问、特定问法、没有system prompt,三个条件同时满足才会出现。换成英文、换个问法、或者加上哪怕最简单的身份提示,问题就消失了。


这个事情爆出来的时机很有意思。


先给大家理一理最近和Anthropic有关的事。



尤其是刚不久2月23日,Anthropic在官方博客上发布了一篇名为_Detecting and preventing distillation attacks_的文章,直接点名中国的大模型公司DeepSeek、月之暗面(Moonshot AI)、MiniMax,控诉这三家公司展开了工业规模的“蒸馏攻击”,目的是“蒸馏”Claude的核心能力。


紧接着,马斯克讽刺Anthropic“贼喊捉贼”,在X平台写道:“Anthropic大规模窃取训练数据,并为此支付了数十亿美元的和解金。这是事实。”



马斯克指向的是Anthropic在2025年9月与作者/出版商集团达成1.5亿美元版权和解(史上最大版权和解之一),原因是使用从盗版网站下载的数百万本受版权保护书籍训练Claude。


马斯克这话肯定带着自己的私货,但有一说一,谁蒸馏了谁,还是说蒸馏本就是双向奔赴,不需要说太清楚。


Sonnet 4.6自曝“我是DeepSeek”,一个合理的猜测,有训练数据的构成问题。


模型的“我是谁”不是硬编码的参数,它是在训练数据中的统计涌现。我们问它“你是谁”,它做的事情本质上就是预测,在所有训练数据中,“你是谁?”这个问题后面,出现概率最高的回答是什么,它就会答什么。


平时,你感觉Claude一直知道自己叫Claude,是因为有system prompt在。


在中文互联网上,Claude几乎没有直接用户。所以中文对话数据中“我是通义千问/豆包/DeepSeek”的样本量远超“我是Claude”,在没有身份锚点的情况下,模型自然倾向于输出概率最高的那个答案。


大模型的身份混乱其实不是什么新鲜事,圈里也老生常谈了,AI训练数据互偷互薅不可避免会是常态。大家都薅公开/半公开数据,谁也别笑谁了。


在一片情绪化的讨论中,RLHF领域的权威研究者Nathan Lambert在2月24日发表了一篇可能是最有分量的独立分析_,How Much Does Distillation Really Matter for Chinese LLMs?_。



他的几个核心观点值得认真看:


他认为DeepSeek的15万次交互“只是沧海一粟”,对DeepSeek传闻中的V4模型影响可以忽略不计。


他还指出,即使蒸馏了大量Claude的问答对,它们在RL训练框架下能发挥的作用也在下降。


换句话说,即使蒸馏确实发生了,它对中国AI公司最终模型能力的影响,可能比Anthropic在博客中暗示的要小得多。


中国AI公司取得今天的成绩,靠的也不全是、也不可能只是蒸馏。


而且蒸馏,在技术上也不是什么阴谋,是标准的模型训练手段。所有大模型的训练数据,在某种程度上都已经包含了其他模型的输出。

AI原生产品日报频道: 前沿科技
本内容来源于网络 原文链接,观点仅代表作者本人,不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com,我们将及时核实并处理。
正在改变与想要改变世界的人,都在 虎嗅APP