2026-03-19 15:52

“日本最强AI”光速塌房，都怪中国DeepSeek太强？

蓝字计划

本文来自微信公众号：蓝字计划，作者：Hayward

连日本人自己都绷不住了。

3月17日，日本科技公司乐天高调发布了新一代AI大模型Rakuten AI 3.0，宣称是日本最大、性能最强的AI大模型。

这款模型来头不小：一方面，它背后有日本经济产业省支持的GENIAC项目站台，算是“国家队”级别的大模型；另一方面，它还拥有一个相当唬人的标签，7000亿参数。

这什么概念？

哪怕按更具体的口径来看，它的总参数规模也有671B，依然属于当前开源模型里的第一梯队，和DeepSeek V3坐一桌。

背靠日本国内最大靠山，参数又非常突出，对于这款模型的发布，乐天底气十足，连“（日本）国产模型的逆袭”都喊出来了。

但是，日本网友还没来得及为Rakuten AI 3.0开香槟，一场来自开源社区的技术打假就给他们浇了一盆冷水。

这款号称“日本最强、性能最强”的大模型，竟然是咱们中国开源大模型，DeepSeek-V3的日语“套壳版”。

日本的荣光，却出身不良

和绝大多数的打假“后知后觉”不同，Rakuten AI 3.0的吹牛行为甚至挺不过一个下午。

就在模型出来的几个小时里，开源社区的大神们就发现，这款加上了非常多牛逼限定词的AI大模型，有猫腻。

甚至乐天都没有过多的“掩饰”，因为Rakuten AI 3.0赫然在Hugging Face上的config.json文件里写着：

model_type:deepseek_v3

architectures:DeepseekV3ForCausalLM

这就相当于明牌告诉大家，这款模型的底层架构来自DeepSeek V3。

当然，DeepSeek V3作为一款开源模型，被学习、借鉴、使用来作为模型架构也正常不过，毕竟这就是开源的初心；

但Rakuten AI 3.0的问题在于，在发布的时候它丝毫没有提及使用了DeepSeek V3的架构，还搬出了“自主研发”“日本最强”“日本最大”等限定词，看上去真的是由乐天从0到1，自主鼓捣出来的大模型。

这也是开源社区最不满的地方：这款模型在上传的时候，没有充分保留DeepSeek原有的归属/许可证声明；直到被社区抓包之后，才悄悄地补上了NOTICE文件。

乐天的这种做法，显然是违背了开源精神，“需要保留原许可证和归属”的要求。

在使出这一招“亡羊补牢”之后，别说路人，连日本网友都好感都败光了。对于这款模型，日本网友都评论基本都是：

“GENIAC项目花纳税人的钱，就做个DeepSeek的日语fine-tune版？”

“自称日本最大高性能，却是中国的日语版。”

那么这款模型的性能怎么样呢？

根据乐天官方陆续公布的数据，Rakuten AI 3.0的纸面成绩其实相当能打。

像Japanese MT-Bench这样的日语综合基准，它已经跑赢了GPT-4o；而在日本文化理解、敬语表达、商务邮件、报告写作、文档分析这些更偏本土语境的任务里，表现也明显很强。

再加上它虽然总参数接近7000亿，但因为用了MoE稀疏架构，单次推理实际激活的参数并不高，成本还能被压到相当前沿闭源模型的10%左右。

也就是说，这模型不只是“成绩好看”，而且用起来还非常省钱。

但熟悉大模型的人一眼就看出了：这些不都是DeepSeek本来的优势吗？

是的，毕竟是一款基于DeepSeek-V3架构、再做日语数据微调和本土化优化的大模型，Rakuten AI 3.0的表现越是厉害，就越是能证明DeepSeek厉害，这也是X上相当一部分日本网友破防的点：

“日本政府用了纳税人的钱来支持你们，你们却用来证明中国的DeepSeek牛逼？”

估计梁文锋看到这出戏，做梦都得笑醒。

司空见惯的“抄袭”

但是，日本的网友们可能也有点“失忆症”了，毕竟从日本AI大模型的发展历程来看，抄袭，或者优雅点说：“套壳”，不是常态吗？

Rakuten AI 3.0可不是第一个使用了别家大模型架构作为基座的日本模型。

一个典型例子，是日本AI公司ABEJA在2025年4月左右推出的小型日语专精推理模型：ABEJA QwQ 32b。

光看这个名字，其实就已经名牌了。

毕竟连QwQ这个阿里千问系最标志性的前缀，它都懒得改。

而实际情况也差不多。

这款模型的底座，本来就是Qwen2.5+QwQ-32B，ABEJA做的事情，说白了就是先拿千问模型做日语持续预训练，再把推理能力整合进去，最后补一轮日语强化和微调。

本质上，它和乐天这次的路数并没有什么不同：都是拿中国开源大模型当基座，再靠本土数据和场景去做一层“日本化”包装。

只不过，ABEJA至少没有把自己演成什么从0到1横空出世的“日本最强原创模型”。

它不但把底座和训练路径写清楚，连阿里那边都没有介意，阿里巴巴官方X账号甚至还专门转发庆祝，大意就是：ABEJA做的日语推理模型，成绩已经超过了GPT-4o。

同样是“套壳”，ABEJA当然也谈不上多原创，只不过人家至少没有一边踩着别人的底座，一边还忙着擦脚印。

除了ABEJA和乐天，不少日本公司其实也大体走的是这条路。

像Lightblue、ELYZA这些做日语模型的玩家，底下是Qwen、Llama等现成底座，有的也会结合DeepSeek、Mistral这类强模型能力做本土化，上面再糊一层更懂日本企业文档、客服语料、敬语语境、制造业日志的数据，把它调成一个“更会说日本话、更会干日本活”的版本。

日经新闻网之前曾报道过，“「AIモデルスコア」で日本企業が開発した上位10モデルのうち、新興ABEJA（アベジャ）のモデルなど計6種がディープシークやQwenを基盤に開発されていた。”

翻译过来，就是现在日本公司推出的前10大模型里，有6个都是基于DeepSeek或Qwen进行二次开发。

其实，这在AI圈本来也不算是什么原则性问题，全球AI行业现在本来就是这么玩的。

美国也好，欧洲也好，中国也好，别说二三线团队了，很多一线团队其实也在走这条路：拿Qwen做推理增强，拿DeepSeek做蒸馏和本地部署，拿Llama做行业版，拿Mistral做轻量化和边缘场景。

毕竟，从头训练一个前沿基座，烧掉的是天文数字级别的算力、资金和人才；但如果你已经有了一个足够强的开源底座，真正决定你能不能跑出来的，反而是后面的数据、场景和落地能力。

所以，乐天这次的“炎上”，本质不是因为“抄袭”而触犯天条，而是干得太不体面了。

一边吃着开源模型的红利，一边又拼命把自己往“自主研发”“日本最强”“日本最大”上靠；一边站在DeepSeek的肩膀上，一边又不愿把这件事说透，甚至连许可证和归属都都悄悄藏起来。

别人套壳，至少套得坦坦荡荡；乐天套壳，却偏偏还想演成“全靠自己”。

又或许，乐天这次“不体面”的背后，折射出的，只是整个日本科技领域已经落后于世界的冰山一角。

日本IT业，失落的30年

1990年，随着经济泡沫被刺破，整个日本都仿佛被按下了暂停键。

股价暴跌、地价跳水、不良债权爆发、银行惜贷、企业连锁倒闭……整个日本经济像多米诺骨牌一样接连崩塌，正式跌入“平成不况”，并由此开启了失落的10年、20年，乃至30年。

而在这样的背景下，日本IT行业的轨迹，也几乎成了这场长期停滞的缩影。

关于日本的“笑话”大家已经看到非常多了：

都2024年了，日本政府居然还在和软盘“决战到天明”。

直到去年6月，日本数字厅才终于废掉了1034条还要求用软盘等介质提交材料的规定，只剩下一条和汽车回收有关的规定没处理完。

在AI、大模型、云计算都已经卷到天上的年代，日本政府居然还在认真讨论“软盘要不要退役”这种问题。

传真机也差不多。

这些年外界老拿“日本还在用传真”开涮，听上去像段子，结果很多时候还真不是段子。

日本文部科学省自己给出的“教育DX”（DX，Digital Transformation，数字转型）目标里，甚至把“原则上废止学校之间通过传真机往来和盖章”单独列成了KPI；而且这个目标之所以要专门写出来，恰恰是因为现实里它远远没有完成。

说白了，如果一个国家的教育系统到了2024年还要把“别再传真、别再盖章”写成数字化改革目标，那它的问题显然不是某个软件没装好那么简单了。

更尴尬的是，日本自己其实也不是没意识到问题。

无论是成立数字厅，还是高调对软盘、传真“宣战”，都说明日本政府很清楚自己在数字化这件事上慢了半拍。

可问题在于，知道归知道，改起来却总像在沼泽地里跑步：

一边是官僚系统的惯性，一边是纸质文件、印章文化、老旧流程的路径依赖，再叠上高龄化和IT人才短缺，最后就变成了一个很别扭的局面：

大家都知道该变，但谁都没办法一下子把旧时代连根拔掉。

就连日本自己的政策讨论里，也长期把数字人才不足当成结构性问题来看；经产省更早前的测算里，到2030年日本IT人才缺口最高可接近45万人。

但程序员不够，怎么办？

从官方和产业界的表态来看，他们显然也在把生成式AI当成另一条捷径：既然程序员不够，那就尽量让更多懂业务的人，直接通过自然语言下指令，把需求更快变成代码、文档和系统。

所以，Rakuten AI 3.0这件事，理应是整个2026，日本AI圈的一个里程碑式事件。

因为它更像是日本IT困境的一次浓缩展示：政府给资源，企业拿补贴，嘴上喊着“日本最强”“本土自研”，结果掀开盖子一看，底下还是DeepSeek V3。

这当然不说明日本公司不会做AI，也不说明日本没有技术实力。

但却反映了，那个曾经靠电子消费品、半导体、工业产品征服世界的日本，在今天这场由软件、数据、云和大模型主导的新技术竞赛里，已经很难再靠自己完整定义游戏规则了。

连最想证明“日本也有自己的旗舰大模型”的关键时刻，最后都得站在中国开源模型的肩膀上，这才是整件事最扎心的地方。

AI创投日报频道: 前沿科技

蓝字计划

记录智能时代的每一次浪潮!

认证作者

已在虎嗅发表 111 篇文章

本内容来源于网络原文链接，观点仅代表作者本人，不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com，我们将及时核实并处理。

正在改变与想要改变世界的人，都在虎嗅APP