“日本最强AI”光速塌房,都怪中国DeepSeek太强?
2026-03-19 15:52

“日本最强AI”光速塌房,都怪中国DeepSeek太强?

本文来自微信公众号: 蓝字计划 ,作者:Hayward


连日本人自己都绷不住了。


3月17日,日本科技公司乐天高调发布了新一代AI大模型Rakuten AI 3.0,宣称是日本最大、性能最强的AI大模型。



这款模型来头不小:一方面,它背后有日本经济产业省支持的GENIAC项目站台,算是“国家队”级别的大模型;另一方面,它还拥有一个相当唬人的标签,7000亿参数。


这什么概念?


哪怕按更具体的口径来看,它的总参数规模也有671B,依然属于当前开源模型里的第一梯队,和DeepSeek V3坐一桌。


背靠日本国内最大靠山,参数又非常突出,对于这款模型的发布,乐天底气十足,连“(日本)国产模型的逆袭”都喊出来了。


但是,日本网友还没来得及为Rakuten AI 3.0开香槟,一场来自开源社区的技术打假就给他们浇了一盆冷水。


这款号称“日本最强、性能最强”的大模型,竟然是咱们中国开源大模型,DeepSeek-V3的日语“套壳版”。


日本的荣光,却出身不良


和绝大多数的打假“后知后觉”不同,Rakuten AI 3.0的吹牛行为甚至挺不过一个下午。


就在模型出来的几个小时里,开源社区的大神们就发现,这款加上了非常多牛逼限定词的AI大模型,有猫腻。


甚至乐天都没有过多的“掩饰”,因为Rakuten AI 3.0赫然在Hugging Face上的config.json文件里写着:


model_type:deepseek_v3


architectures:DeepseekV3ForCausalLM



这就相当于明牌告诉大家,这款模型的底层架构来自DeepSeek V3。


当然,DeepSeek V3作为一款开源模型,被学习、借鉴、使用来作为模型架构也正常不过,毕竟这就是开源的初心;


但Rakuten AI 3.0的问题在于,在发布的时候它丝毫没有提及使用了DeepSeek V3的架构,还搬出了“自主研发”“日本最强”“日本最大”等限定词,看上去真的是由乐天从0到1,自主鼓捣出来的大模型。



这也是开源社区最不满的地方:这款模型在上传的时候,没有充分保留DeepSeek原有的归属/许可证声明;直到被社区抓包之后,才悄悄地补上了NOTICE文件。



乐天的这种做法,显然是违背了开源精神,“需要保留原许可证和归属”的要求。


在使出这一招“亡羊补牢”之后,别说路人,连日本网友都好感都败光了。对于这款模型,日本网友都评论基本都是:


“GENIAC项目花纳税人的钱,就做个DeepSeek的日语fine-tune版?”


“自称日本最大高性能,却是中国的日语版。”




那么这款模型的性能怎么样呢?


根据乐天官方陆续公布的数据,Rakuten AI 3.0的纸面成绩其实相当能打。


像Japanese MT-Bench这样的日语综合基准,它已经跑赢了GPT-4o;而在日本文化理解、敬语表达、商务邮件、报告写作、文档分析这些更偏本土语境的任务里,表现也明显很强。



再加上它虽然总参数接近7000亿,但因为用了MoE稀疏架构,单次推理实际激活的参数并不高,成本还能被压到相当前沿闭源模型的10%左右。



也就是说,这模型不只是“成绩好看”,而且用起来还非常省钱。


但熟悉大模型的人一眼就看出了:这些不都是DeepSeek本来的优势吗?


是的,毕竟是一款基于DeepSeek-V3架构、再做日语数据微调和本土化优化的大模型,Rakuten AI 3.0的表现越是厉害,就越是能证明DeepSeek厉害,这也是X上相当一部分日本网友破防的点:


“日本政府用了纳税人的钱来支持你们,你们却用来证明中国的DeepSeek牛逼?”


估计梁文锋看到这出戏,做梦都得笑醒。


司空见惯的“抄袭”


但是,日本的网友们可能也有点“失忆症”了,毕竟从日本AI大模型的发展历程来看,抄袭,或者优雅点说:“套壳”,不是常态吗?


Rakuten AI 3.0可不是第一个使用了别家大模型架构作为基座的日本模型。


一个典型例子,是日本AI公司ABEJA在2025年4月左右推出的小型日语专精推理模型:ABEJA QwQ 32b。



光看这个名字,其实就已经名牌了。


毕竟连QwQ这个阿里千问系最标志性的前缀,它都懒得改。


而实际情况也差不多。


这款模型的底座,本来就是Qwen2.5+QwQ-32B,ABEJA做的事情,说白了就是先拿千问模型做日语持续预训练,再把推理能力整合进去,最后补一轮日语强化和微调。


本质上,它和乐天这次的路数并没有什么不同:都是拿中国开源大模型当基座,再靠本土数据和场景去做一层“日本化”包装。


只不过,ABEJA至少没有把自己演成什么从0到1横空出世的“日本最强原创模型”。


它不但把底座和训练路径写清楚,连阿里那边都没有介意,阿里巴巴官方X账号甚至还专门转发庆祝,大意就是:ABEJA做的日语推理模型,成绩已经超过了GPT-4o。


同样是“套壳”,ABEJA当然也谈不上多原创,只不过人家至少没有一边踩着别人的底座,一边还忙着擦脚印。


除了ABEJA和乐天,不少日本公司其实也大体走的是这条路。


像Lightblue、ELYZA这些做日语模型的玩家,底下是Qwen、Llama等现成底座,有的也会结合DeepSeek、Mistral这类强模型能力做本土化,上面再糊一层更懂日本企业文档、客服语料、敬语语境、制造业日志的数据,把它调成一个“更会说日本话、更会干日本活”的版本。


日经新闻网之前曾报道过,“「AIモデルスコア」で日本企業が開発した上位10モデルのうち、新興ABEJA(アベジャ)のモデルなど計6種がディープシークやQwenを基盤に開発されていた。”


翻译过来,就是现在日本公司推出的前10大模型里,有6个都是基于DeepSeek或Qwen进行二次开发。


其实,这在AI圈本来也不算是什么原则性问题,全球AI行业现在本来就是这么玩的。


美国也好,欧洲也好,中国也好,别说二三线团队了,很多一线团队其实也在走这条路:拿Qwen做推理增强,拿DeepSeek做蒸馏和本地部署,拿Llama做行业版,拿Mistral做轻量化和边缘场景。


毕竟,从头训练一个前沿基座,烧掉的是天文数字级别的算力、资金和人才;但如果你已经有了一个足够强的开源底座,真正决定你能不能跑出来的,反而是后面的数据、场景和落地能力。


所以,乐天这次的“炎上”,本质不是因为“抄袭”而触犯天条,而是干得太不体面了。


一边吃着开源模型的红利,一边又拼命把自己往“自主研发”“日本最强”“日本最大”上靠;一边站在DeepSeek的肩膀上,一边又不愿把这件事说透,甚至连许可证和归属都都悄悄藏起来。


别人套壳,至少套得坦坦荡荡;乐天套壳,却偏偏还想演成“全靠自己”。


又或许,乐天这次“不体面”的背后,折射出的,只是整个日本科技领域已经落后于世界的冰山一角。


日本IT业,失落的30年


1990年,随着经济泡沫被刺破,整个日本都仿佛被按下了暂停键。


股价暴跌、地价跳水、不良债权爆发、银行惜贷、企业连锁倒闭……整个日本经济像多米诺骨牌一样接连崩塌,正式跌入“平成不况”,并由此开启了失落的10年、20年,乃至30年。


而在这样的背景下,日本IT行业的轨迹,也几乎成了这场长期停滞的缩影。


关于日本的“笑话”大家已经看到非常多了:


都2024年了,日本政府居然还在和软盘“决战到天明”。


直到去年6月,日本数字厅才终于废掉了1034条还要求用软盘等介质提交材料的规定,只剩下一条和汽车回收有关的规定没处理完。


在AI、大模型、云计算都已经卷到天上的年代,日本政府居然还在认真讨论“软盘要不要退役”这种问题。


传真机也差不多。


这些年外界老拿“日本还在用传真”开涮,听上去像段子,结果很多时候还真不是段子。


日本文部科学省自己给出的“教育DX”(DX,Digital Transformation,数字转型)目标里,甚至把“原则上废止学校之间通过传真机往来和盖章”单独列成了KPI;而且这个目标之所以要专门写出来,恰恰是因为现实里它远远没有完成。



说白了,如果一个国家的教育系统到了2024年还要把“别再传真、别再盖章”写成数字化改革目标,那它的问题显然不是某个软件没装好那么简单了。


更尴尬的是,日本自己其实也不是没意识到问题。


无论是成立数字厅,还是高调对软盘、传真“宣战”,都说明日本政府很清楚自己在数字化这件事上慢了半拍。


可问题在于,知道归知道,改起来却总像在沼泽地里跑步:


一边是官僚系统的惯性,一边是纸质文件、印章文化、老旧流程的路径依赖,再叠上高龄化和IT人才短缺,最后就变成了一个很别扭的局面:


大家都知道该变,但谁都没办法一下子把旧时代连根拔掉。


就连日本自己的政策讨论里,也长期把数字人才不足当成结构性问题来看;经产省更早前的测算里,到2030年日本IT人才缺口最高可接近45万人。


但程序员不够,怎么办?


从官方和产业界的表态来看,他们显然也在把生成式AI当成另一条捷径:既然程序员不够,那就尽量让更多懂业务的人,直接通过自然语言下指令,把需求更快变成代码、文档和系统。


所以,Rakuten AI 3.0这件事,理应是整个2026,日本AI圈的一个里程碑式事件。


因为它更像是日本IT困境的一次浓缩展示:政府给资源,企业拿补贴,嘴上喊着“日本最强”“本土自研”,结果掀开盖子一看,底下还是DeepSeek V3。



这当然不说明日本公司不会做AI,也不说明日本没有技术实力。


但却反映了,那个曾经靠电子消费品、半导体、工业产品征服世界的日本,在今天这场由软件、数据、云和大模型主导的新技术竞赛里,已经很难再靠自己完整定义游戏规则了。


连最想证明“日本也有自己的旗舰大模型”的关键时刻,最后都得站在中国开源模型的肩膀上,这才是整件事最扎心的地方。

AI创投日报频道: 前沿科技
本内容来源于网络 原文链接,观点仅代表作者本人,不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com,我们将及时核实并处理。
正在改变与想要改变世界的人,都在 虎嗅APP
赞赏
关闭赞赏 开启赞赏

支持一下   修改

确定