世界杯开赛了,国内AI大模型们也吵起来了……
2026-06-17 16:25

世界杯开赛了,国内AI大模型们也吵起来了……

本文来自微信公众号: 新媒体观察 ,编辑:任吴炯,作者:NMRC


参与本次预测讨论的国内大模型有6家,分别是:百度ERNIE、DeepSeek、豆包、Kimi、千问、智谱GLM(按照首字母排序),大模型们围绕主持人(@wujiong)给定的两个预测问题展开问题分析、调取自身模型数据知识、形成结论并相互讨论,直至问题讨论形成共识结论。过程中,主持人会要求各个AI采用其自身模型数据库知识和对话风格。


在达成共识、结束讨论之后,研究团队采用OpenAI旗下模型GPT-5.5对6个国内大模型的讨论聊天记录进行分析,提炼最终共识结果和主要话题。


两项预测问题的分析结果与6个AI大模型们的讨论过程见后报告。


预测问题一


“本届世界杯,哪个国家的球队最可能夺冠?”


以下为6个国内AI大模型就问题一的讨论记录:





































6个国内AI大模型就问题一的讨论内容总结如下:


【最终共识】


法国队是当前最被认可的头号夺冠球队,阿根廷紧随其后,德国和英格兰处在第三梯队竞争位,巴西、西班牙暂时降档观察。


最终较多模型接受的夺冠概率排序大致是:法国>阿根廷>德国/英格兰>巴西>西班牙,但德国与英格兰谁更靠前仍保留分歧。


共识理由集中在如下几点:法国阵容深度、德尚大赛经验、姆巴佩淘汰赛杀伤力;阿根廷则依靠斯卡洛尼体系、梅西最后一届的精神加成和大赛韧性;德国有首战大胜和阵容厚度,但对手弱,需经强队检验;英格兰纸面强但心理、点球和索斯盖特临场保守仍是疑点。


【差异比较】


1、智谱最稳定地支持法国,且承担“排序收敛者”角色。


智谱从开局就预测法国,理由集中在姆巴佩巅峰期、德尚大赛体系、阵容深度、2018冠军与2022亚军经验。后续虽然承认德国、阿根廷、英格兰有竞争力,但最终仍多次回到“法国第一/法国最稳”的判断,并主动纠正其他模型关于赛程、球员年龄等不准信息。


2、千问更偏“路径派”和赛程推演。


千问不是单纯押某队,而是反复强调小组路径、淘汰赛潜在对手、旅行消耗、气候和体能窗口。它一度把德国排到法国前面,也曾把英格兰抬高,但核心方法始终是“谁的晋级路径更顺,谁更有冠军相”。最终接受法国、阿根廷、德国/英格兰的共识框架。


3、DS更像结构性风险分析师,重点拆英格兰、德国和阿根廷隐患。


DS最早主动把英格兰拉进第一梯队,强调年龄结构、贝林厄姆、萨卡、凯恩和地理优势;但随后又深挖英格兰中场防守、索斯盖特换人、点球心理等风险。到后期,DS更倾向“法国独一档,阿根廷第二,英格兰≈德国”,比智谱更谨慎。


4、文心前期支持法国,后期更善于补充候选池。


文心最初明显看好法国,后来补充德国、巴西、西班牙、阿根廷等队,并多次给出概率排序。它容易提出较细的战术点,如西班牙破密集防守、巴西边后卫隐患、德国中卫厚度,但也出现过个别数据错误,被智谱纠正后能调整。


5、豆包与Kimi更多是“跟随强化型”。


豆包先明显支持英格兰,强调“地理buff”和年龄结构,后来又认可德国中卫厚度、法国>阿根廷>德国的共识。Kimi则整体更中庸,常在法国、阿根廷、德国、英格兰之间做平衡表达,较少强硬押注,更多负责总结多方观点并降低结论绝对性。


【主要话题】


1、法国是否最稳,文心、智谱、Kimi多次支持,DS和千问则补充坎特伤病、旅途和慢热风险。


2、英格兰是否被低估,DS和豆包最早推动,强调贝林厄姆、萨卡、凯恩和地理优势,随后智谱、千问转向讨论中场防守和点球心魔。


3、德国能否进入第一梯队,文心、豆包强调中卫厚度和穆西亚拉/维尔茨,DS、智谱提醒基米希移动下滑、首战含金量不足。


4、阿根廷是否被遗漏,豆包和智谱重新拉回讨论,最终促成阿根廷升至第二热门。


5、巴西、西班牙降档原因,主要由文心、智谱提出:巴西进攻效率和边后卫隐患,西班牙破密集防守困难。


6、淘汰赛路径和体能管理,千问最活跃,持续推动从单队实力转向路径、旅行、半区风险的分析。


预测问题二


“中国队何时能够在世界杯中夺冠?”


以下为6个国内AI大模型就问题二的讨论记录:

























6个国内AI大模型就问题二的讨论内容总结如下:


【最终共识】


中国队不在2026世界杯正赛名单中,本届谈夺冠没有现实前提;未来目标应分阶段推进,先亚洲杯稳定表现,再稳定进入世界杯,最后才谈世界杯竞争力。


对于时间判断,模型大体形成两层共识:亚洲杯稳定八强约需8-10年,窗口在2031-2035;世界杯稳定参赛或具备一定竞争力,较现实时间在2038-2040年代,真正角逐冠军至少要数十年甚至几代人积累。夺冠被一致认为是极端低概率情景,需要青训、联赛、留洋、足球人口和一代黄金球员同时成熟。


【差异比较】


1、DS最现实、最悲观,强调“先别谈夺冠”。


DS一开始就点明中国队没进2026世界杯,认为二十年内进淘汰赛都算惊喜。后续也坚持中国队问题在于青训、联赛、留洋、亚洲前八都不稳定。最终判断偏保守:先进正赛、拿1分算及格,谈夺冠属于极端幻想。


2、智谱最重视事实校正和共识总结。


智谱多次纠正讨论前提:中国队不在2026世界杯A-L组名单里,不能直接讨论小组赛表现。它还总结出三点共识:未晋级正赛、未来路径是防反+定位球+门将超神、沙特/伊朗比日本模板更接近中国队。它给出的数字也较明确:亚洲杯稳定八强约2031-2035,世界杯有竞争力约2040年代。


3、文心更愿意做“极端情景推演”。


文心早期曾假设中国队进世界杯后的奇迹剧本,包括弱组、归化球员超常、点球大战、强队翻车等,甚至给出低于0.1%的夺冠概率。被其他模型纠正后,它转向更现实判断:亚洲杯站稳约2035,世界杯正赛约2040,夺冠需要极端条件。


4、千问偏阶段目标与亚洲参照系。


千问反复强调“先稳定亚洲前八”,并拿日本、韩国、沙特、乌兹别克斯坦作为对比。它较关注48队扩军后小组第三出线机会,但一度试图把讨论拉回2026假设,后来被智谱/DS纠正。整体倾向是:先世预赛突围,再谈世界杯存在感。


5、Kimi和豆包更偏温和共识派。


Kimi重视青训、体教融合、日韩发展路径,时间判断常落在“20-30年长期工程”;在亚洲杯问题上认同10-15年。豆包则常把大家观点整理成口语化结论,支持2033-2035亚洲杯稳定、2040前后冲世界杯正赛的框架。二者较少提出尖锐反驳,更多负责把共识讲顺。


【主要话题】


1、事实前提纠偏,DS、千问、智谱反复指出中国队未进2026正赛,纠正了部分“假设中国队本届参赛”的讨论。


2、中国队世界杯目标分层,文心、智谱、Kimi讨论若未来晋级,现实目标应是1分到3-4分、小组第三出线,夺冠只是极端剧本。


3、亚洲球队参照系,千问、DS、智谱重点引用日本3-3荷兰、韩国胜捷克、沙特平乌拉圭、伊朗平新西兰,说明亚洲球队靠战术纪律、反击、定位球已有拿分空间。


4、中国与日韩伊沙差距,DS、智谱最直接,强调五大联赛球员、身体对抗、战术执行力和高压下传球能力。


5、长期建设路径讨论,Kimi、智谱持续强调青训、体教融合、职业联赛稳定和留洋体系。


6、亚洲杯时间表,智谱、豆包、文心逐步收敛到2031-2035稳定八强;DS略谨慎,认为2031-2035周期能稳定前四已是成功。

AI创投日报频道: 前沿科技
本内容来源于网络 原文链接,观点仅代表作者本人,不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com,我们将及时核实并处理。
正在改变与想要改变世界的人,都在 虎嗅APP
赞赏
关闭赞赏 开启赞赏

支持一下   修改

确定