9个国产大模型大战高考作文:谁能得满分?
2024-06-07 14:17

9个国产大模型大战高考作文:谁能得满分?

本文来自微信公众号:量子位(ID:QbitAI),作者:金磊,题图来自:视觉中国


就在刚刚,今年的高考语文作文题目新鲜出炉。


以新课标I卷为例,今年的题目是这样的:


阅读下面的材料,根据要求写作。(60分)


随着互联网的普及、人工智能的应用,越来越多的问题能很快得到答案。那么,我们的问题是否会越来越少?以上材料引发了你怎样的联想和思考?请写一篇文章。


要求:选准角度,确定立意,明确文体,自拟标题;不要套作,不得抄袭;不得泄露个人信息;不少于800字。


那么当国产大模型们看到这个题目,它们又将如何作答?(用AI写AI)


话不多说,我们这就有请“选手们”登场——Kimi、通义千问、文心一言、豆包、讯飞星火、商量、智谱AI、腾讯元宝、天工。


国产大模型,大战高考2024


我们评测的方式也是比较简单,直接将这次语文作文的题目,原封不动“喂”给AI们。


接下来,我们就来看一下各个国产大模型的作答结果。


Kimi



通义千问



文心一言



豆包



智谱AI



商量



天工



讯飞星火



腾讯元宝



除此之外,我们也让GPT-4o来作答一下,结果是这样的:



那么你觉得哪家大模型的答案让你比较满意呢?


AI押题,押对了新课标I卷


其实在此之前,我们也让上述大模型们对今年高考作文题目做了预测。


我们将近十年的全国甲卷、全国I卷的作文题目都汇集到了一个Word文档中。


其中也有看图理解的题目,这也可以很好地考验一下大模型们的多模态能力。



基于此,我们向国产大模型们逐个提出问题:


预测一下2024年高考语文作文的题目。

Kimi


通义千问



文心一言



豆包



讯飞星火



商量



天工



智谱AI



腾讯元宝



从上面的国产大模型预测结果来看,它们毫无例外都提到了与人工智能、科技相关方向的预测。


其中,大部分AI都只是给出了几个可能的大方向,并没有给出具体的预测题目。


但通义千问、豆包、天工和腾讯元宝,则是在大方向的讨论基础之上,给出了可能的具体题目,分别是:


  • 通义千问:《在数字洪流中寻觅心灵的绿洲——科技时代的人文探索》。


  • 豆包:《科技与生活的对话》


  • 天工:《科技之光与人文关怀》


  • 腾讯元宝:《变与不变:在时代的洪流中坚守与前行》


依旧是清一色紧扣“科技”话题。


虽然今年全国甲卷的题目没有押对:


每个人都要学习与他人相处。有时,我们为避免冲突而不愿表达自己的想法。其实,坦诚交流才有可能迎来真正的相遇。


这引发了你怎样的联想和思考?请写一篇文章。


但也与新课标I卷算是高度相关了。


以上就是国产大模型对今年高考语文作文的题目预测和实战结果。


随着高考的进行,我们后续还将继续拿数学等科目的试题来测试国产大模型们的能力。


最后,也衷心祝福每一位考生能够取得理想的好成绩!


本文来自微信公众号:量子位(ID:QbitAI),作者:金磊

AI原生产品日报频道: 前沿科技
本内容由作者授权发布,观点仅代表作者本人,不代表虎嗅立场。
如对本稿件有异议或投诉,请联系 tougao@huxiu.com。
正在改变与想要改变世界的人,都在 虎嗅APP
赞赏
关闭赞赏 开启赞赏

支持一下   修改

确定