一款AI指导工具能帮助同行评审者提供更具体、建设性的反馈,减少模糊或攻击性语言,但尚未证明能显著提升论文质量或评审结果。 ## AI工具优化评审意见的具体性 1. 斯坦福团队开发的AI智能体基于5个大语言模型,可检测模糊、不专业或错误的评审意见(如"缺乏创新性"等笼统评价),并提供优化建议。 2. 在2025年国际表征学习大会测试中,24%的评审者采纳AI建议修改意见,修改后意见平均增加80个单词,68%被人类专家评为更优。 ## 对学术交流参与度的影响 1. 使用AI优化意见的论文作者和评审者的辩驳内容篇幅显著增加,研究者认为这体现参与度提升。 2. 但西北大学学者质疑篇幅与质量的正相关性,指出大语言模型易生成冗长内容,可能增加双方工作量。 ## 工具的实际效果局限 1. AI反馈未改变论文评分或会议接收率(保持30%),说明其未引入偏见,但也未直接提升论文质量。 2. 研究者指出需长期观察AI是否最终提升科研质量,如减少劣质研究通过或优质研究被拒的情况。 ## 未来自动化评审的伦理考量 1. 学者预测全自动同行评审系统将出现,呼吁提前研究其伦理影响(如误差控制)。 2. 关键问题在于系统能否平衡"减少劣质研究通过"和"避免优质研究被埋没"(原文引用Schintler观点)。
让AI看看,这评审意见礼貌吗?
2026-04-28 12:49

让AI看看,这评审意见礼貌吗?

本文来自微信公众号: 自然系列 ,作者:Nature Portfolio


一款新研发的AI指导工具可提供反馈,让同行评审意见更有用具体。


一项新研究[1]表明,一款AI指导工具能帮助同行评审者给出更具建设性、更少攻击性的反馈意见。但该工具是否能提升研究论文的质量,仍有待观察。


开展同行评审工作的科研人员正越来越多地借助AI完成各类工作,包括检索相关文献、润色文字等。


斯坦福大学计算机科学家James Zou和同事着手研究大语言模型(LLM)是否能解决同行评审中一个普遍存在的问题:评审反馈往往不够详尽,或语气失当。例如,在2023年于加拿大多伦多举办的计算语言学协会年会上,会议论文作者认为12.9%的评审意见质量不佳。


Zou表示,这主要是由于评审意见表述模糊,给出一些“缺乏创新性”之类笼统、简单的评价。他还指出,评审意见偶尔也存在不够专业甚至包含人身攻击的情况,比如出现“这些作者根本不知道自己在说啥”这类评论。还有些评审意见存在事实错误,例如指责论文遗漏某项分析,而实际上该分析在论文中已有呈现。


语气检测


Zou和同事收集了十几条表述模糊、不够专业或存在错误的评审意见,也整理出了他们认为针对这些问题评审意见的恰当反馈方式。他们将这些整理后的数据集输入大语言模型,优化其反馈效果,并基于此研发出一款评审反馈智能体。该智能体由五个大语言模型协同运作,互相校验工作成果。


在2025年国际表征学习大会于新加坡举办前夕,研究团队实测了这个AI工具。这一重要AI领域会议在过去几年中,每年收到的投稿量均超过1万篇。每篇论文会由3至4名评审人员评审,接收率约为30%。


研究团队随机选取了约2万份已完成的评审意见,借助评审反馈智能体进行评估,并将该反馈结果发送给对应的评审者。大多数情况下,这款AI系统会为评审者提供优化方向,让评审意见更具体、更具建设性,常用“为让本反馈更可行……”这类表述。


约24%评审者在收到AI反馈后修改了评审意见,因变得更具体,修改后的评审意见平均增加80个单词。一组人类专家评估了部分修改后的评审意见,判定其中68%优于原版。评审意见经AI工具优化的论文作者,其撰写的辩驳意见篇幅更长;而评审者针对这些反驳意见给出的回复,篇幅也同样更长。Zou认为,这类篇幅的增加,体现出评审过程中相关人员的参与度有所提升。


篇幅增加


美国西北大学的Mohammad Hosseini对此有些异议,他主要研究AI工具应用的伦理问题,未参与该研究。他表示,篇幅并不能很好地体现参与度,大语言模型生成的内容往往篇幅冗长,“这并不一定意味着质量提升”。而交流篇幅的增加,也可能增加评审者和论文作者的工作量负担。


这些AI反馈并未对评审者给出的论文评分产生显著影响,也未明显改变会议的论文接收率。Zou认为,这是一件好事,因为这意味着该AI指导工具并未对评审者产生偏见引导,只是帮助他们撰写清晰的评审意见。但这也说明,没什么证据表明该反馈工具能通过论文修改环节大幅提升论文质量。Zou表示,研究AI介入的反馈是否能从长远角度提升科研人员的研究工作质量,是一个值得探索的方向。


美国乔治梅森大学计算社会科学家Laurie Schintler说,“归根结底,我们需要评估这类系统对同行评审误差的影响:它能否减少劣质研究的通过数量,或是减少优质研究的未发表情况?我相信很快就会有全自动的同行评审系统,我们需要为此做好准备。当下,我们必须主动开展这类重要研究。”


参考文献:


  1. Thakkar,N.et al.Nature Mach.Intell.https://doi.org/10.1038/s42256-026-01188-x(2026).


原文以This AI can improve your peer review—and make it more polite标题发表在2026年2月23日《自然》的新闻版块上


©nature


Doi:10.1038/d41586-026-00536-6

AI原生产品日报频道: 前沿科技
本内容来源于网络 原文链接,观点仅代表作者本人,不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com,我们将及时核实并处理。
正在改变与想要改变世界的人,都在 虎嗅APP
赞赏
关闭赞赏 开启赞赏

支持一下   修改

确定