本文分析AI介入同行评议的背景与风险，主张将AI定位为辅助工具，推动其在该制度中审慎可控应用。 ## 1. 同行评议的核心定位与内在张力同行评议是现代科学体系的核心制度，兼具制度意义与学术价值双重属性：制度层面，它将科学判断转化为程序化决策，分散决策责任、维护科学公信力，是连接科学自主性与社会监督的关键接口，具备历史可塑性；学术层面，它可提升研究质量、传递学术规范、凝聚共同体共识。二者存在天然张力：过度强调制度的标准化会挤压创新研究空间，过度突出个体判断则会削弱治理稳定性，决定了新技术介入不可能是中性优化。 ## 2. AI介入同行评议的背景与核心优势当前传统同行评议面临严重治理困境：科学出版物年增4.1%，每17.3年翻一番；2023年全球SCI、EI论文较2019年分别增长10.99%、46.41%，中国占比分别达29.8%、41%，人工评审负荷过载，普遍存在周期长、优质审稿人短缺、质量把关失效等问题，制度负荷累积削弱了其稳定性与可信度。 AI的优势集中在程序性优化：可几分钟完成初筛、技术核查，快速识别低质量研究；能将审稿人推荐时间缩短73%，精准匹配研究相关评审专家、预测审稿表现；超过65%的研究人员认为AI可指出人类评审遗漏的问题，还能校准评分、识别偏见，提升评审公正性。AI的正当性在于缓解制度结构性失衡，而非替代人类学术判断。 ## 3. AI介入同行评议的潜在制度风险 AI介入存在四类核心风险：一是过度依赖AI会引发“形式合规化”倾向，AI对创新性、理论贡献判断能力不足，可能将学术评价简化为技术检查，抑制创新，还会诱导作者迎合算法偏好写作。二是AI训练依赖既有数据，会系统性放大传统评审的既有偏见，对非主流研究、欠发达地区研究者形成隐性门槛。三是责任结构转向人机协同后，责任边界模糊，且AI决策存在黑箱特征，可解释性不足，会削弱同行评议问责机制，降低制度公信力。四是技术效率逻辑的扩张，可能引发生物伦理、数据安全与隐私风险，破坏作者、评审者与出版商的信任关系。 ## 4. AI介入同行评议的发展方向同行评议始终随科研环境动态调整，AI介入是应对传统制度承载力不足的必然选择，在初筛分流、形式审查等环节已展现出缓解人力瓶颈的价值。 AI介入的核心挑战不是算法成熟度，而是学术共同体对技术的制度约束能力，将AI定位为约束性辅助工具，推动同行评议从“个人判断依赖型”转向“人机协同型”，才符合该制度的历史逻辑与价值取向。

2026-06-05 16:44

AI介入同行评议：制度风险还是效率革命？

科技导报©

本文来自微信公众号：科技导报，作者：汤宏波、吕新华等

同行评议长期被视为现代科学体系中最重要的“质量控制器”和“资源分配器”，但在科研产出急剧膨胀的背景下，这一制度是否仍然具备支撑科学共同体有效运转的能力？当人力评审资源日益稀缺、评审负担持续加重，人工智能是否可能成为重塑同行评议的新型制度工具，抑或只是以技术逻辑重塑学术判断的边界与权力结构？

1同行评议制度意义与学术价值

同行评议制度于19世纪初由英国皇家学会建立，并在第二次世界大战后的几十年里逐步普及全球。1982年中国引入同行评议制度，应用于科研资源分配、人才培养等。如今，同行评议的方式有单盲、双盲、开放评审和协作评审等，被视为现代科学体系的核心制度。

有关同行评议学术意义的研究颇多，但常常忽视其社会制度功能。同行评议承担着社会治理功能，其运作方式及其被赋予的功能处于不断演变中。区分其“制度意义”与“学术价值”，不仅有助于澄清同行评议在科学体系中的多重角色，也为评估人工智能等新技术介入该机制的合理性与边界提供必要的理论基础。

1.1同行评议的制度意义

从历史维度看，早期科学出版更多依赖编辑或学术团体的裁决，随着科研活动规模不断扩大、学科分化日益加深，以及科研活动与国家治理和公共利益之间联系的强化，个人判断已难以承担科学评价的公共责任。在此背景下，以“同行专业判断”为核心的“同行评议”集体决策机制诞生。因此，同行评议最初目的并非严格的质量控制，而是服务于科学公共形象的塑造。如今，已经演变为连接科学自主性与社会监督之间的关键制度接口。其功能重心也在“公共传播”“学术守门”和“资源分配”之间持续调整。由此可见，同行评议具有显著的历史可塑性，其运行逻辑始终随着科学实践和社会环境的变化而被重构。

在现代科研体系中，同行评议的制度意义主要体现在：（1）通过引入多名领域专家的独立评估，同行评议将科学判断从个人权威转化为程序化决策，从而增强学术决策在组织内部和社会公众层面的可接受性；（2）在论文发表、经费分配和学术晋升等高风险决策中，评审程序的存在有助于分散决策责任，降低系统性失误对科学公信力造成的冲击。

1.2同行评议的学术价值

同行评议过程中，研究成果的科学性、严谨性和表达质量得以实质性提升，从而实现对知识生产过程的直接影响，推动学术创新。

同行评议的学术价值在于：（1）在知识层面承担着质量改进机制的功能；（2）特定学科的数据处理、论证方式和学术伦理等标准，在被评审过程，学术规范得以传递，学术共同体内部的认知和方法逐步达成共识。

1.3同行评议的制度意义与学术价值之间的张力

同行评议的制度意义与学术价值并非总是自然一致。为满足制度效率、资源分配和风险控制等需求，同行评议可能被高度标准化和程序化，从而压缩其对创新性和探索性研究的包容空间。如果过度强调学术自由与个体判断，又会削弱评审机制在治理层面的稳定性和公信力。正是这一制度意义与学术价值之间的张力，使得任何新技术的介入都不可能是“中性的技术优化”。

2AI介入同行评议的背景、优势、正当性与边界

传统上，同行评议基于“同行”这一概念，即评审者不仅具备相关领域的专业知识，还属于特定的学术社群。显然，AI不满足传统“同行”角色要求。但是，AI介入同行评议的正当性，关键不在于其是否满足“同行”属性或者能够作出“更好的学术判断”，而在于是否有助于缓解现有同行评议制度在科研治理层面的结构性失衡。

2.1同行评议治理的现实困境

传统同行评议的核心假设是：有限科研产出+足够评审资源+可接受时间成本。然而，随着科研人员的增加，以及“publish or perish”竞争压力加剧，学术评审负荷急剧上升。研究表明，科学出版物的年增长率约为4.1%，每17.3年出版量翻一番。2023年，全球SCI论文和EI论文的数量较2019年分别增长了10.99%和46.41%，其中中国2023年产出的SCI论文和EI论文分别占全球总量的29.8%和41.0%。投稿数量的持续增长、研究议题的高度专业化以及跨学科研究的普遍化，使传统以人工为核心的同行评议机制在效率和可持续性方面承受巨大压力，导致一些质量低劣、充满错误的论文发表于学术期刊上，评审周期延长、优质审稿人短缺以及编辑决策高度依赖少数专家判断的现象较为普遍。

同行评议被同时赋予学术守门、资源分配和公共问责等多重制度期待，这种制度负荷的持续累积，削弱了传统同行评议作为科研治理工具的稳定性与可信度。一些专家认为，传统同行评议制度代价高、效率低、不可靠，需要改革。另外，围绕偏见、客观性以及如何评估研究成果的可靠性与重要性方面重塑同行评议的声音也一直存在。在此背景下，AI介入同行评议并非对现有制度的颠覆，而是对其治理能力不足的一种技术性回应。

2.2传统同行评议的劣势与AI介入同行评议的优势

传统同行评议的劣势多样。一项针对国内作者的调查显示，我国期刊同行评议的主要问题包括周期长、过程不透明、意见不具体以及审稿人剽窃作者观点和成果等。评审者往往过分关注论文的技术完美性，而忽视其学科创新性和基础性贡献，评审过程缺乏透明度和问责性，且评审意见常常流于表面，缺乏深度见解。Aczel等认为，2020年全球审稿人总计花费超过1亿小时用于期刊论文的评审，美国、中国和英国审稿人所花费时间的货币价值分别估计为15亿美元、6亿美元和4亿美元。另外，许多评审者普遍感到，自己的付出未得到足够的认可和激励，这导致越来越多的评审者不愿投入时间进行评审，从而使得编辑寻找合格的评审者变得更加困难。

相较于人类评审，AI通过自动化能够在几分钟内完成初步筛选、技术合规性检查和方法论一致性验证，从而快速评估论文是否符合期刊定位或具备基本质量要求。低质量或有争议的研究可以被AI快速识别。AI在执行统计分析核对、参考文献准确性检查和格式要求验证等技术核查任务上表现出色。

传统同行评议专家的选择依赖编辑的主观判断，效率较低，而AI能够分析投稿内容并结合潜在审稿人的论文发表记录，识别出研究兴趣高度相关的专家，从而提高审稿质量和匹配度。AI还能将审稿人推荐时间缩短73%，有效减轻编辑负担。AI也能通过历史数据（如审稿质量、审稿及时性和引用影响力）预测审稿人的未来表现，帮助编辑构建既专业又可靠的审稿队伍，这有助于提高审稿效率、提升审稿质量，同时减少审稿延迟。另外，AI能够拓展非英语母语者参与审稿，识别更多适合审稿人。

AI可以辅助人类提升评审意见的质量和评审效率，AI能够识别论文方法上的缺陷并评估论文的科学贡献。超过65%的研究人员认为AI能够指出人类评审中可能遗漏的问题。Verma等开发的ReviVal通过提供一种自动化的、数据驱动的方法来评估同行评审意见的全面性和准确性。AI或许还可被用于对评审意见进行偏见信号识别，对不同评审者的评分尺度进行校准，有助于提升评审结果的可重复性、透明度与程序公正性。

值得注意的是，以上人工智能的3个优势主要体现为程序性与流程层面的优化，而并不等同于对学术价值判断本身的替代。

2.3AI介入同行评议的正当性与边界

传统同行评议中，不同评审者对相同稿件作出截然相反评价的现象并不罕见，这种差异虽在学术层面具有一定合理性，但在制度层面却可能削弱评审结果的可解释性和可接受性。AI介入同行评议的正当性，并不基于其是否“优于人类评审”，而源于其在缓解制度负荷、增强评审程序一致性等方面的辅助功能。

AI在学术评价领域应用的目标是缓解当前资源压力，其作用应限定为辅助性与程序性工具。所扮演的角色，不是“裁判者”，而是“辅助者”，其合理性正根植于同行评议长期以来所暴露出的结构性问题。

3AI介入同行评议的潜在风险与制度张力

一项针对近5000名研究人员的调查发现，大约19%的人正在使用AI“提高评审速度和简便性”。因此，有关AI介入同行评议的风险，科学共同体必须尽快达成共识。

3.1学术判断弱化与“形式合规化”倾向

AI擅长识别形式特征、结构规范，但是对研究创新性、理论贡献和问题重要性的判断能力有限，在建设性和事实性方面仍不如人工撰写的评论，尤其是在微观层面的质量判断上表现较差。如果评审流程过度依赖AI的程序性筛选，学术评价可能简化为“技术合规检查”。同行评议目标将从评价知识贡献，转向筛选是否符合系列既定“特征”。这不仅可能抑制高风险、高不确定性的创新研究，也可能促使作者“迎合算法”，围绕AI偏好的文本结构和方法模式进行写作。学术评价是否会被重构为一种可计算、可审计的技术流程？

3.2“算法”强化既存偏见的风险

AI系统在训练过程中高度依赖既有文献资料和出版记录，其判断逻辑将强化传统评审数据的偏见。这种风险并非简单的“算法歧视”，而是通过自动化流程系统性地放大。例如，对高影响因子期刊写作风格的偏好、对主流研究方法和成熟理论路径的倾向，可能在AI的初筛与推荐阶段形成隐性门槛，进一步压缩非主流研究、新兴议题和来自学术资源相对匮乏地区研究者的发展空间。

3.3责任模糊及可解释性不足

传统模式下，编辑和评审专家对评审决策负有明确的职业与道德责任。Mollaki指出，AI在同行评议中的使用缺乏规范。AI的介入促使同行评议责任结构从“个人判断依赖型”向“人机协同型”转变，如果低质量论文被发表，责任应由编辑、评审人还是算法系统承担？在缺乏明确责任框架的情况下，AI的介入可能削弱同行评议的问责机制，使制度风险从“可定位的个人责任”转向“难以界定的系统责任”，从而影响科研治理的整体可信度。

另外，AI的决策逻辑上具有明显的“黑箱”特征，学术评审相关人难以理解其依据。这种不可解释性在制度层面削弱了评审决定的合理性，进而引发对评审公正性的质疑。

3.4技术效率逻辑与学术伦理之间的张力

AI辅助学术生产虽然能够提高知识生产效率和质量，助力学术评价决策，但也带来了学术伦理、数据安全和隐私保护等方面的潜在风险。这些风险可能从根本上破坏作者、评审者和出版商之间的关系。

总之，算法偏见、可解释性不足、学术判断弱化、责任模糊及效率逻辑的扩张，构成了AI应用过程中需要持续警惕的风险。因此，对AI的理性态度不应是简单的技术乐观主义或技术排斥，而应通过明确功能边界、强化治理框架。把AI作为辅助工具而非直接替代人类评审者，推动其在同行评议制度中的审慎、有限和可控应用。

4 AI介入传统同行评议的启示

从制度演化的视角看，同行评议从来不是一种静态不变的学术规范，而是在不同历史阶段不断调整其功能重心的治理机制，其功能重心经历了“公共传播”“学术守门人”和“资源分配”的转移，其内在逻辑始终随着科学实践与社会需求的变化而被重塑。

当代科研环境的显著特征——成果数量激增、学科高度分化，以及学术不端风险上升——正在持续放大传统同行评议制度的运行压力，并暴露出其在现有规模条件下的制度张力。在这一背景下，人工智能被引入同行评议，并非偶然的技术选择，而更像是一种针对既有制度承载能力不足的现实回应。现有实践表明，在初筛分流、形式审查、风险预警，以及辅助评审意见与编辑决策等环节，AI确实展现出缓解人力瓶颈和提升流程效率的潜在能力。

但与此同时，AI介入同行评议也同步引入了一系列不可回避的制度风险，包括算法偏见的累积、决策过程的不可解释性、学术判断的程序化倾向、责任边界的模糊，以及效率逻辑对学术伦理空间的挤压。这些问题并不完全源于技术尚未成熟，而更深层地反映了技术效率逻辑与学术评价制度逻辑之间的结构性张力。

因此，AI介入同行评议的核心挑战，并不在于算法是否足够先进，而在于学术共同体是否具备对技术介入进行制度性约束与反思的能力。如果AI被当作评审决策的直接替代者，可能动摇同行评议作为学术审判机制的制度根基。相较之下，将AI定位为一种受约束的辅助工具，用以支持而非取代人类的专业判断，使同行评议逐步由“个人判断依赖型”转向“人机协同型”，或许更符合这一制度自身的历史逻辑与价值取向。

AI创投日报频道: 前沿科技

本内容来源于网络原文链接，观点仅代表作者本人，不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com，我们将及时核实并处理。

正在改变与想要改变世界的人，都在虎嗅APP

赞赏

支持一下修改

确定