综述:同行评议:历史演变与审稿人的学习

《Insights into Imaging》:Peer review: historical evolution and reviewers’ learning

【字体: 时间:2026年05月22日 来源:Insights into Imaging 4.5

编辑推荐:

  同行评议是长期历史演变的产物。从古希腊哲学的苏格拉底助产术隐喻,到笛卡尔的系统怀疑与分析重构方法,从17世纪科学学会的非正式编辑判断,到20世纪的制度化体系,“对表面确定性的检验”逐步发展为学界熟知的同行评议。它是科学增长与专业化背景下产生的务实回应,植根于持

  
同行评议是长期历史演变的产物。从古希腊哲学的苏格拉底助产术隐喻,到笛卡尔的系统怀疑与分析重构方法,从17世纪科学学会的非正式编辑判断,到20世纪的制度化体系,“对表面确定性的检验”逐步发展为学界熟知的同行评议。它是科学增长与专业化背景下产生的务实回应,植根于持久的认识论传统,1665年始于欧洲的《Journal des s?avans》与《Philosophical Transactions》。通过这一过程,作者被要求论证主张、揭示潜在假设,并将假说转化为可辩护的知识。在放射学领域——尤其是定量成像、人工智能与生物标志物开发时代——同行评议同时发挥教育工具作用,能够提升研究者识别方法学缺陷、潜在偏倚,以及区分探索性与验证性研究的能力。尽管存在审稿人疲劳、保守性等局限,同行评议仍塑造着科学推理,使审稿人得以从作者与其他审稿人处习得科学与临床实践知识。正如两千多年前塞涅卡(Lucius Annaeus Seneca)所言:“Homines etiam cum alios aliquid docent, aliquid discunt”——即便人类在教导他人时,自身亦有所习得。
同行评议拥有漫长的历史渊源。现代科研文化已将科技期刊同行评议深度嵌入日常运作,使其常被视为理所当然的制度,实则它是一种相对晚近的“社会技术”,其演变折射出关于权威性、信任与知识组织的观念变迁。
从希腊哲学到笛卡尔方法论
当前对科学同行评议的描述多集中于程序层面,如报告清单与统计阈值,但其底层认识论基础较少被讨论。苏格拉底助产术(maieutics)为理解同行评议提供了有用的概念框架:它通过结构化提问引出知识,而非简单传递信息,结合勒内·笛卡尔提出的理性主义科学方法原则,为现代同行评议奠定了理论基础。在柏拉图的《泰阿泰德篇》中,苏格拉底自比为思想的“助产士”,称自己不传授教义,而是通过提问帮助他人发展、完善知识。这种μαιευτικ?(助产术)不仅是修辞,更包含对表面确定性的系统检验,以识别隐藏假设、揭示不一致性并改进薄弱或无依据的主张。苏格拉底强调自己并不掌握真理,而是通过与他人的对话与推理协作趋近真理。在《申辩篇》中,他将这种实践视为道德义务,认为未经批判检验的信念不应被接受。助产术并非破坏性怀疑,而是基于?λ?γχο?(反驳)的建构性模式,旨在提升知识质量。通过要求定义术语、证成推论与回应反例,苏格拉底对话预示了现代方法学推理的核心要素,远早于现代科学哲学的出现。在这一框架下,主张的有效性不取决于发言者的权威,而取决于其能否经受系统化质疑,并获得连贯论证与证据的支持。现代同行评议在非人格化、匿名化的环境中复现了这种助产逻辑:审稿人不强加自身理论,而是通过标准化问题审问稿件——研究主张是什么、方法背后有哪些假设、数据是否充分支持结论。这些步骤相当于当代的苏格拉底式追问,脆弱假说在审视下暴露,更强健的假说则以更高精度被重构。因此,最有价值的同行评议不止于错误检测,更能激发作者的认知努力,促使其意识到隐藏假设、未被识别的混杂因素、循环推理与过度解读,从而强化科学论证。评议过程可被视为一个助产空间,科学主张在此不是被被动接受,而是被主动发展为可辩护的知识。勒内·笛卡尔在《谈谈方法》(1637)中为科学革命提供了最具影响力的方**。他的四项原则——仅接受显见之物、将问题分解为部分、由简入繁、进行全面核查——常被视作现代科学的语法。这些原则与苏格拉底辩证法高度契合,均包含信念悬置(?πορ?α)、将模糊概念拆解为可分析要素,以及通过理性推论重构的过程。苏格拉底依赖对话式质询,笛卡尔则 formalized 内省式推理,但二者均认同知识源于结构化批判而非事实积累。有效的同行评议将这两种传统整合,在苏格拉底式对话中运用笛卡尔方法。这一传统还包含伦理维度:柏拉图在《理想国》中将辩证法与灵魂治理及政治组织相联系,指出理智 rigor 与道德责任不可分割。在科学文化中,这种伦理体现为审稿人有义务进行建设性质疑,以非教条的方式提问,揭露错误而不羞辱作者。仅作否决却不提供反馈的审稿人并非践行助产术,而是在行使权威:他们是威权式的,而非有权威的。相反,助产式审稿人提供建设性洞见,创造反思与学习的条件。这在复杂模型或高维数据可能掩盖脆弱推理的领域尤为关键,此时助产式同行评议充当认知 safeguard,防止笛卡尔所警示的“precipitation”——过早接受未充分拆解或重检的结果。苏格拉底助产术与笛卡尔方法是非遗迹的认识论互补支柱,至今仍具现实意义:前者提供探究的对话伦理,后者提供程序架构,同行评议正位于二者的交汇点。当被实践为一种真正的助产事业时,它不止筛选稿件,更助产知识,将试探性猜想转化为清晰、可辩护的科学主张。因此,每一次严谨的同行评议都在重演始于雅典集市、在17世纪被理性编码的对话——提醒科学因纪律性提问而进步。数世纪后,塞涅卡进一步阐明了其中的学习机制:“即便人类在教导他人时,自身亦有所习得”。
从《Philosophical Transactions》与《Journal des s?avans》到20世纪
学术评价起源于17世纪科学学会的诞生。1665年,亨利·奥登堡任主编的英国皇家学会创办《Philosophical Transactions》,初期编辑决策是个人化、非正式的,奥登堡会咨询可信赖的同事,但无标准化评审流程,作者声誉与编辑个人判断最为关键。同年法国德尼·德·萨洛创办的《Journal des s?avans》亦采用类似做法。早期科学运行于小型认知共同体中,社会亲近性替代了形式化评价。18世纪,巴黎科学院等机构开始引入更系统的稿件评估:提交的论文由任命的rapporteurs(报告人)审阅,并撰写内部流通的报告,这标志着批判性评估的首次制度化,但流程仍不透明且主要起咨询作用,审稿人不匿名,编辑权集中于精英科学团体。19世纪,工业化、专业化与大学扩张推动科学产出爆发式增长,非正式判断已不足以支撑学术出版,期刊激增、学科分化,编辑越来越依赖外部专家评判专业工作,《柳叶刀》与《自然》等期刊在19世纪末已采用可辨识的外部审稿形式,但仍无现代意义上的匿名制或标准化标准。20世纪,同行评议巩固为现代形态:二战后科学成为大规模、部分公共资助的事业,政府要求研究支出问责,期刊面临前所未有的投稿量,为管理复杂性并维护科学公信力,同行评议被正式化——按专业领域遴选审稿人、强制提交书面报告、引入单盲或双盲审稿以降低偏见与社会压力。至20世纪70年代,同行评议被广泛视为科学合法性的基石,但也开始出现对保守性、不一致性与易受偏倚影响等局限的批评。20世纪末与21世纪初进一步演化出专注统计的审稿人、报告清单、利益冲突披露,以及数字平台支持的开放同行评议与出版后评论等形式。综上,科学同行评议从17世纪编辑的个人判断演变为复杂的制度化分布式专家体系,并非源于单一哲学蓝图,而是出于管理知识增长规模与维持信任的实践需求。尽管存在缺陷,它仍是科学共同体集体判定何为可靠知识的核心机制。
当代同行评议
如今,同行评议常被框定为对期刊的服务,实则是最有力却常被低估的科学教育形式之一,审稿过程中习得的远超眼前稿件本身。对放射科医师而言,在定量成像、人工智能与生物标志物发现日益驱动领域的当下,同行评议亦是最具塑造性的科学教育活动之一,它不仅是评判科学的场域,更是学习科学如何被建构的场域。
同行评议与假说形成
通过审稿,研究者得以观察真实科学问题如何在现实约束下被提出,看到作者如何从观察到可检验假说、假设如何悄然进入模型、表述如何被打磨以应对审视。这训练研究者区分“探索性叙事”与“验证性科学”——这一罕被正式教授却至关重要的能力。审稿人会反复遇到被数据可用性、扫描仪限制或队列异质性重塑的假说,这种认知使审稿人对影像科学中假说驱动与数据驱动的差异更为敏感,进而推动更严格的预注册与探索性、验证性分析的清晰区分。预注册即预先确定检验计划、锁定终点、纳入标准、分割策略与统计模型,在预先承诺与事后发现的观察间划出清晰界限,提升结果可信度。探索是思想诞生的途径,但唯有在预设条件下被后续检验,才能证实其有效性。
同行评议与缺陷及偏倚检测
同行评议持续暴露科学最薄弱的环节:方法学。样本量不足、循环参考标准、隐藏混杂因素、未验证的影像替代指标、不恰当的统计阈值等,均会影响结果。在放射学中,这类缺陷常表现为多参数磁共振成像分析的小样本量、扫描仪特异性特征漂移、分割策略不一致、异质性采集协议的不当合并、中心间协调不足等,且常被技术复杂性所掩盖。长期审稿会使审稿人形成“失败模式”的心理库,这种模式识别对研究者具有变革性意义——能提前预判自身研究的潜在错误,最终优化研究设计。放射学研究的偏倚常隐藏于事后亚组合理化、选择性排除标准与缺乏效应量支撑的表述夸大中,有时嵌入选择过程:排除“困难”病例、事后重定义终点、将临界关联重新标记为临床有意义等。审稿经历会重塑研究者阅读文献的方式,以及撰写时的审慎与精确程度。作者常误以为论证清晰,但置于同行评议语境下往往并非如此:清晰不是文风,而是逻辑架构,需要通过阐明因果结构、明确解释假设、路径与局限性来提升。接触密集、冗长、模糊的稿件能培养识别缺失概念链、叙事跳跃,以及图表替代连贯推理的能力。
同行评议与社会动力学
通过同行评议,可观察到科学的社会投射:声誉如何影响解读、新颖性如何被优先于稳健性考量、特定模态与终点如何主导投稿、零结果与阴性验证为何难以浮现。对这些动态的觉察能培养对出版如何塑造创新的批判性视角,促使研究者倡导方法学多样性,并成为更清醒的作者与更具伦理意识的审稿人。最优质的稿件并非无瑕疵,而是“可辩护的”:稳健性不在于无批评,而在于有能力连贯回应批评,必要时给出结构化的有力反驳。严谨的作者会预先考虑质疑,纳入敏感性分析、外部验证与不确定性透明报告。随着时间推移,这种认知会重构科学写作,使研究者学会构建经得起质询的研究。
审稿过程中的学习
同行评议本质上是发展、打磨科学推理的过程,是内化科学方法的有效途径,帮助研究者在阅读时不轻易接受表面价值,而是质疑其有效性。这在人工智能快速发展的当下尤为关键,现实边界日益模糊,溯源难度不断提升。同行评议是当代实践中的苏格拉底助产术:每份稿件都是一系列问题的邀请——真正的主张是什么?该主张成立的前提是什么?什么情况会使其不成立?纪律性怀疑不是愤世嫉俗,而是科学诚信的实践体现。研究者不会因发表更多论文而成为更好的科学家,却能通过审稿变得更好——因为它教会我们将科学视为纪律性提问的过程,而非单纯的产品或产出。每一份审稿都不只是对稿件的评判,更在打磨方法学素养、暴露隐藏偏倚,并培育可辩护探究的习惯。阅读其他审稿人的报告是学术放射学中最被低估的学习机会之一,是观察其他专家思维的窗口,核心不在于赞同或反对结论,而在于学习科学分析的技艺。首先,能从他人发现而自己遗漏的问题中学习:多位审稿人审阅同一稿件时,关注点的多样性极具价值——有人聚焦采集参数,有人关注统计建模,有人侧重临床转化性。在肌肉骨骼放射学中尤为明显:物理学者审稿人可能 critique 脂肪/水分离建模,临床医师则会质疑结局相关性。阅读这些平行解读能让人意识到所有观察都透过学科透镜完成。其他审稿人的评论还能揭示深层领域知识如何被操作化:某领域专家的意见常来自经验洞察,能补充自身学习。此外,还能从其他学科的视角学习详细分析需考量的维度。遗憾的是,部分审稿仅为审查式,另一些则具变革性。阅读其他详尽、建设性的审稿报告,能打磨“挑战而不打击”的能力,学会以促成改进而非防御的方式表达关切,这并非琐碎技能——它决定了作者是会打磨科学、实现稿件实质提升,还是仅为发表而机械 compliance。不同审稿人对严谨性的定义差异显著:有人坚持外部验证,有人看重设计与目标,有人聚焦方法。并置观察这些期待能让人意识到严谨性不是抽象概念,而是不同具体要求的整合,这些标准会逐渐重塑自身的科研与临床实践。意识到自身遗漏固然重要,认识到其他审稿人未能察觉的内容同样具有启发性:偶尔关键缺陷被忽略,次要格式问题占据报告主体,这教会人谦逊——同行评议是包含审稿人、作者与编辑的集体过程,非个体审稿人的独角戏。部分审稿人偏好创新,另一些重视可重复性;有的奖赏技术新颖性,有的强调临床适用性。阅读他们的报告能让人理解科学并非受单一价值层级支配,这种多元性认知能使人成为更具反思性的作者与更公正的审稿人。最后,其他审稿人的报告揭示了科学真理的社会属性:通过评议的内容不仅客观上正确,还需可被理解、可辩护且具相关性。这不削弱科学的地位,反而让人洞察其运作方式。阅读其他审稿意见堪称科学推理的无声大师课,不仅教授如何评判稿件,更展示知识如何被集体塑造与打磨。
读者视角的同行评议
对非出版、非审稿但积极参与科学的专业群体而言,同行评议首先被视为文献的质量保障机制与信任构建机制。读者依赖同行评议在传播前过滤研究成果,确保基本方法学 rigor、解读连贯性与相关性。在放射学中,已发表证据可直接影响诊断策略、工作流程、成像方案与患者管理偏好,这一角色尤为关键。与此同时,读者也日益意识到同行评议的局限与不透明性,包括出版延迟、审稿人间差异,以及偶有未能检测出缺陷或不可重复研究的情况。因此,读者逐渐将同行评议视为持续过程的初始检查点,后续还包括出版后 critique、重复验证与现实世界临床验证。
同行评议与编辑决策
同行评议在编辑决策中发挥核心但咨询性的作用。编辑利用审稿人评估来判断方法学质量、原创性、伦理考量与临床或科学影响力。审稿人针对特定成像方法学、技术参数恰当性、统计效能(样本量是否预先估算?)、数据呈现与统计分析,以及与现行实践标准一致性的反馈,对编辑具有重要参考价值。然而,编辑决策并非审稿建议的机械反映。实证证据表明,审稿建议与录用/拒稿结果高度相关,但编辑常行使独立判断,尤其在审稿意见冲突,或稿件被认为对期刊及其学科社群具战略重要性时。编辑必须结合语境解读批评意见,区分可修复缺陷与根本局限,同时考量期刊范围与读者群。因此,同行评议为编辑决策提供信息而非决定,它在更广泛的编辑综合中作为专家输入,而非具有约束力的裁决。
同行评议的阴暗面
同行评议是筛选、评估期刊发表内容的最佳现有体系,但远非完美。尽管具备教育与科学价值,它也伴随成本、妥协与结构性弱点。高质量审稿对智力要求极高,显然会与临床工作负荷、科研、教学及个人时间与兴趣竞争,长期可能导致审稿流于表面、审稿人疲劳,或深入参与的意愿下降——在稿件日益技术化、数据密集的放射学领域尤为突出。此外,审稿人是现有知识的专家,这使体系天然具有保守性。真正颠覆性的想法——新型生物标志物、非常规建模方法、非典型成像范式——可能被判定为“验证不足”,并非因其存在缺陷,而是因其超出既有框架,现有知识尚无法覆盖。因此,同行评议可能成为现状的稳定器,阻碍而非推进知识进步。再者,两位同等资质的审稿人可能对同一稿件得出完全不同的结论:一人视为致命偏倚的内容,另一人可能视为情境下的可接受局限。这种变异性反映了科学价值的多元性,但也意味着出版决策受“谁审稿”的影响不亚于受“稿件质量”的影响。匿名性保护审稿人,但也可能助长无意识偏倚——针对机构、地区、方法,甚至特定医学或影像亚专科。 junior 作者或非传统团队可能面临更高的录用门槛,并非源于显性歧视,而是源于差异化的期望。在成像人工智能或先进定量磁共振等快速发展领域,过长的审稿周期可能使发现在发表前就已过时。 rigor 与时效性之间的平衡难以维持,尤其当审稿流程复杂度不断提升时。对作者而言,严苛或措辞不当的审稿意见可能打击士气;对审稿人而言,反复接触低质量稿件可能引发厌倦与犬儒主义。若无建设性批判的文化,同行评议可能从教育活动异化为腐蚀性过程。同行评议不可或缺,但绝非中立。它不仅通过接受的内容塑造科学,也通过劝阻、延迟或消耗的内容塑造科学。承认其局限不是否定体系,而是使其更明智、公平与可持续的前提。针对同行评议的阴暗面——包括偏倚、透明度不足、不一致性,以及偶有不具建设性或违背伦理的审稿行为——学界已提出多种缓解策略。提升透明度,如公开审稿报告或披露审稿人身份的开放同行评议,已被证明能提升问责制与评论语气,尽管在某些情境下可能影响审稿意愿。结构化审稿模板与审稿人培训可减少变异性,提升评价一致性,这对放射学中定量成像或机器学习等技术复杂领域尤为重要。在涉及人工智能方法的稿件中,需完整评估外部验证、校准、数据泄露、参考标准循环性,以及代码/模型文档的可用性。此外,跨地域、性别、职业阶段与方法学专长的审稿人池多元化,有助于解决系统性偏倚。强有力的编辑监督——包括调解不当审稿意见、积极斡旋作者与审稿人间的分歧——依然至关重要。最后,出版后评论与数据共享倡议推动同行评议从单一的出版前事件转向持续的评价过程。尽管没有任何同行评议模型能完全消除局限,这些措施仍可大幅降低其不透明性,提升公平性、 rigor 与可信度。
结论
塞涅卡的箴言再次提供了恰当的总结:“non scholae sed vitae discimus”——我们学习不是为了学校,而是为了生活。同行评议不是为期刊表演的学术仪式,而是智识品格的纪律性训练,塑造着我们推理、怀疑与捍卫知识的方式。每一次审稿所打磨的,不仅是眼前的科学,更是我们内在的科学素养。在这个意义上,同行评议与其说是义务,不如说是一种终身的认识论美德训练——一场关于放射学与科学应当如何思考的静默而持久的学徒历程。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号