护理研究中的自引:模式、离群值与经验阈值

《Nursing Outlook》:Self-citation in nursing research: Patterns, outliers, and empirical thresholds

【字体: 时间:2026年05月22日 来源:Nursing Outlook 3.7

编辑推荐:

  背景:自引(self-citation)在科学交流中扮演着双重角色:它可能反映出合法的学术延续性,但过度的自引会扭曲用于科研评价的基于引用的指标(citation-based metrics)。随着引文指标日益影响教师晋升、机构基准测试以及护理学院全球可见度,

  
背景:自引(self-citation)在科学交流中扮演着双重角色:它可能反映出合法的学术延续性,但过度的自引会扭曲用于科研评价的基于引用的指标(citation-based metrics)。随着引文指标日益影响教师晋升、机构基准测试以及护理学院全球可见度,了解护理学内部典型的自引模式已变得十分重要。 目的:旨在检查高被引护理研究人员之间的自引分布情况,并建立用于识别异常高自引模式的经验阈值。 方法:这项文献计量学(bibliometric)分析使用了Ioannidis(2024)开发的公开可用的基于Scopus的标准化作者级引文数据库。样本包括1375名职业长期(1996–2024年)和1403名单年(2024年)高被引护理研究人员。自引率(self-citation rates)按照Scopus的定义计算,包含来自作者和合著者的引用。过度自引的阈值是通过基于四分位距(IQR)的离群值方法确定的(严格阈值 = Q3 + 1.5 × IQR;宽松阈值 = Q3 + 3 × IQR)。 讨论:职业长期数据集的平均自引率为9.27%(中位数 = 8.65%),2024年数据集为7.88%(中位数 = 6.41%),两个分布均呈右偏(right-skewed)模式。使用严格和宽松的基于IQR的阈值,分别有2.1%和0.2%的职业长期护理研究人员,以及3.2%和0.4%的单年研究人员超过了异常高自引的阈值。 结论:高被引护理研究人员的自引通常集中在相对较低的水平,较高的值仅限于极少数作者。本研究得出的经验基准为解释护理研究中的自引模式提供了学科特定的参考。这些阈值应被视为分析参考点,可能有助于将基于引文的评价情境化,而不是作为不道德引文行为的指标。
论文解读:护理研究中自引模式的文献计量学分析
研究背景与问题提出
在当代科学评价体系中,引文指标(如引用次数、h-index等)已成为衡量科研人员生产力、可见度及学术影响力的重要工具。然而,当涉及自引(self-citation,即作者引用自己先前工作)时,这些指标的解释变得复杂。自引具有双重属性:一方面,它可能是合法学术延续的体现,例如在研究连贯性、方法学一致性或构建学术脉络时的必要引用;另一方面,在量化指标主导的评价激励结构下,过度的自引可能演变为一种人为推高引文指标的策略,从而扭曲学术记录,引发研究诚信问题。尽管《出版伦理委员会》(COPE)指出了自引的伦理模糊性,并强调需区分可接受的学术延续与操纵引文指标的做法,但如何界定“过度”仍缺乏学科内的具体基准。
这一问题在护理学(nursing)领域尤为突出。相较于部分生物医学学科,护理研究的引文密度较低,且其研究群体规模、博士项目扩展历史及科研劳动力演变等结构因素,使得引文模式具有学科特殊性。目前,国际大学排名系统(如THE、QS)常将引文指标作为科研卓越的代用指标,导致机构和学者面临增加引文数量的隐性压力,这可能无意中助长包括自引在内的引文最大化行为。然而,现有关于自引分布的大尺度分析多横跨多学科,针对护理学这一特定学科的高被引研究人员自引模式及其经验阈值的研究证据仍然有限。这种空白使得在护理学者评价、职称晋升及机构基准测试中,缺乏公平的学科基准,可能导致护理学术成果被误解或处于不利地位。因此,开展这项针对护理领域高被引研究人员自引模式的学科特异性分析,对于确保引文指标公平应用具有重要意义。
主要技术方法
研究人员开展了二次文献计量学(bibliometric)分析,数据来源于Ioannidis(2025)开发的公开可用的Scopus(爱思唯尔旗下的摘要和引文数据库)标准化作者级引文指标数据库,该数据库涵盖了超20万名各学科研究人员的数据。研究样本筛选自该数据库,确定了1375名职业长期(1996–2024年)高被引护理研究人员和1403名单年(2024年)高被引护理研究人员。自引率(self-citation rate)的计算严格遵循Scopus的定义,即涵盖来自作者本人及其合著者(coauthors)的引用。为识别异常高的自引水平,研究人员采用了基于四分位距(Interquartile Range, IQR)的离群值检测方法,设定了两种经验阈值:严格阈值(Strict threshold = Q3 + 1.5 × IQR)和宽松阈值(Liberal threshold = Q3 + 3 × IQR),以此统计超出常规分布的研究人员比例。
研究结果
分布(Distribution of Self-Citation Rates Among Highly Cited Nursing Researchers)
研究人员共纳入了1375名职业长期(1996–2024年)和1403名单年(2024年)高被引护理研究人员。两个数据集的自引率分布均呈右偏(right-skewed)形态(如图1所示),表明大多数研究人员的自引率聚集在较低数值区间,而少数研究人员表现出显著较高的自引率。在职业长期数据集中,平均自引率为9.27%,中位数为8.65%(范围:0.02%–40.51%);在2024年单年数据集中,平均自引率为7.88%,中位数为6.41%(范围:0%–52.38%)。通过IQR-based离群值分析发现,使用严格阈值(Q3 + 1.5 × IQR)时,有2.1%的职业长期研究人员和3.2%的单年研究人员被认定为具有异常高的自引率;使用宽松阈值(Q3 + 3 × IQR)时,这一比例分别为0.2%和0.4%。
讨论(Discussion)
该研究提供了针对高被引护理研究人员自引模式的学科特异性分析。三个核心发现如下:首先,自引率集中在分布的较低部分,职业长期数据集中位数为8.65%,2024年数据集为6.41%。其次,两个分布均呈右偏,表明较高的自引率仅存在于少数作者中。第三,通过分布衍生的阈值,可以识别出异常高的自引水平。研究人员指出,自引常常是累积性科学进步的合法组成部分,尤其在研究人员基于前期工作进行构建时。这些经验阈值不应被解释为不道德行为的明确指标,而应作为分析参考点,帮助在科研评价中对引文指标进行情境化解读。此外,随着Clarivate等评价机构加强引文操纵审查,学科特定的自引基准有助于更精细地评估引文档案。
结论(Conclusions)
该研究描述了高被引护理研究人员的自引模式,并确定了基于分布的经验阈值,以帮助将异常高的自引水平在观测数据集中进行情境化。重要的是,这些阈值不应被解释为不道德行为的决定性指标。自引通常是累积科学进步的合法组成部分,特别是当研究人员在其先前工作基础上进行构建时。这些学科特定的经验基准为解释护理研究中的自引模式提供了参考,并可能有助于在基于引文的评估中进行更具备情境敏感性的解读。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号