《European Spine Journal》:False references, real consequences: safeguarding spine evidence
编辑推荐:
科学出版建立在信任之上。每份稿件都要求读者相信:研究方法按所述实施、数据支持所得结论、所引文献真实存在并能准确支撑文中论断。若无此"信任",科学记录便不再稳定。在医学领域,已发表证据可影响临床决策、指南制定、医保报销、卫生政策及患者期望,信任受损的后果并非抽象
科学出版建立在信任之上。每份稿件都要求读者相信:研究方法按所述实施、数据支持所得结论、所引文献真实存在并能准确支撑文中论断。若无此"信任",科学记录便不再稳定。在医学领域,已发表证据可影响临床决策、指南制定、医保报销、卫生政策及患者期望,信任受损的后果并非抽象,而是切实存在。此问题在人工智能(Artificial Intelligence, AI)及大型语言模型(Large Language Model, LLM)时代愈发紧迫。此类工具可高速生成流畅、精修且看似学术化的文本,若负责任地在透明及人工监督下使用,LLM可提升效率与清晰度;若疏忽或欺诈性地使用,则会产出看似权威却不准确、无依据甚至完全"捏造(fabricated)"的内容。近期Sima等人在《European Spine Journal》2026年3月社论中指出,AI之危不在于仅生成文本,而在于生成脱离事实、看似合理的学术内容,一旦发表,"不实内容"会被当作证据在文献中传播——捏造的参考文献、无据可依的论断及虚构数据将成为知识的虚假基石,误导后续研究与临床决策。2026年5月《The Lancet》中Topaz等人对2023年1月至2026年2月约250万篇生物医学论文进行引文完整性审计,在逾9700万条核验引文中发现2810篇文章含4046条捏造引文;受影响论文比例从2023年约1/2828升至2025年1/458、2026年前七周达1/277。若趋势持续,未来五年捏造引文或从偶发异常演变为系统性问题,每7篇生物医学论文中约1篇受影响(即每10万篇中约1.4万~1.5万篇)。捏造引文非排版错误,而是指向根本不存在的研究、数据或学术主张,属"AI幻觉证据(AI-hallucinated evidence)"——具可信外观却无可验证基础的引文与学术架构。引文是科学知识的结缔组织,捏造将割裂此连接,误导读者、干扰审稿人、扭曲文献检索、污染系统综述与Meta分析、伪造科学共识并致临床指南偏差,在脊柱(spine)诊疗领域尤甚。责任不可因使用AI、第三方代写或疏漏而转移,署名即承担全部学术与伦理问责(accountability)。出版方应完善自动筛查工具但知其局限,审稿人须警惕可疑引文模式,编辑应将捏造引文视为重大科学与伦理问题——单条误引可更正,多条核心捏造引文应拒稿或撤稿并公示,期刊应要求作者在投稿时声明已逐条核对原始文献并附DOI(Digital Object Identifier)辅助核验。《European Spine Journal》作为国际多学科脊柱期刊,须既鼓励创新又捍卫可信证据(trustworthy evidence)。研究人员应在投稿前亲自核验每条例证对抗原始出处而非仅依赖文献管理软件或AI摘要,披露AI使用情况且不以AI生成或替代证据,抵制以量为先的学术评价文化。综上,AI幻觉引文歪曲证据基底、消耗评审资源、侵蚀科学公信力并可能损害患者照护;脊柱出版新时代的定义标准非速度或数量,而是所发表证据是否可被信任(trustworthy)。
论文解读:《False references, real consequences: safeguarding spine evidence》——《European Spine Journal》社论类述评
一、研究背景与开展缘由
科学出版体系的核心基石是信任——读者需信赖研究方法被如实执行、数据能支撑结论、所引文献真实存在并可佐证文中主张。在医学领域,尤其是脊柱(spine)外科与脊柱相关疾病研究中,已发表证据直接影响临床实践指南、医保支付政策、卫生决策及患者预期,因此文献引用的准确性关乎患者安全。近年来,人工智能(Artificial Intelligence, AI)特别是大型语言模型(Large Language Model, LLM)被广泛用于学术写作辅助,但其可生成流畅却脱离事实的"幻觉(hallucination)"内容,包括根本不存在的参考文献(捏造引文/fabricated citations或false references)。Sima等人于《European Spine Journal》(Eur Spine J, 2026, 35(3):1017–1020)已警示AI对科学真理的威胁;同期Topaz等人在《The Lancet》(2026)对约250万篇生物医学论文的引文审计证实捏造引文呈指数增长趋势。在此背景下,本文作者以脊柱学科视角,论述捏造引文对脊柱循证医学(evidence-based medicine, EBM)的危害,明确各参与方的伦理与操作责任,呼吁建立防范机制以捍卫脊柱证据体系可靠性。本文以社论(editorial)形式发表于《European Spine Journal》。
二、主要论证展开方式(关键论述依据)
研究人员未开展原始实验,而是综合引用近期已发表的权威文献——Sima等(Eur Spine J 2026)关于AI与LLM威胁科学真理的社论,以及Topaz等(The Lancet 2026)对2023年1月—2026年2月PubMed/MEDLINE等数据库中约2.5百万篇生物医学论文、逾9700万条参考文献的引文完整性审计数据——结合脊柱外科临床与出版伦理规范进行逻辑推演与论述,阐明捏造引文在AI时代对脊柱证据基底的侵蚀及各方应对之策。
三、研究结果(按原文小标题归纳论述结论)
AI and large language models(人工智能与大型语言模型)
研究人员指出,LLM可用于语言润色、摘要、数据提取等正当用途,危险在于其可生成表面合理却无事实根基的学术内容(如虚构参考文献)。一旦这类"不实"内容被发表并引用,将成为知识体系的虚假构件,引导后续研究与临床决策走入未经验证甚至有害的路径。Sima等人业已呼吁:AI不能替代作者问责、人工核验及审稿与编辑职责。
Documenting fabricated references – the Lancet report(捏造引文的文献记录——?《柳叶刀》报告)
引用Topaz等人审计结果:在9700余万条核验引文中识别出4046条捏造引文分布于2810篇文章;受影响论文占比由2023年约1/2828升至2025年1/458、2026年初七周达1/277。按此轨迹外推,若不干预,未来五年捏造引文或趋近系统性问题(约每7篇1篇受影响)。研究人员强调此警告不容忽视——捏造引文已从偶发编辑麻烦升级为生物医学证据可靠性的新兴威胁。
AI-Hallucinated evidence(AI幻觉证据)
捏造引文不同于页码错误或格式问题,其实质是指向并不存在的论著、数据集或学术主张,营造"有证据支持"的假象,属典型的AI幻觉证据——引文与学术脚手架具可信外观但无可验证基础。
Consequences of fabricated references(捏造引文的后果)
引文是科学知识的结缔组织,用于溯源、复现与承继。捏造引文切断此连接,可致读者与审稿人被误导、文献检索失真、系统综述与Meta分析受污染、虚假科学共识形成并扭曲临床指南。脊柱领域涵盖腰痛(low back pain, LBP)、退行性疾病、畸形、创伤、肿瘤、生物制剂、影像学标志物、康复、机器人技术及AI应用等异质性极强方向,临床与研究者高度依赖可靠文献。含虚构证据的论文不仅削弱自身论点,更"瘫痪(confidence-crippling)"学界对整体学术记录的信心。此外,无论错误源于AI生成、不可靠来源复制、第三方代写或修订疏漏,伦理与学术责任均不可推卸给工具或流程——署名即承诺对作品完整性负责,此乃问责(accountability)的体现。
Accountability and action to address fabricated references(针对捏造引文的问责与行动)
- •
Publishers and reviewers(出版方与审稿人):技术创新须受核验约束,速度不能取代准确性。出版方应强化自动筛查(抄袭、图像篡改、文本重复、不可核验引文),但需认知其局限。同行评议本已依赖志愿专家时间,不宜额外强求逐条核验所有引文,但审稿人应警觉不支持的论断、引文与内容不匹配、过度泛化可疑参考文献或与已知证据库不符的文献格局,遇疑即报。
- •
The Journal(期刊层面):编辑须视捏造引文为实质科学与伦理违规。单条无意错误可在修稿中更正;若存多条捏造引文尤其支撑文稿立题、方法、解释或结论者,应即刻拒稿且不建议转投他刊,可视情况限制涉事作者未来投稿或加强审查;发表后发现应发布更正、关注声明或撤稿(retraction)并通告作者所属机构。期刊宜设明确阈值与透明政策区分可修正错误与威胁科学记录之捏造模式,并可定期公布因疑似AI生成内文或引文而撤稿的论文清单以儆效尤。预防上,要求作者在投稿声明书中确认每条引文已对照原始文献核验且该引文恰切支撑对应陈述,尽可能附DOI(Digital Object Identifier)供交叉核验。
- •
The Authors(作者层面):研究人员应在投稿前逐条依原始出处(非仅靠文献管理软件EndNote/Zotero、二次引用或AI摘要)核实引文存在性、相关性及表述公允性;按要求披露AI辅助并绝不以其生成或替代证据;发表压力不构成免予核验的理由。严重或屡次涉及欺诈性引文/数据捏造可引发机构调查、职业处分甚至解聘。守护文献可靠性始于作者之勤勉、透明与问责。
Quantity vs. Quality(数量与质量)
学术界须抵制片面奖励发文量、产出速度与浅层计量指标的文化,因其间接催生弱化文献质量的短视行为。更多论文≠更好证据,更多引文≠更高真实性,更高技术复杂度≠更可靠科学。
Summary(总结)
AI幻觉引文(虚假参考文献)扭曲证据基底、加重评审负担、误导读者并侵蚀科学公信,在医学中可能最终殃及患者照护。脊柱出版的未来不由处理速度、收稿量或技术采纳度定义,而取决于所发表证据可否被信任(trustworthy)。《European Spine Journal》有责任在助推创新同时捍卫令创新具意义之标准——目标非仅发表更多脊柱研究,而是构筑更优脊柱证据:严谨(rigorous)、透明(transparent)、可重现(reproducible)、具临床相关性(clinically-relevant)、合乎伦理(ethically grounded),并配得上所服务的患者与社群。
四、讨论与结论要点翻译(浓缩自原文结论段)
虚假引文或称AI幻觉证据具真实危害:其扭曲循证基底、消耗编辑与审稿资源、误导读者并侵蚀科学界互信,在医学领域或可波及患者诊疗。脊柱出版新纪元的关键指标非期刊处理稿件快慢、接收量多少或引入多少新技术,而是刊载证据是否可被信赖。随着脊柱科学发展,《European Spine Journal》肩负双重使命——支持创新同时捍卫使创新具意义的学术标准。目标不止于发表更多脊柱相关研究,而是助益建立更优质的脊柱证据体系:该体系应具备方法学严谨性、报告透明度、结果可重现性、临床相关性及伦理正当性,并堪当患者与社会的依托。