迈向透明且可解释的筛查方法：结合大语言模型（LLM）增强解释性的多生物流体傅里叶变换红外光谱技术在胰腺癌检测中的应用

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Methods》：Towards transparent and interpretable screening: multi-biofluid FTIR spectroscopy with LLM-Augmented explainability for pancreatic cancer detection

【字体：大中小】 时间：2026年04月17日 来源：Methods 4.3

编辑推荐：

　　本研究通过结合傅里叶变换红外光谱（FTIR）技术于尿液和血液生物流体分析，利用机器学习实现胰腺癌早期非侵入性检测，并提出基于大语言模型（LLM）和蒙特卡洛树搜索（MCTS）的透明解释框架，解决特征归因与生化解释的语义鸿沟问题，显著提升临床诊断可接受性。

斯旺西大学计算机科学与数学系，SA2 8PP，英国

摘要

胰腺癌的早期检测仍然是肿瘤学中的一个关键挑战，目前的诊断方法往往无法在疾病进入晚期之前识别出它。然而，仅凭诊断准确性可能不足以满足临床应用的需求，因为监管框架和临床工作流程越来越要求使用透明、可解释的人工智能系统。本研究探讨了结合傅里叶变换红外（FTIR）光谱学和机器学习的方法，通过尿液和血液生物流体来非侵入性地检测胰腺癌，并通过语言模型辅助的透明度框架来桥接光谱特征属性和生化解释。评估了五个数据集：尿液ATR-FTIR（平衡准确率为61.7%）、尿液透射FTIR（74.8%）、过滤后的血液（<10 kDa；89.8%）以及两个匹配的尿液-血液融合数据集。透射模式的尿液与过滤后的血液结合使用时，达到了最高的性能（平衡准确率为96.9%），超过了单独使用任何一种生物流体的效果。为了支持透明度，我们开发了一个基于大型语言模型（LLM）的可解释性流程，该流程包括蒙特卡洛树搜索（MCTS）用于结构化假设探索、经过策划的检索增强知识库（RAG）以及能够识别特征属性方法之间差异的可靠性门控解释。可解释性方法显示出显著的分歧（平均Spearman ρ = 0.23–0.28），这促使我们采取分层策略：当方法一致时（ρ ≥ 0.3，并通过知识库验证）进行波数级解释；否则进行区域级解释。这些结果突显了透明光谱诊断的潜力和当前的限制。

引言

胰腺癌是最致命的恶性肿瘤之一，在英国，5年生存率低于10%，10年生存率低于5%[1]。2022年，全球新增胰腺癌病例超过51万例，导致46.6万多人死亡，使其成为癌症相关死亡的主要原因[2]。预后不良主要是由于诊断过晚，因为该疾病通常表现为非特异性症状，并且缺乏有效的非侵入性筛查方法[3]、[4]、[5]。这种早期检测方法的重大缺口凸显了迫切需要新的诊断方法，以便在更早、更可治疗的阶段识别胰腺癌。

傅里叶变换红外（FTIR）光谱学作为一种有前景的癌症诊断技术，通过分析振动模式提供了关于生物流体组成的分子级见解[6]、[7]。与通常需要侵入性程序的传统诊断方法不同，FTIR光谱学可以分析容易获取的生物流体，如血清、血浆和尿液，为癌症检测提供了一种非侵入性替代方案[8]、[9]。该技术生成的光谱指纹能够捕捉与恶性肿瘤相关的生化变化，使其特别适合识别癌症特有的分子特征[10]。

基于FTIR的癌症诊断的最新进展已经在各种癌症类型中展示了成功应用[11]、[12]、[13]。Sala等人使用血清ATR-FTIR结合机器学习算法，在区分胰腺癌和健康样本时实现了85%至90%的准确率[14]。我们之前的工作通过证明关注特定分子量范围（特别是血液样本中的<10 kDa范围）可以将诊断准确率提高到约90%[15]。然而，这些研究主要集中在单一生物流体的分析上，可能忽略了来自多个生物来源的互补诊断信息。

将基于机器学习的光谱诊断技术应用于临床的一个关键障碍是许多分类流程的不透明性。这一问题已从学术讨论上升到监管要求，欧盟的AI法案将诊断AI系统归类为高风险，并对其可解释性提出了严格的要求[16]。临床应用研究表明，可解释性直接影响临床医生的信任度，当预测附有高质量的解释时，AI的替代率会显著下降[17]。

在基于光谱的诊断中，可解释性提出了一个独特的挑战。特征属性方法（如SHAP[18]）可以识别出有影响力的波数；然而，将这些数值属性转化为生化意义上的解释需要领域知识，而这在分析时往往不可用。例如，告诉临床医生“波数1657 cm^-1对预测的贡献最大”提供的信息有限，因为这并未认识到该波段对应于与蛋白质二级结构相关的酰胺I振动。这种数值属性与生化解释之间的语义差距很难仅通过计算XAI方法来桥接。

此外，基于扰动的XAI方法在高维光谱环境中可能表现出有限的稳定性。Ghorbani等人报告称，神经网络的解释可能对微小的输入扰动非常敏感，从而导致截然不同的解释[19]。在光谱工作流程中，方法选择（如背景参考选择或随机种子初始化）也可能导致特征排序的分歧[20]，这在需要解释一致性的临床环境中令人担忧。除了模型级别的可解释性之外，还有流程透明度：即检查和理解整个分析过程的能力，从样本采集和预处理到解释。在基于光谱的诊断中，预处理决策（包括基线校正、归一化和降维）可能会影响分类行为和属性特征的解释[6]。解决这些依赖性可能需要结合领域知识、跟踪分析决策并在解释信号不一致时传达不确定性的解释框架。

大型语言模型（LLMs）提供了将数值属性转化为临床上有意义解释的机会。最近的研究表明，LLMs可以将XAI输出转化为临床医生认为有用的自然语言[21]，当与基于领域知识的检索增强生成（RAG）[22]结合使用时，可以提供具有生化背景的解释。诸如蒙特卡洛树搜索（MCTS）[23]之类的审慎推理策略能够系统地探索替代假设，从而降低过度自信解释的风险。然而，这些方法应被视为对可解释性差距的部分响应，而不是全面的解决方案，特别是在特征属性不确定或存在冲突的情况下。

本研究通过评估FTIR光谱学在多种生物流体中的胰腺癌检测能力，并通过一个透明度框架来增强可审计的解释，从而解决了这些差距。我们的主要发现是，将透射模式的尿液与过滤后的血液FTIR结合使用时，达到了96.9%的平衡准确率，优于单独使用任何一种生物流体。图1展示了从可获取的生物流体中获取数据的过程以及机器学习框架。为了解决透明度问题，我们引入了一个包含多个相互连接组件的框架：通过Spearman相关性进行可靠性评估的双重XAI方法、基于策划知识库的MCTS引导的假设探索[24]、[25]，以及可靠性门控的解释生成。当XAI方法一致时（ρ ≥ 0.3），我们提供波数级解释；当它们不一致时，我们仅报告区域级模式并承认这一限制。选择ρ ≥ 0.3作为保守的截止值，是为了指示在常见解释方案中存在不可忽视的排名一致性[26]。这个截止值的设计目的是标记不可靠的案例：低于该阈值的样本仅限于区域级解释，而超过该阈值的样本则允许进行波数级分析，并需通过知识库验证。第3.4.1节中的三重比较提供了实证验证：本研究中使用的Analytical–SHAP配对在阈值以上的覆盖率为32–58%，而SHAP–LIME配对的覆盖率为0–2%，表明该阈值能够正确区分具有有意义一致性的方法对和没有一致性的方法对。如果将阈值收紧（例如，提高到ρ ≥ 0.5），虽然解释样本的数量会大幅减少，但解释质量的提升并不成比例。我们发现XAI方法在光谱领域存在相当大的分歧（平均ρ = 0.23–0.28），我们的系统明确传达了这一观察结果。这种方法符合临床环境中负责任AI的新兴实践[27]。其意义不仅限于方法论，还提供了关于透明光谱诊断的潜力和当前限制的见解。

数据采集和患者队列

生物流体样本是在2020年至2022年间，在英国斯旺西的Morriston医院收集的，得到了NHS的伦理批准（IRAS ID：252525），并获得了书面知情同意。对于这里报告的分析，我们使用了包含21名胰腺癌患者和32名健康对照者的53名参与者队列。每个参与者的尿液和血液都是按照标准操作程序收集的；所有样本都存储在<80°C>下，以保持完整性并反映实际情况

不同生物流体上的诊断性能

表1展示了所有数据集的诊断性能结果。结果表明，不同生物流体类型和测量模式之间存在明显的性能层次差异。

在各个生物流体中，过滤后的血液样本取得了最高的诊断性能，平衡准确率为89.8%，灵敏度为88.9%，特异性为90.6%。这一相对较强的性能与先前的报告一致，这些报告表明低分子量的血液成分可能

多生物流体融合实现高诊断准确率

将透射模式的尿液FTIR与过滤后的血液FTIR结合使用，在本研究中获得了最高的诊断性能，平衡准确率为96.9%，优于单独分析的任何一种生物流体。这一结果与血液和尿液捕获胰腺癌生物学的互补方面的观点一致，血液反映了肿瘤相关的蛋白质、脂质和代谢物，而尿液反映了更广泛的系统代谢紊乱[14]。

改进

结论

本研究通过证明将透射模式的尿液FTIR与过滤后的血液FTIR结合使用可以实现96.9%的胰腺癌检测平衡准确率，优于单独分析的任何一种生物流体，表明多生物流体融合能够捕获互补的诊断信息。

我们还引入了一个透明度框架，将数值特征属性与生化意义上的解释联系起来

伦理声明

本研究获得了威尔士研究伦理委员会（REC）7和SBU联合科学审查委员会（IRAS ID：252525）的批准。所有参与者都获得了书面知情同意。

作者贡献

郑堂（ZT）开发了机器学习算法、透明度框架并进行了数据分析。BM提供了算法开发方面的专业知识。ED、CC、KL、JR、PMA进行了FTIR测量和数据预处理。OI提供了光谱学方面的专业知识。VK、VH和SHC提供了生物化学和实验设计方面的专业知识，MM和BA采集了患者样本并提供了临床见解。DR领导并设计了这项工作和方法。所有作者都审查并批准了最终结果

利益冲突声明

作者声明他们没有已知的财务利益或个人关系可能影响本文报告的工作。

致谢

我们感谢EPSRC和斯旺西湾大学健康委员会的财政支持。DR感谢DI-VISION项目的财政支持。该项目DI-VISION获得了EMPIR计划的资助，该计划由参与国共同资助，并得到了欧盟的Horizon 2020研究和创新计划的资助。DR还感谢HYPER-PATH项目的财政支持。该项目HYPER-PATH获得了Cancer Research Wales的资助。作者感谢患者和

联系信箱：

粤ICP备09063491号

摘要

引言