基于先验知识引导的自适应多尺度深度学习方法,用于表面增强拉曼光谱在肝脏疾病分类中的应用

《Engineering Applications of Artificial Intelligence》:Prior knowledge-guided adaptive multi-scale deep learning for Surface-Enhanced Raman Spectroscopy-based liver disease classification

【字体: 时间:2026年01月23日 来源:Engineering Applications of Artificial Intelligence 8

编辑推荐:

  本研究提出一种基于先验知识的自适应多尺度深度学习框架,通过双路径神经网络架构整合分子标记峰位先验与全局光谱信息,有效提升SERS肝脏疾病分类的准确性和泛化能力,在215例五分类任务中达到93.66%的准确率,较基线模型提升5.37个百分点,并在数据受限和跨中心验证中展现鲁棒性。

  
吕天意|高星星|林聚强|龚贤雄|王福强|吴俊铮|张宏伟|曾年银
中国厦门理工大学光电与通信工程学院

摘要

表面增强拉曼光谱(SERS)结合深度学习在肝脏疾病诊断中展现出巨大潜力。然而,由于患者隐私限制和样本收集的复杂性,获取大规模临床数据集具有挑战性,这导致数据稀缺,从而限制了深度学习的效果。大多数现有方法严重依赖数据驱动的方法,未能有效利用先验的生物分子知识,因此容易过拟合。为了解决这些限制,我们提出了一种基于先验知识的自适应多尺度深度学习模型,该模型将文献验证的生物分子峰位置纳入特征学习中。该模型采用双路径架构:专家引导路径使用针对不同生物分子标记优化的自适应多尺度高斯卷积提取结构化特征,而全局上下文路径捕获全面的光谱信息。自适应融合机制整合了这两条路径,以实现先验知识与数据驱动学习之间的协同作用。在一个包含215名受试者的五类肝脏疾病分类任务中,我们的方法取得了93.66%的准确率,比基线卷积神经网络(Baseline CNN,88.29%)提高了5.37%。数据约束实验表明该模型具有出色的鲁棒性;当训练数据减少到20%时,我们的方法仍保持86.01%的准确率,比基线高出10.73个百分点。此外,在35名受试者的独立外部验证中,整体准确率为82.74%,显著优于Baseline CNN的68.23%,并将泛化差距从20.15%降低到10.72%,验证了该模型在跨中心临床场景中的鲁棒性。这项工作为基于表面增强拉曼光谱的医学诊断提供了领域知识与人工智能的有效整合。

引言

肝癌是全球主要的公共卫生挑战之一。根据GLOBOCAN 2022的数据,肝癌在全球癌症发病率中排名第五,在死亡率中排名第三,2022年全球约有205万新病例和186万死亡病例(Bray等人,2024年)。预测显示,到2040年,新肝癌病例将比2020年增加55.0%,可能达到140万例诊断和130万例死亡——死亡率增加56.4%(Rumgay等人,2022年)。准确和及时的诊断对于制定有效的治疗策略和改善患者预后至关重要。目前的诊断方法主要依赖于血清学标志物和影像学检查。然而,血清生物标志物甲胎蛋白(AFP)的敏感性不足(在常规临界值下为49%–61%),并且由于慢性肝病患者体内的水平升高而特异性降低(Hanif等人,2022年;Zhang等人,2020年)。尽管成像技术具有高准确性,但它们存在空间分辨率限制和辐射暴露问题(Semelka等人,2007年)。组织活检被认为是金标准,但仍然具有侵入性和耗时性(Harrison等人,2023年)。因此,开发快速、无创且高度准确的肝癌诊断方法是一个关键的研究重点。
表面增强拉曼光谱(SERS)是一种能够快速从样本中获取分子振动指纹信息的分子检测技术。基于SERS的血清样本检测实现了无创癌症诊断,显示出显著的前景(Lin等人,2023年;Constantinou等人,2022年)。SERS技术具有明显优势,包括高检测速度、简化的样本制备和出色的分子特异性。最近,将深度学习与SERS光谱分析相结合显著提高了诊断准确性,明显优于传统的机器学习方法(Li等人,2022年;Qi等人,2023年;Rehman等人,2024年)。Xiong等人使用1D-CNN进行多癌症分类,取得了98.27%的准确率,但需要大量的数据增强来应对样本量有限导致的过拟合问题(Xiong等人,2023年)。Herent等人开发了一个用于乳腺癌MRI病变检测和分类的多任务CNN模型,在独立测试集上获得了0.816的加权平均AUC,但他们遇到了数据不平衡问题,某些病变类型在训练数据集中严重不足,影响了模型的泛化能力(Herent等人,2019年)。Srivastava等人系统地回顾了用于环境应用的机器学习增强SERS技术,同时指出尽管深度神经网络等复杂模型具有高预测能力,但由于其黑盒性质而存在可解释性挑战(Srivastava等人,2024年)。Zaki等人开发了一个可解释的SERS框架用于生物标志物定量,但目前的方法缺乏整合领域特定知识的足够机制(Zaki等人,2024年),并且受到临床SERS研究中常见的小样本量的进一步限制(Rudin,2019年)。Han等人解决了小样本学习场景中的灾难性遗忘和过拟合问题,证明在有限样本上训练的模型容易性能下降(Han等人,2024年)。
这些限制因获取大规模临床数据集的固有挑战而加剧,包括患者隐私限制和标准化生物医学样本收集的复杂性(Dong等人,2023年;Zhang等人,2021年;Cheng等人,2021a;Chen等人,2022年;Jeng等人,2019年;Sun等人,2024年;Cheng等人,2021b)。大多数SERS癌症检测研究使用的样本量相对较小(Liu等人,2018年;Xie等人,2024年;Cheng等人,2021a;Chen等人,2022年;Jeng等人,2019年;Sun等人,2024年;Cheng等人,2021b),只有少数研究收集了超过100个样本,这使得样本稀缺成为深度学习模型性能的关键瓶颈(Li等人,2022年;Xiong等人,2023年)。更重要的是,先前的研究系统地确定了与肝癌相关生物标志物相关的特征拉曼峰位置,包括来自精氨酸、酪氨酸、腺嘌呤、苯丙氨酸和核酸等关键分子的振动信号,这些分子包含具有重大诊断价值的生物信息(Shuyun等人,2023年;Ou等人,2024年;Gao等人,2022年;Yang等人,2024年)。然而,现有方法缺乏充分利用这些已建立生物分子知识的机制,特别是在利用验证过的特征峰位置方面,从而限制了它们的分类性能和生物学可解释性。尽管已经提出了SERS分析的计算框架(Tan等人,2025年),但将其应用于基于知识的疾病诊断的研究仍较少。
为了解决这些限制,本研究提出了一种基于先验知识的自适应多尺度深度学习框架,采用双路径神经网络架构。专家引导分支将文献验证的关键生物分子峰位置作为先验知识,通过自适应多尺度高斯卷积进行精确的特征提取,而全局上下文路径捕获整个光谱的补充信息。这些路径通过自适应融合机制进行最佳整合,充分利用了生物先验知识,同时保持了从未知模式中学习的能力。在一个五类肝脏疾病分类任务中,所提出的框架取得了93.66%的准确率,比基线CNN(全球准确率为88.29%)提高了5.37个百分点。数据约束实验进一步证明了在样本有限条件下的优越稳定性和泛化能力。此外,独立的外部验证证实了模型的鲁棒性,准确率为82.74%,显著缩小了与基线的泛化差距,验证了先验知识引导机制在跨中心场景中的有效性。

章节片段

基于先验知识的自适应多尺度深度学习模型

本研究提出了一种基于先验知识的自适应多尺度深度学习框架,旨在有效整合领域先验知识与数据驱动的特征学习范式。该框架采用双路径神经网络架构,如图1所示,包括专家引导分支和全局上下文路径(以下简称Baseline CNN(Global)。
专家引导分支基于文献验证的

SERS基底的特性和可重复性

为了探索一种敏感且成本效益高的肝脏疾病筛查策略,我们使用了银纳米粒子(AgNP)改性的铝箔基底。选择AgNPs是因为它们在近红外区域具有优越的局部表面等离子体共振(LSPR)效率,而铝箔则作为一种易于获得的、低背景的支持材料(Gutés等人,2010年)。为了评估传感界面的结构完整性和光学性能,合成的银纳米粒子(AgNPs)

结论

本研究提出了一种基于先验知识的自适应多尺度深度学习框架,用于基于SERS的肝脏疾病分类。该框架采用双路径架构,其中专家引导分支通过自适应多尺度高斯卷积从先验知识引导的峰位置提取结构化特征,建模峰间协作,并与全局特征分支自适应融合。实验结果表明,该框架提高了分类准确性,

CRediT作者贡献声明

吕天意:撰写——原始草稿,可视化,方法学,研究。高星星:撰写——原始草稿,验证,方法学,研究,数据管理。林聚强:撰写——审阅与编辑,验证,方法学,概念化。龚贤雄:撰写——审阅与编辑,验证,方法学,形式分析,数据管理。王福强:验证,方法学,形式分析,数据管理。吴俊铮:可视化,验证,形式分析,数据

利益冲突声明

作者声明他们没有已知的竞争性财务利益或个人关系可能影响本文报告的工作。

致谢

本工作得到了福建省科技计划国际合作项目(编号2024I0045)的支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号