基于表面增强拉曼光谱与深度学习模型对早期喉癌血清成分进行多变量特征分析:一种高效筛查新策略

《Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy》:Multivariate feature analysis of early-stage laryngeal cancer serum components using surface-enhanced Raman spectroscopy

【字体: 时间:2026年02月23日 来源:Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy 4.3

编辑推荐:

  为解决早期喉癌因缺乏特异性症状而易漏诊、传统筛查方法有创或灵敏度不足的临床难题,研究人员结合表面增强拉曼光谱(SERS)与一维卷积神经网络(1D-CNN)等深度学习模型,对早期喉癌、声带息肉及健康人群血清进行分析。研究表明,融合注意力机制的CNN-Attention模型在患者水平准确率达89.33%,显著优于传统机器学习模型,为早期喉癌提供了一种高效、准确的无创筛查新方法。

  
喉癌,作为一种常见的头颈部恶性肿瘤,其发病率呈现出逐年上升的趋势。更棘手的是,这种癌症在早期往往缺乏特异性的临床表现,患者可能仅表现为声音嘶哑、吞咽不适或反复咳嗽等常见症状,这些症状极易与普通的咽喉炎或声带息肉混淆,导致大量患者在确诊时已进入中晚期,错失了最佳的治疗窗口,严重影响治疗效果和生存率。因此,开发一种高灵敏度、非侵入性、且适合大规模人群筛查的早期检测方法,成为了临床亟待突破的“卡脖子”难题。
目前,临床上的早期喉癌筛查主要依赖喉镜检查、病理组织活检、肿瘤标志物检测(如鳞状细胞癌抗原)以及颈部CT、MRI等影像学检查。喉镜虽是首选的非侵入性手段,但其诊断高度依赖医生的主观经验,且只能观察到喉部黏膜的形态学改变,对于癌前病变或极早期的分子层面变化无能为力。病理活检虽是“金标准”,但具有创伤性,且需在喉镜发现可疑病变后方可进行,无法用于普筛。血清肿瘤标志物检测虽无创,但其对早期喉癌的敏感性和特异性均较低,存在漏诊和误诊的风险。这些传统方法的局限性,呼唤着一种能从分子层面“见微知著”的新型检测技术。
为此,来自大连医科大学第二医院耳鼻咽喉科的研究团队,将目光投向了被誉为分子“指纹”光谱的拉曼光谱技术,特别是其增强版本——表面增强拉曼光谱(Surface-Enhanced Raman Spectroscopy, SERS)。SERS技术利用纳米金属结构产生的局域表面等离子体共振效应,能将吸附在其表面的生物分子的拉曼信号增强数个数量级,实现对血清中极低丰度物质的超灵敏检测。这种方法仅需微量血清,无需复杂标记,分析快速且抗水干扰能力强,非常适合用于复杂生物体系的多成分同时分析。研究人员设想,能否利用SERS技术捕捉到早期喉癌患者血清中特异的分子振动“指纹”变化,并通过人工智能模型对其进行精准解读,从而实现对早期喉癌、声带息肉和健康人群的快速、准确鉴别呢?他们的研究成果发表在了光谱学领域的知名期刊《Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy》上。
为了验证这一设想,研究团队系统性地开展了一项探索性研究。他们首先构建了三个研究队列:早期喉癌(LC)组、声带息肉(VFP)组和健康对照(HC)组,每组各50例样本,所有样本均来自大连医科大学第二附属医院的受试者并遵循了严格的伦理规范。技术方法的核心主要包括以下几个关键环节:
  1. 1.
    SERS光谱采集:使用便携式深冷SERS系统,以硅片修饰银纳米颗粒作为固体SERS基底,采集血清样本在400-1800 cm-1范围内的分子振动指纹图谱,最终获得包含450条光谱(150例×3次测量)的数据集。
  2. 2.
    光谱数据预处理:对原始光谱进行系统化的预处理,包括尖峰去除、基线校正(使用非对称最小二乘法ALS)、信号平滑(Savitzky-Golay滤波器)和归一化,以提升数据质量并保留有效光谱信息,为后续建模奠定基础。
  3. 3.
    特征峰分析与统计学比较:计算三组血清的平均拉曼光谱,识别出11个特征拉曼位移峰。采用克鲁斯卡尔-沃利斯检验(Kruskal-Wallis test)和邓恩事后检验(Dunn's post-hoc test)分析这些峰在三组间的强度差异。
  4. 4.
    机器学习模型构建与比较:研究构建并比较了五种分类模型。其中两个是深度学习模型:融合了通道注意力机制的一维卷积神经网络(1D-CNN-Attention)和不含注意力机制的基准模型(1D-CNN-Baseline)。另外三个是传统机器学习模型:支持向量机(SVM)、自适应提升算法(AdaBoost)和K近邻算法(KNN)。所有模型均采用留一患者交叉验证(Leave-One-Patient-Out Cross-Validation, LOPO-CV)策略进行评估,以确保评估的严谨性和泛化能力。
  5. 5.
    模型性能评估与消融实验:从光谱水平和患者水平(采用投票法)两个层面,综合使用准确率、精确率、召回率、F1分数、受试者工作特征曲线(ROC Curve)及曲线下面积(AUC)和混淆矩阵等指标全面评估模型性能。并通过对比CNN-Attention和CNN-Baseline模型,进行消融实验以探究注意力机制在本任务中的作用。
研究结果
3.1. 喉癌、声带息肉和健康对照组的拉曼光谱特征
研究绘制了LC、VFP和HC三组血清的平均SERS光谱图(对应原文图4)。结果显示,三组光谱的整体轮廓和峰位高度一致,但在特征峰的强度振幅和峰形分布上存在统计学显著差异。研究识别了11个特征拉曼位移峰,并为其匹配了可能的生化分子归属,如495 cm-1(C=O)、724 cm-1(核酸)、1003 cm-1(苯丙氨酸)等。克鲁斯卡尔-沃利斯检验表明,11个峰中有8个在三组间的强度存在显著差异。进一步的邓恩事后检验及校正p值热图(对应原文图6)显示,声带息肉组与健康对照组在所有8个位移处均存在极显著差异,喉癌组与健康对照组在5个位移处存在显著差异,而喉癌组与声带息肉组仅在4个位移处存在显著差异。这表明健康与疾病状态的分子特征区分更明显,而良恶性喉部病变的血清分子变化存在重叠。
3.2. 留一患者交叉验证下的机器学习模型表现
3.2.1. 算法比较
在光谱水平上,两种深度学习模型(CNN-Attention和CNN-Baseline)的所有性能指标均显著优于三种传统机器学习模型(SVM、AdaBoost、KNN)。其中,CNN-Attention模型的准确率、精确率、召回率和F1分数最高,分别为87.33±30.33%、86.22±31.30%、84.63±33.61%和85.21±32.70%。
3.2.2. 受试者工作特征曲线
ROC曲线分析显示,深度学习模型在所有样本类别(LC、VFP、HC)上的AUC值均显著高于传统模型。例如,CNN-Attention模型在HC、LC和VFP类别上的AUC值分别高达0.981、0.936和0.941,展现出卓越的类别区分能力(对应原文图7)。
3.2.3. 混淆矩阵
在患者水平上(基于投票法),深度学习模型同样表现出色。CNN-Attention模型正确分类了43例LC、44例VFP和47例HC,患者水平准确率达到89.33%(134/150)。CNN-Baseline模型表现相近,准确率为88.67%(133/150)。相比之下,传统模型性能存在明显差距,尤其是SVM模型,仅正确分类了22例LC,误判了另外22例LC为VFP,分类性能最差(对应原文图8)。
3.3. 基于CNN模型的消融研究
消融实验结果表明,引入通道注意力机制的CNN-Attention模型在各项指标上仅略优于不含该机制的CNN-Baseline模型,两者准确率仅相差0.66%。这表明在当前SERS光谱分类任务中,注意力机制并未带来显著的性能提升,其优化效果有限。
结论与讨论
本研究创新性地建立了一个结合SERS技术与多种机器学习模型的联合分析体系。核心结论是:基于卷积神经网络的深度学习模型(CNN-Attention和CNN-Baseline)在早期喉癌、声带息肉和健康对照的多类别分类任务中,其诊断准确性和类别区分能力均显著优于SVM、AdaBoost、KNN等传统机器学习模型。特别是CNN-Attention模型在患者水平达到了89.33%的准确率,且对喉癌的漏诊风险(假阴性)最低,表现出更高的临床筛查安全性和有效性。这证实了SERS技术结合深度学习模型在捕捉血清生物分子特征、精准区分早期喉部良恶性病变方面具有核心价值。
讨论部分深入剖析了该研究的价值与局限性。意义方面:首先,该研究首次系统比较了深度学习与传统机器学习模型在SERS光谱用于早期喉癌多类别诊断中的性能,突出了深度学习模型在处理高维、复杂非线性光谱特征方面的核心优势。其次,采用严格的留一患者交叉验证策略,最大程度减少了个体差异和数据划分偏差的影响,提升了结论的临床可信度。第三,通过消融实验深入分析了注意力机制的作用,为未来SERS光谱诊断模型的架构优化提供了具体方向。从临床转化成本看,血清SERS检测的单次耗材成本可低至1.5-2美元,且检测快速(约10分钟),相比喉镜、CT等传统方法具有经济和效率优势。
局限性方面:研究样本量有待扩大,未来需要纳入多中心样本以进一步验证模型的泛化能力。此外,受试者年龄在组间存在不平衡(喉癌组年龄显著高于其他两组),虽然SERS信号主要反映与癌症相关的分子振动特征,但年龄差异可能对模型的泛化构成挑战,未来需通过年龄匹配的队列进一步验证。研究也未对SERS光谱的特异性有效波数范围进行深入分析,未来可结合特征可视化技术,识别与早期喉癌相关的特征峰,为阐明疾病分子机制提供线索。
尽管如此,本研究为SERS技术应用于早期喉癌血清学诊断奠定了重要基础。深度学习模型所展现出的高准确率和低临床风险,有望推动SERS技术从基础研究走向临床实践,为早期喉癌的筛查与诊断提供一种全新的快速、无创、精准的技术手段,最终有望提高早期诊断率,改善患者预后和生存率。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号