利用配备多模态传感器阵列和机器学习的电子鼻进行基于呼吸的食管癌诊断

【字体: 时间:2026年02月13日 来源:Microchemical Journal 5.1

编辑推荐:

  食管癌早期筛查需求迫切,本研究提出基于多模态气体传感器阵列(含MOS、EC和PID传感器)与深度残差神经网络的便携式诊断系统,通过粒子群优化特征选择,实现83%准确率、86%敏感性和79%特异性,AUC达0.91。该系统突破GC-MS设备复杂、成本高昂的限制,具备非侵入、实时、可规模化应用优势,为临床提供新型低成本的食管癌筛查工具。

  
任宇克|罗饶军|王飞|朱子怡|吕国军|崔海斌
浙江省清洁能源与碳中和重点实验室,浙江大学清洁能源利用国家重点实验室,中国杭州310027。

摘要

食管癌由于其高发病率和死亡率,仍然是一个严重的健康挑战。我们之前的研究表明,通过对呼出挥发性有机化合物(VOCs)进行气相色谱-质谱(GC–MS)分析,可以为食管癌提供准确的诊断模型。然而,GC–MS的复杂性和高成本限制了其在大规模人群筛查中的应用。
在这项研究中,我们提出了一种互补的、更具临床可行性的方法:一种基于多模态气体传感器阵列的便携式诊断系统,该系统结合了深度学习算法。与GC–MS不同,该系统无需预浓缩,能够实现快速、无创的现场呼吸分析。我们分析了120名参与者(68名患者和52名健康对照组)的呼吸样本。经过粒子群优化(Particle Swarm Optimization)的特征选择后,残差神经网络模型的准确率为83%,灵敏度为86%,特异性为79%,AUC为0.91。
本研究不仅解决了GC–MS的实际局限性,还强调了基于传感器阵列的策略作为早期食管癌检测的成本效益高且可扩展的工具的潜力。我们的方法代表了方法上的进步,超越了之前的VOC相关研究。

引言

食管癌是全球最常见的致命癌症之一,对人类健康构成严重威胁。根据世界卫生组织国际癌症研究机构发布的癌症统计数据,2022年全球新增食管癌病例为511,000例,占所有癌症发病率的第11位。该疾病的死亡人数为445,000人,占癌症总死亡人数的第7位[1]。在中国,情况尤为严重,2022年新增病例224,000例,死亡人数187,000例。这些数字分别占全球新增病例的43.8%和全球死亡人数的42.1%[2]。食管癌的高死亡率主要是由于缺乏明显的早期症状,许多患者在晚期才被诊断出来,错过了最佳治疗时机[3]。多国癌症统计研究表明,与晚期病例相比,早期食管癌的生存率和生活质量显著更高[4],[5]。因此,早期筛查和及时诊断对于食管癌的治疗至关重要,尤其是对于高风险群体,因为定期筛查可以显著提高治愈率[6],[7]。
目前,食管癌的标准诊断方法包括内镜检查结合影像技术。内镜检查可以获取用于病理诊断的活检样本,被认为是诊断食管癌的“金标准”。它对早期食管癌也有很高的检测能力。然而,这种方法有几个缺点:1)一些患者可能会因为内镜插入而感到明显不适[8];2)检查的准确性取决于医生的经验和技能,不当的操作可能导致穿刺或出血等并发症[9],[10];3)检查的高成本给患者和国家医疗保险系统带来了沉重的经济负担,限制了其在大规模筛查中的应用[11]。另一方面,影像检查通常涉及辐射暴露,也不适合广泛的一级筛查。
因此,在食管癌的预防和控制方面仍存在一个关键缺口:缺乏一种有效、无创、低成本且易于操作的方法,适用于大规模的早期筛查。许多早期患者仅表现出轻微的症状。此外,经济限制或对内镜检查的恐惧等障碍常常阻碍了及时诊断。结果,这些患者错过了最佳治疗时机,导致预后显著恶化[12]。开发一种高效、经济、方便且可靠的早期筛查方法已成为当前临床实践和公共卫生的迫切需求。
近年来,基于呼吸分析的诊断方法,特别是VOCs检测,已成为早期食管癌筛查的一个有前景的方向。VOCs广泛存在于人体代谢过程中,并随呼吸排出体外。它们的组成和浓度会随着身体状况的变化而变化[13]。研究表明,某些特定的VOCs与食管癌的发展密切相关。例如,研究发现食管癌患者的呼吸中醛类、酮类等化合物的浓度显著升高[14],[15],[16]。在我们之前的工作中,我们应用GC–MS识别并量化了100多种呼出的VOCs,并成功开发了一个基于神经网络的诊断模型,准确率超过90%[17]。这项研究表明VOCs作为无创食管癌诊断的有效生物标志物的可行性。虽然GC–MS可以准确检测这些VOCs,但其复杂的操作、较长的处理时间和高成本限制了其在大规模筛查中的应用[18]。
与基于质谱的气体检测技术(如GC–MS)相比,电子鼻技术作为一种便携、高效且无创的工具,已经在基于呼吸的疾病诊断方面取得了快速进展。表1总结了利用这项技术诊断各种疾病的代表性研究[19],[20],[21],[22]。此外,不同类型的传感器为识别和诊断不同疾病提供了多种可能性。目前,包括薄膜气体传感器[23]、表面声波传感器[24]、碳纳米管基传感器[25]、电化学(EC)传感器[26]和金属氧化物半导体(MOS)传感器[27]在内的多种传感器已在呼吸分析中得到验证,每种传感器都表现出不同的性能特点。通过将多种传感器类型集成到多模态气体传感系统中,可以捕获更广泛的VOC特征谱[28]。这种方法提高了检测可靠性,并为开发便携式临床筛查工具奠定了基础。
在这项研究中,我们开发了一种结合了MOS、EC传感器和光电离检测器(PID)的多模态气体传感器阵列,利用了它们在高灵敏度、高特异性和对微量VOCs快速响应方面的优势。这种组合不仅扩大了检测范围,还提高了系统识别与食管癌相关的VOCs模式的能力,显著提高了检测准确性。为了解决基线漂移、环境干扰和冗余信息等问题,我们设计了一种新的数据处理流程。该流程基于统计和曲线拟合特性提取多尺度特征,有效抑制了噪声,同时保留了与疾病相关的关键信息。在此基础上,我们构建了一个残差神经网络分类模型。该模型实现了自动化的层次化特征学习,优化了特征表示和分类性能,并显示出比传统机器学习方法更优越的结果。这种方法促进了从实验室仪器向便携式临床筛查工具的转变,为食管癌的早期检测提供了可行的解决方案。凭借其便携性、低成本和可扩展性,该系统在大规模筛查应用中具有巨大潜力,有望显著提高早期检测率和患者预后,代表了无创呼吸分析在癌症诊断方面的重大突破。

研究人群

本研究包括68名确诊为食管癌的患者和52名健康对照组,所有参与者均来自浙江大学Sir Run Run Shaw医院。食管癌组的纳入标准如下:(I) 通过组织病理学和内镜检查确诊为食管癌(所有病例均为食管鳞状细胞癌),具有明确的TNM分期;(II) 未接受过任何癌症治疗,包括手术、放疗或化疗;(III) 无活动性感染,

基于多模态传感器的呼吸分析仪的构建

图3中的示意图展示了呼吸分析系统和食管癌的诊断策略。当人类呼出样本被引入呼吸分析仪时,自动数据采集芯片会实时记录传感器响应值。经过特征提取和优化后的测量响应数据用于构建食管癌的分类模型。
图4展示了呼出分析仪的测试室及其布局

结论

本研究成功开发并验证了一种基于多模态气体传感器阵列的呼吸分析系统,结合了机器学习技术用于食管癌的无创诊断。该系统由MOS、EC和PID气体传感器组成。其支持硬件包括流量控制模块、密封测试室、自动采样系统和实时数据传输模块。这种设计支持标准化的呼出呼吸样本收集和分析。

数据和材料的可用性

与本研究相关的数据可应要求提供,以便相关方获取进一步研究所需的信息。

作者贡献声明

任宇克:撰写——原始草稿,方法学部分。罗饶军:撰写——审阅与编辑,资金筹集。王飞:撰写——审阅与编辑。朱子怡:撰写——审阅与编辑,资金筹集。吕国军:撰写——审阅与编辑。崔海斌:撰写——审阅与编辑。

伦理声明

本研究得到了浙江大学附属Sir Run Run Shaw医院医学伦理委员会的批准(批准编号:2023-0488;接受编号:2023-768-01)。所有参与者均同意参与研究并签署了知情同意书。本研究遵循《赫尔辛基宣言》(2013年修订版)进行。
在准备这项工作时,作者使用了ChatGPT(OpenAI)来提高部分内容的语言清晰度和流畅性

利益冲突声明

作者声明没有已知的利益冲突或个人关系可能影响本文所述的工作。

致谢

本研究得到了浙江省自然科学基金项目LTGY24H160013)的财政支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号