基于可解释随机森林(Random Forest, RF)机器学习分析的双迹二维相关傅里叶变换红外光谱(Two-Trace Two-Dimensional Correlation Fourier Transform Infrared Spectroscopy, 2T2D-COS FTIR)用于结直肠前病变多层生化表征
《Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy》:Interpretable Random Forest (machine learning) analysis of two-trace 2D-COS FTIR spectra for multilayer biochemical characterization of colorectal precancerous
编辑推荐:
本研究通过将双迹二维傅里叶变换红外光谱(2T2D-FTIR)与随机森林(RF)机器学习相结合,探究结直肠癌前病变相关的生化改变在黏膜层、黏膜下层及肌层的分布特征。2T2D-FTIR分析显著提升了光谱分辨率,能够清晰区分传统一维傅里叶变换红外光谱中难以辨别的重叠
本研究通过将双迹二维傅里叶变换红外光谱(2T2D-FTIR)与随机森林(RF)机器学习相结合,探究结直肠癌前病变相关的生化改变在黏膜层、黏膜下层及肌层的分布特征。2T2D-FTIR分析显著提升了光谱分辨率,能够清晰区分传统一维傅里叶变换红外光谱中难以辨别的重叠振动谱带。癌前组织表现出脂质相关CH2与CH3伸缩振动的显著降低,提示脂质代谢紊乱、脂质消耗增加及细胞膜重构;酰胺Ⅰ区的变化反映蛋白质二级结构的改变;指纹区的显著变化则对应代谢重编程、异常细胞增殖及DNA丰度升高。随机森林分类模型表现卓越,在各组织层中均实现准确率、精确率、召回率及特异性的完美表现。黏膜下层样本由单一主导光谱特征驱动实现完全可分,肌层样本因轻微生物学异质性仅需极少的额外复杂度即可区分。生成的决策树叶片纯度达到100%,表明分类无歧义,凸显癌前光谱特征的强生物学一致性。综上,2T2D-FTIR光谱与机器学习的融合为探索结直肠癌分子改变提供了稳健可靠的框架,并支持其在高精度非侵入性诊断中的应用潜力。
研究背景方面,结直肠癌是全球第三大常见癌症及第二大癌症死因,多数患者确诊时已处于晚期,预后较差。现有临床金标准如结肠镜与组织病理学检查存在侵入性、成本高、耗时长及观察者间差异等问题,且形态学改变晚于分子水平变化,导致早期病变漏检率高。傅里叶变换红外光谱(Fourier Transform Infrared Spectroscopy, FTIR)作为快速、无标记、非破坏性的分子检测技术,可通过特征振动谱获取组织与体液的生化指纹,已在肿瘤鉴别中展现潜力,但传统一维光谱存在谱带重叠限制,难以捕捉细微生化差异。为此,研究人员将新兴的双迹二维相关光谱(Two-Trace Two-Dimensional Correlation Spectroscopy, 2T2D-COS)与可解释随机森林(Random Forest, RF)算法结合,旨在实现对结直肠正常与癌前组织的精准分层,并揭示多层组织的生化改变特征。该研究发表于《Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy》。
关键技术方法方面,研究人员采用C57BL/6小鼠构建结直肠息肉(Colorectal Polyps, CRP)模型,分为健康组(n=5)与病变组(n=10),按墨西哥官方动物实验规范(NOM-062-ZOO-1999)与生物废弃物处置规范(NOM-087-ECOL-1995)执行。采集结肠组织后,分别获取黏膜层、黏膜下层及肌层的一维FTIR光谱,并通过2T2D-COS处理获得同步与异步二维相关光谱以提升分辨率。随后构建随机森林分类模型,评估其在各组织层的分类性能,并结合决策树叶片纯度与特征重要性分析实现模型可解释性。
研究结果方面,第一部分为研究动物与伦理说明,实验经Escuela Militar de Medicina动物伦理与使用委员会批准,严格遵循规范执行。第二部分为结果与讨论,结果显示2T2D-FTIR可有效捕捉各层组织的细微生化变化:癌前组织脂质相关CH2与CH3伸缩振动(3000–2800 cm?1)显著降低,提示脂质代谢异常与膜重构;蛋白质酰胺Ⅰ区改变反映二级结构转变;指纹区变化对应代谢重编程、细胞增殖及核酸含量升高。随机森林在各层均实现完美分类指标,其中黏膜下层由单一主导特征驱动实现完全分离,肌层因轻微异质性仅需少量额外特征。决策树叶片纯度达100%,表明无分类歧义,验证了癌前光谱的高度一致性。第三部分为结论,2T2D-FTIR结合RF不仅克服了传统FTIR的光谱重叠局限,还实现了高灵敏度、高特异性的多层组织病变识别,为结直肠癌早期非侵入性诊断提供了可靠框架。第四部分为伦理审批、基金声明、作者贡献与利益冲突说明,本研究无外部资助,所有作者声明无相关利益冲突,并致谢Escuela Militar de Medicina兽医服务人员的支持。
讨论与结论翻译部分指出,双迹二维傅里叶变换红外光谱方法成功捕获结直肠各层组织的细微生化改变,癌前组织中脂质相关CH2与CH3伸缩振动的降低反映了脂质代谢改变与膜重构。同步与异步二维光谱的分辨率提升有效克服了传统一维FTIR的谱带重叠局限,实现正常与癌前组织的清晰区分。蛋白质相关谱带的变化揭示了二级结构重塑,指纹区谱带则体现了代谢重编程与核酸丰度升高。随机森林模型在各层均实现完美分类性能,且具备完全的决策树叶片纯度,证明了光谱特征的生物学一致性。该集成框架为结直肠癌的早期分子检测提供了一种高灵敏度、高特异性且成本可控的非侵入性诊断策略。