《JOURNAL OF MASS SPECTROMETRY》:A Convolutional Neural Network and Transfer Learning Approach for Accelerated Quantitative Mass Spectrometry Imaging
编辑推荐:
该研究提出一种利用卷积神经网络(Convolutional Neural Network, CNN)结合迁移学习策略加速定量质谱成像(quantitative Mass Spectrometry Imaging, qMSI)测量的新方法。现有qMSI流程耗时较
该研究提出一种利用卷积神经网络(Convolutional Neural Network, CNN)结合迁移学习策略加速定量质谱成像(quantitative Mass Spectrometry Imaging, qMSI)测量的新方法。现有qMSI流程耗时较长,包含大量特异性操作步骤易引入误差,且数据分析过程繁琐。研究人员旨在构建可复用的机器学习模型,以减少实验时间并降低结果变异性。该模型采用基于小样本离子图像的迁移学习训练方式,在已知分析物浓度条件下完成预训练,并可推广至同类型组织中对相同分子进行定量分析。该方法显著提升了分析速度,并在理论上降低了传统方法存在的批次间差异。研究人员利用已收集的质谱成像数据证实,该CNN模型能够在新样本中准确预测目标分析物的浓度。
该研究针对定量质谱成像(qMSI)流程耗时长、操作繁琐且易引入人为误差的瓶颈,由研究人员开发了一种基于卷积神经网络(CNN)与迁移学习的加速分析框架。qMSI是通过质谱技术在组织切片上实现分析物空间分布绝对定量的关键技术,但其依赖复杂的样本前处理、重复性的校准曲线构建及人工介入的数据处理,导致实验周期长且实验室间重现性差。为解决这一问题,研究人员提出利用深度学习模型自动提取离子图像特征,替代传统人工ROI选取与校准计算,从而简化工作流程。该研究以小鼠肝组织为模型,聚焦于关键代谢物谷胱甘肽(GSH)的定量,通过构建预训练CNN模型并结合迁移学习策略,实现了对新样本浓度的精准预测,证明了该方法在提升分析效率与减少变异方面的潜力。相关成果发表于《Journal of Mass Spectrometry》。
研究人员采用了几项关键技术方法:首先,构建了基于红外基质辅助激光解吸电喷雾电离(IR-MALDESI)的质谱成像平台,对喷涂了稳定同位素标记谷胱甘肽(13C215N-SIL-GSH)的小鼠肝组织切片进行数据采集,样本队列包含21个浓度梯度样本。其次,利用METASPACE数据库中的历史肝组织离子图像,通过旋转与翻转的数据增强技术构建了包含8万余张图像的预训练数据集。第三,设计了包含5个卷积层的CNN回归模型,采用均方误差(MSE)作为损失函数进行预训练。第四,实施冻结权重的迁移学习策略,锁定预训练模型的卷积层参数,仅重新训练新增的回归头,并在部分实验中尝试微调最后一层卷积层以优化性能。
3.1 基础模型预训练
研究人员利用来自METASPACE的历史肝组织离子图像数据集对基础CNN模型进行预训练。结果显示,训练集与验证集的损失及均方根误差(RMSE)同步下降并趋于收敛,表明模型有效学习了图像特征。模型在57个训练周期后达到最优,验证集RMSE为0.1928,归一化均方根误差(nRMSE)低至0.0078,证实了模型具备从离子图像中准确预测总离子强度的能力,为特征迁移奠定了坚实基础。
3.2 迁移学习训练
研究人员将预训练模型的全连接层替换为新的回归头,并锁定所有卷积层权重,仅在SIL-GSH校准曲线图像上进行训练。模型经过1891个周期训练后收敛,验证集RMSE为53.5834,nRMSE为0.0115。研究人员进一步尝试解冻最后一层卷积层进行微调,虽然训练集指标有所改善,但验证集性能反而下降,推测是由于数据集规模较小导致的过拟合现象。因此,最终选用未经过微调的迁移学习模型进行评估。
3.3 模型评估
在未参与训练的测试集上,该迁移学习模型表现出优异的预测能力,RMSE为125.5704,nRMSE为0.0269。通过对真实浓度与预测值进行线性回归分析,得到回归方程为y = 0.9777x,决定系数(R2)高达0.9925,表明模型在不同浓度梯度下均具有极高的预测准确度,验证了该方法用于qMSI定量分析的可行性。
3.4 未来工作
研究人员指出,当前工作仅为概念验证,未来可通过引入U-net图像分割架构实现体素级别的精细定量,从而解析药物在组织内的微观分布。此外,还需扩充校准曲线点、增加训练样本量并进行跨时间、跨稀释度的验证,同时计划将CNN模型结果与传统的qMSI方法进行系统比较,以进一步确立该方法的可靠性与适用范围。
4 结论
该研究成功展示了利用CNN结合迁移学习加速qMSI的可行性。该协议大幅简化了后续qMSI实验的样本制备流程,节省了时间并降低了变异性。通过在历史肝组织离子图像上预训练基础CNN模型,并利用已知浓度的标准品图像进行迁移学习特化,该模型能够在整个浓度范围内准确预测分析物浓度,为大规模qMSI研究提供了高效、标准化的新工具。