《Analytical Chemistry》:Evaluating Batch Correction Methods for Large-Scale Mass Spectrometry Imaging of Heterogeneous Tissues
编辑推荐:
本文系统评估了四种批次校正方法(SERRF、WaveICA、ComBat、NormAE)在基质辅助激光解吸电离(MALDI)质谱成像(MSI)中的应用,强调需结合单变量与多变量分析,并采用像素级评估策略以保留空间异质性,为大规模临床前及临床研究提供了重要的数据质量控制参考。
研究背景与核心挑战
质谱成像(Mass Spectrometry Imaging, MSI)是一种基于探针的表面分析技术,能够以逐点光栅扫描的方式提供高空间分辨率、高度多重化的表面化学组成信息。在生物医学领域,该技术主要通过基质辅助激光解吸电离(Matrix-Assisted Laser Desorption Ionization, MALDI)和解吸电喷雾电离(Desorption Electrospray Ionization, DESI)两种模式实现生物样本的表面分析。然而,MSI面临一个根本性挑战:如何区分检测到的离子强度波动中,哪些源于样本分子组成的真实生物学变异,哪些源于技术因素引起的"批次效应"(Batch Effects)。
批次效应是指与样本真实分子组成变异无关,而由实验条件、仪器状态或处理流程差异引起的系统性信号波动。这些技术因素广泛存在于样本处理、制备、物理分析以及气相离子的传输、操控和检测等各个环节。由于MSI采用顺序采集方式,每个像素/质谱图对在独特的时间点获取,这使得批次效应可能在多个层级显现:像素间批次(如图像梯度、信号残留)、实验间批次(同一组织切片的所有像素)以及载玻片间批次(跨越多张玻片的研究)。特别是在载玻片间和运行间层级,批次效应极易与重要的生物学条件混淆——例如,若某生物学条件的样本全部置于同一玻片,则条件间差异将与玻片间变异无法区分。因此,严谨的实验设计(如样本随机化放置)与数据后处理校正至关重要。
MSI批次校正的独特难题
与其他组学领域(如代谢组学、转录组学)相比,MSI数据的批次校正面临额外挑战。首先,MSI具有空间维度,必须保留样本内部预期的强度波动(即空间异质性),这与要求样本均一化的传统批次校正方法存在根本冲突。其次,MSI无法像液相色谱-质谱联用那样随机引入质量控制(Quality Control, QC)样本,也无法实现像二次离子质谱(Secondary Ion Mass Spectrometry, SIMS)那样的完全像素级随机化采集。现有的批次校正方法按监督程度可分为:仅需批次标签的方法(如NormAE、ComBat、limma、MnnCorrect)、需批次标签和样本类型标签的方法(如ComBat with covariates、scMerge、scGene),以及依赖时间戳的方法(如BATMAN、GPfates、WaveICA)。其中,WaveICA假设通过随机进样将生物学变异置于高频成分,而技术变异位于低频,但这一假设在MSI中不成立,因为相邻像素通常来自同一样本,且无法随机插入QC样本。
研究设计与方法体系
本研究设计了一个大规模MSI实验,涵盖10张载玻片、历时约10天的数据采集,包含121个生物样本:10个细胞团块(Cell Pellet, CP)连续切片、10个患者来源异种移植瘤(Patient-Derived Xenograft, PDX)连续切片作为QC样本,以及101个来自PDX组织、患者活检和额外细胞团块的样本。所有样本经9-氨基吖啶(9-Aminoacridine, 9AA)基质喷雾处理后,使用timsTOF flex仪器在负离子模式下以50×50 μm像素间距采集,质荷比(m/z)范围50-1200。
研究评估了四种代表性批次校正方法:
SERRF:基于随机森林的回归模型,使用批次标签和QC样本学习系统性误差并进行校正。研究将其原始R代码改写为Python版本以处理大于500 MB的数据集,并增加了模型保存功能以便校正独立样本。
WaveICA 2.0:利用小波变换独立成分分析分离低频批次效应与高频生物学变异,在RStudio中实现。
ComBat:采用参数化经验贝叶斯框架调整批次间均值和方差差异,使用Python包neuroCombat实现,仅以批次编号为协变量。
NormAE:基于自编码器的深度学习方法,通过重构误差去除批次效应,需将数据编码为QC像素和样本像素进行训练。
数据预处理包括线性插值重分箱(0.0008 Da bin宽度)、基于余弦相似度k-means聚类(k=3)的组织/背景分割,以及从联合数据立方体中选取前1000个最强峰。后续分析分别构建了仅含CP的数据立方体(17,356像素)和仅含PDX的数据立方体(45,254像素)。
全研究数据的多变量分析
对全部10张玻片构建的拼接数据立方体进行k-means聚类(k=12)显示,PDX技术重复样本(第一列)和CP控制样本(第二列)在不同玻片间表现出高度一致性,主要聚为特定簇(PDX为簇2和4,CP为簇5)。初看之下,这种分割似乎成功捕捉了主要生物学差异而未受批次效应干扰。然而,在包含多患者、多器官、多组织的大型MSI数据集中,控制样本的批次效应变异可能远小于整体生物学变异,因此即使存在显著批次效应,控制样本像素仍可能因彼此相似度高而聚类在一起。这种"掩盖效应"意味着简单的聚类分析无法排除或轻松识别批次效应的存在。
细胞团块材料的深度解析
为揭示被整体分析掩盖的批次效应,研究对均一化制备的CP控制样本进行了单独分析。主成分分析(Principal Component Analysis, PCA)第一主成分(PC1)得分图像清晰显示了随采集时间(玻片1至10)变化的信号梯度,表明存在显著的 slide-to-slide 批次效应。令人意外的是,常用的校正策略——总离子流(Total Ion Current, TIC)归一化、L2归一化、z-score标准化和g-log方差稳定化——不仅未能消除批次效应,反而在PC1-PC2散点图中增大了批次间的分离程度。这与近期Huang等人的研究结论不同,后者发现TIC归一化足以通过PCA区分不同均质样本类型,但该研究仅考虑样本类型的平均谱而非像素级分析。
单离子图像的小提琴图分析揭示了批次效应的离子特异性:谷氨酰胺(m/z 145.0616, [M-H])和谷氨酸(m/z 146.0456, M)的批次间中位数和四分位距(Interquartile Range, IQR)相对稳定,而琥珀酸(m/z 152.9960, [M+Cl])、硫酸根(m/z 96.9600, [M+H])、花生四烯酸(m/z 303.2320, [M-H])和磷脂酰乙醇胺PE 38:3(m/z 768.5552, [M-H])在前三个批次显示强度中位数急剧升高,随后呈下降趋势,且IQR波动显著。TIC和L2归一化虽能使部分离子的图像分布中位数接近组中位数,但无法均衡所有离子的中位数,也未能标准化IQR,凸显了组织水平与像素水平分析的差异。
四种批次校正方法的性能评估
应用四种高级批次校正方法后,PCA和t-SNE(t-Distributed Stochastic Neighbor Embedding)分析显示了不同的校正特征:
SERRF:PC1解释方差降至约84%,源于其自缩放步骤和对相关峰方差的归一化。校正后数据未显示CP样本的内部异质性,符合其假设QC样本均一化的设计原则。PC散点图中批次点云分布最为紧密,表明批次对齐效果最佳。然而,SERRF将所有强度值映射至约10的恒定水平,压缩了动态范围。
WaveICA:保留了CP样本的部分内部异质性,符合其保留高频生物学变异的原理。但PC散点图显示批次间仍存在分离,提示批次效应包含高频成分,超出其校正能力。
ComBat:同样保留了CP样本的空间异质性结构,因其旨在对齐批次间的均值和方差分布,同时保留样本内部方差。PC散点图显示批次成功对齐,且校正后均值与原始均值完美映射,批次间方差降低数个数量级。
NormAE:表现出"过校正"特征,完全消除了CP样本的内部异质性结构,且拉伸了图像分布的方差。由于其自编码器的"黑箱"特性,难以推断变异来源。
单离子水平分析证实,所有四种方法均成功对齐了图像分布的第一和第二矩(中位数和IQR)。SERRF对琥珀酸、硫酸根、花生四烯酸和PE 38:3的方差有显著压缩,但对谷氨酰胺和谷氨酸保持与原始数据相似的分布形状。WaveICA和ComBat均保持了原始数据图像分布的形状,表明空间信息在校正后得以保留。WaveICA对空间特征的保留表明这些特征属于高频变化,而ComBat因对所有像素进行同等变换,自然保留了批次内的特征。
PDX组织切片的校正验证
为评估方法在高度异质性样本中的表现,研究对PDX技术重复样本进行了相同分析。原始数据的t-SNE RGB图像显示前两个样本与其余样本存在显著差异,表明存在强烈批次效应。校正结果显示:
WaveICA:未能消除前两个样本与其余样本的分离,其高频校正原理可能不适用于此场景中的批次效应。
NormAE:完全移除了所有空间结构,表明过度校正,再次凸显其可解释性局限。
SERRF和ComBat:均成功将所有10个批次的数据协调一致,且保留了PDX样本的空间异质性。值得注意的是,SERRF在CP样本中因训练数据假设而消除的空间结构,在PDX样本中得以保留,因为PDX数据不参与随机森林训练。
小提琴图和散点图分析进一步量化显示:SERRF将各批次均值调整至大致相同常数,最小化批次间变异;WaveICA对硫酸根等离子校正效果较好,但批次间方差未显著降低;ComBat在降低批次间变异的同时完美保持原始均值;NormAE则增加组校正均值并拉伸方差。
方法学总结与全研究重分析
研究依据校正效果、是否需要训练数据、是否确定性算法等标准对四种方法进行了系统比较。尽管不存在完美方法,ComBat在本研究示例中表现最为均衡:无需均一化QC样本假设、保留空间异质性、完美对齐批次均值和方差、且计算高效。研究强调,选择校正方法时需考虑:校正后强度与"全局均值"的接近程度未必是最佳标准(如低质量数据集可能拉低均值);像SERRF这类强大的方法需要标记且假设均一的QC样本,凸显了MSI研究中适当QC样本的重要性。
基于上述评估,研究采用ComBat对整个数据集(包括人类活检数据)进行批次校正,并应用k-means聚类(k=4,余弦距离)和PCA。结果显示,未校正数据中PC2上分离的玻片1和玻片8部分像素,在校正后与其他玻片数据重叠,证实了批次校正对于多玻片MSI研究数据整合的必要性。
结论与展望
本研究确立了MSI批次效应评估需结合单变量与多变量分析的方法学原则,证明大规模MSI研究需要信号强度缩放、归一化与成像特征及异质性的仔细审查相结合。这种缩放和归一化可能因离子和玻片而异,未经校正的多玻片数据无法相互比较,可能使部分数据集失去应用价值。通过对SERRF、WaveICA、ComBat和NormAE四种代表性算法的系统评估,研究表明结合实验特征标记与复杂缩放策略对于10玻片、10天MSI研究的数据校正至关重要,其中ComBat在本案例中表现出最佳的易用性和实用性。
研究特别强调必须认识到空间分辨质谱数据的独特性,采用像素级评估和校正策略。尽管如此,校正前后特定离子间倍比变化的测量和结果解读将存在显著差异。作者呼吁进一步发展MSI特异性批次校正方法,充分考虑质谱成像仪器性能的独特特征,推动该新兴领域的深入研究。