大规模质谱成像数据批次效应校正方法评估：异质性组织研究的新策略

《Analytical Chemistry》：Evaluating Batch Correction Methods for Large-Scale Mass Spectrometry Imaging of Heterogeneous Tissues

【字体：大中小】 时间：2026年01月27日 来源：Analytical Chemistry 6.7

编辑推荐：

　　本文系统评估了四种批次校正方法（SERRF、WaveICA、ComBat、NormAE）在基质辅助激光解吸电离（MALDI）质谱成像（MSI）中的应用，强调需结合单变量与多变量分析，并采用像素级评估策略以保留空间异质性，为大规模临床前及临床研究提供了重要的数据质量控制参考。

研究背景与核心挑战

质谱成像（Mass Spectrometry Imaging, MSI）是一种基于探针的表面分析技术，能够以逐点光栅扫描的方式提供高空间分辨率、高度多重化的表面化学组成信息。在生物医学领域，该技术主要通过基质辅助激光解吸电离（Matrix-Assisted Laser Desorption Ionization, MALDI）和解吸电喷雾电离（Desorption Electrospray Ionization, DESI）两种模式实现生物样本的表面分析。然而，MSI面临一个根本性挑战：如何区分检测到的离子强度波动中，哪些源于样本分子组成的真实生物学变异，哪些源于技术因素引起的"批次效应"（Batch Effects）。

批次效应是指与样本真实分子组成变异无关，而由实验条件、仪器状态或处理流程差异引起的系统性信号波动。这些技术因素广泛存在于样本处理、制备、物理分析以及气相离子的传输、操控和检测等各个环节。由于MSI采用顺序采集方式，每个像素/质谱图对在独特的时间点获取，这使得批次效应可能在多个层级显现：像素间批次（如图像梯度、信号残留）、实验间批次（同一组织切片的所有像素）以及载玻片间批次（跨越多张玻片的研究）。特别是在载玻片间和运行间层级，批次效应极易与重要的生物学条件混淆——例如，若某生物学条件的样本全部置于同一玻片，则条件间差异将与玻片间变异无法区分。因此，严谨的实验设计（如样本随机化放置）与数据后处理校正至关重要。

MSI批次校正的独特难题

与其他组学领域（如代谢组学、转录组学）相比，MSI数据的批次校正面临额外挑战。首先，MSI具有空间维度，必须保留样本内部预期的强度波动（即空间异质性），这与要求样本均一化的传统批次校正方法存在根本冲突。其次，MSI无法像液相色谱-质谱联用那样随机引入质量控制（Quality Control, QC）样本，也无法实现像二次离子质谱（Secondary Ion Mass Spectrometry, SIMS）那样的完全像素级随机化采集。现有的批次校正方法按监督程度可分为：仅需批次标签的方法（如NormAE、ComBat、limma、MnnCorrect）、需批次标签和样本类型标签的方法（如ComBat with covariates、scMerge、scGene），以及依赖时间戳的方法（如BATMAN、GPfates、WaveICA）。其中，WaveICA假设通过随机进样将生物学变异置于高频成分，而技术变异位于低频，但这一假设在MSI中不成立，因为相邻像素通常来自同一样本，且无法随机插入QC样本。

研究设计与方法体系

本研究设计了一个大规模MSI实验，涵盖10张载玻片、历时约10天的数据采集，包含121个生物样本：10个细胞团块（Cell Pellet, CP）连续切片、10个患者来源异种移植瘤（Patient-Derived Xenograft, PDX）连续切片作为QC样本，以及101个来自PDX组织、患者活检和额外细胞团块的样本。所有样本经9-氨基吖啶（9-Aminoacridine, 9AA）基质喷雾处理后，使用timsTOF flex仪器在负离子模式下以50×50 μm像素间距采集，质荷比（m/z）范围50-1200。

研究评估了四种代表性批次校正方法：

SERRF：基于随机森林的回归模型，使用批次标签和QC样本学习系统性误差并进行校正。研究将其原始R代码改写为Python版本以处理大于500 MB的数据集，并增加了模型保存功能以便校正独立样本。
WaveICA 2.0：利用小波变换独立成分分析分离低频批次效应与高频生物学变异，在RStudio中实现。
ComBat：采用参数化经验贝叶斯框架调整批次间均值和方差差异，使用Python包neuroCombat实现，仅以批次编号为协变量。
NormAE：基于自编码器的深度学习方法，通过重构误差去除批次效应，需将数据编码为QC像素和样本像素进行训练。

数据预处理包括线性插值重分箱（0.0008 Da bin宽度）、基于余弦相似度k-means聚类（k=3）的组织/背景分割，以及从联合数据立方体中选取前1000个最强峰。后续分析分别构建了仅含CP的数据立方体（17,356像素）和仅含PDX的数据立方体（45,254像素）。

全研究数据的多变量分析

对全部10张玻片构建的拼接数据立方体进行k-means聚类（k=12）显示，PDX技术重复样本（第一列）和CP控制样本（第二列）在不同玻片间表现出高度一致性，主要聚为特定簇（PDX为簇2和4，CP为簇5）。初看之下，这种分割似乎成功捕捉了主要生物学差异而未受批次效应干扰。然而，在包含多患者、多器官、多组织的大型MSI数据集中，控制样本的批次效应变异可能远小于整体生物学变异，因此即使存在显著批次效应，控制样本像素仍可能因彼此相似度高而聚类在一起。这种"掩盖效应"意味着简单的聚类分析无法排除或轻松识别批次效应的存在。

细胞团块材料的深度解析

为揭示被整体分析掩盖的批次效应，研究对均一化制备的CP控制样本进行了单独分析。主成分分析（Principal Component Analysis, PCA）第一主成分（PC1）得分图像清晰显示了随采集时间（玻片1至10）变化的信号梯度，表明存在显著的 slide-to-slide 批次效应。令人意外的是，常用的校正策略——总离子流（Total Ion Current, TIC）归一化、L2归一化、z-score标准化和g-log方差稳定化——不仅未能消除批次效应，反而在PC1-PC2散点图中增大了批次间的分离程度。这与近期Huang等人的研究结论不同，后者发现TIC归一化足以通过PCA区分不同均质样本类型，但该研究仅考虑样本类型的平均谱而非像素级分析。

单离子图像的小提琴图分析揭示了批次效应的离子特异性：谷氨酰胺（m/z 145.0616, [M-H]^{）和谷氨酸（m/z 146.0456, M^{）的批次间中位数和四分位距（Interquartile Range, IQR）相对稳定，而琥珀酸（m/z 152.9960, [M+Cl]^{）、硫酸根（m/z 96.9600, [M+H]^{）、花生四烯酸（m/z 303.2320, [M-H]^{）和磷脂酰乙醇胺PE 38:3（m/z 768.5552, [M-H]^{）在前三个批次显示强度中位数急剧升高，随后呈下降趋势，且IQR波动显著。TIC和L2归一化虽能使部分离子的图像分布中位数接近组中位数，但无法均衡所有离子的中位数，也未能标准化IQR，凸显了组织水平与像素水平分析的差异。}}}}}}

四种批次校正方法的性能评估

应用四种高级批次校正方法后，PCA和t-SNE（t-Distributed Stochastic Neighbor Embedding）分析显示了不同的校正特征：

SERRF：PC1解释方差降至约84%，源于其自缩放步骤和对相关峰方差的归一化。校正后数据未显示CP样本的内部异质性，符合其假设QC样本均一化的设计原则。PC散点图中批次点云分布最为紧密，表明批次对齐效果最佳。然而，SERRF将所有强度值映射至约10^{的恒定水平，压缩了动态范围。}
WaveICA：保留了CP样本的部分内部异质性，符合其保留高频生物学变异的原理。但PC散点图显示批次间仍存在分离，提示批次效应包含高频成分，超出其校正能力。
ComBat：同样保留了CP样本的空间异质性结构，因其旨在对齐批次间的均值和方差分布，同时保留样本内部方差。PC散点图显示批次成功对齐，且校正后均值与原始均值完美映射，批次间方差降低数个数量级。
NormAE：表现出"过校正"特征，完全消除了CP样本的内部异质性结构，且拉伸了图像分布的方差。由于其自编码器的"黑箱"特性，难以推断变异来源。

单离子水平分析证实，所有四种方法均成功对齐了图像分布的第一和第二矩（中位数和IQR）。SERRF对琥珀酸、硫酸根、花生四烯酸和PE 38:3的方差有显著压缩，但对谷氨酰胺和谷氨酸保持与原始数据相似的分布形状。WaveICA和ComBat均保持了原始数据图像分布的形状，表明空间信息在校正后得以保留。WaveICA对空间特征的保留表明这些特征属于高频变化，而ComBat因对所有像素进行同等变换，自然保留了批次内的特征。

PDX组织切片的校正验证

为评估方法在高度异质性样本中的表现，研究对PDX技术重复样本进行了相同分析。原始数据的t-SNE RGB图像显示前两个样本与其余样本存在显著差异，表明存在强烈批次效应。校正结果显示：

WaveICA：未能消除前两个样本与其余样本的分离，其高频校正原理可能不适用于此场景中的批次效应。
NormAE：完全移除了所有空间结构，表明过度校正，再次凸显其可解释性局限。
SERRF和ComBat：均成功将所有10个批次的数据协调一致，且保留了PDX样本的空间异质性。值得注意的是，SERRF在CP样本中因训练数据假设而消除的空间结构，在PDX样本中得以保留，因为PDX数据不参与随机森林训练。

小提琴图和散点图分析进一步量化显示：SERRF将各批次均值调整至大致相同常数，最小化批次间变异；WaveICA对硫酸根等离子校正效果较好，但批次间方差未显著降低；ComBat在降低批次间变异的同时完美保持原始均值；NormAE则增加组校正均值并拉伸方差。

方法学总结与全研究重分析

研究依据校正效果、是否需要训练数据、是否确定性算法等标准对四种方法进行了系统比较。尽管不存在完美方法，ComBat在本研究示例中表现最为均衡：无需均一化QC样本假设、保留空间异质性、完美对齐批次均值和方差、且计算高效。研究强调，选择校正方法时需考虑：校正后强度与"全局均值"的接近程度未必是最佳标准（如低质量数据集可能拉低均值）；像SERRF这类强大的方法需要标记且假设均一的QC样本，凸显了MSI研究中适当QC样本的重要性。

基于上述评估，研究采用ComBat对整个数据集（包括人类活检数据）进行批次校正，并应用k-means聚类（k=4，余弦距离）和PCA。结果显示，未校正数据中PC2上分离的玻片1和玻片8部分像素，在校正后与其他玻片数据重叠，证实了批次校正对于多玻片MSI研究数据整合的必要性。

结论与展望

本研究确立了MSI批次效应评估需结合单变量与多变量分析的方法学原则，证明大规模MSI研究需要信号强度缩放、归一化与成像特征及异质性的仔细审查相结合。这种缩放和归一化可能因离子和玻片而异，未经校正的多玻片数据无法相互比较，可能使部分数据集失去应用价值。通过对SERRF、WaveICA、ComBat和NormAE四种代表性算法的系统评估，研究表明结合实验特征标记与复杂缩放策略对于10玻片、10天MSI研究的数据校正至关重要，其中ComBat在本案例中表现出最佳的易用性和实用性。

研究特别强调必须认识到空间分辨质谱数据的独特性，采用像素级评估和校正策略。尽管如此，校正前后特定离子间倍比变化的测量和结果解读将存在显著差异。作者呼吁进一步发展MSI特异性批次校正方法，充分考虑质谱成像仪器性能的独特特征，推动该新兴领域的深入研究。

热点排行