中医是一种在中医理论指导下用于预防和治疗的天然药物。凭借其独特的药用特性、辨证论治原则和整体观念,中医在应对重大公共卫生挑战方面展现出巨大潜力[[1], [2], [3]]。中药配方由多种中药根据特定的配伍原则和剂量组成,通过协同作用增强治疗效果。然而,中药配方的化学组成非常复杂,包含数百甚至数千种成分,这些成分的浓度和极性差异很大。此外,这些成分之间的复杂相互作用(包括潜在的物理或化学反应)可能影响溶解度、稳定性和生物活性,使得成分分析变得困难[[4], [5], [6], [7], [8]]。高分辨率质谱(HRMS)在阐明中药配方的化学组成方面发挥着关键作用,并有助于对其药理活性成分进行彻底分析[9,10]。当前研究的主要挑战包括在数据采集过程中同时检测高丰度和低丰度化合物。研究人员还致力于基于数据依赖性采集(DDA)和数据独立性采集(DIA)模式开发高灵敏度策略,以及改进大规模质谱数据的高通量和准确注释。
液相色谱-质谱(LC-MS)因其出色的分辨率、灵敏度和通量而被用于复杂基质中化合物的定性和定量分析。然而,单维色谱分离存在局限性,如分辨率不足、选择性和峰容量有限,这些因素常常导致同洗脱现象,使得难以区分异构体。目前,二维液相色谱(2D-LC)为解决这些挑战提供了有力支持[11,12]。离线2D-LC具有显著的灵活性和适应性,而在线2D-LC则具备自动化操作、高通量、优异的重现性和出色的正交分离能力,有效缓解了同洗脱问题[13], [14], [15]]。与质谱联用可提高灵敏度和通量。2D-LC的多种操作模式为分析中药配方提供了灵活的优化策略。心切模式通过将第一维选定的组分转移到第二维进行进一步分离,从而快速分析目标化合物[[16], [17], [18], [19]]。相比之下,综合模式将所有组分连续转移到第二维,实现正交分离,提高了峰容量、通量和灵敏度,非常适合复杂样品的详细分析[17,20]。在质谱分析中,结合使用DDA和DIA模式可以增强高丰度和低丰度化合物的注释效果。由动态排除、背景排除和优选离子列表(PILs)指导的DDA采集与窗口化DIA采集相结合,提高了数据质量并扩展了注释结果[21,22]。分子网络技术将质谱数据转化为节点和边的可视化网络,映射化合物之间的结构关联,实现已知和未知化合物的快速聚类和结构预测[23]。质量缺陷过滤(MDF)通过分析化合物的质量缺陷谱型来过滤数据,减少冗余并高效提取匹配离子。近年来,MDF不断发展和完善,显著提高了在复杂样品中检测目标化合物的灵敏度和准确性[24,25]。然而,在中药配方分析中,传统的MDF难以适应多种化学类别,导致分析工作量增加。因此,开发一种快速高效的化合物全面表征工作流程具有重要的应用潜力。
基于人工神经网络的深度学习算法推动了精准医学、疾病诊断、预防和药物开发[[26], [27], [28]]。在质谱分析中,深度学习被应用于采集前、采集后和后处理阶段,以满足智能化、高效性和灵敏性的要求。这种方法增强了样品成分的详细表征和注释[29,30]。因此,在研究小组初步工作的基础上,开发了一种基于全扫描质谱(MS)数据的深度学习辅助智能分类工具,并设计了多类别PILs,以迭代优化采集和验证工作流程,从而提高了效率并简化了数据处理[31]。
“香菊乳宁”胶囊(XRC)是一种含有七种中药的中药配方:蔷薇花(Rosae Chinensis Flos)、香附子(Cyperi Rhizoma)、 Corydalis Rhizoma、丹参根及根茎(Salviae Miltiorrhizae Radix et Rhizoma)、Prunellae Spica、柑橘叶(Citrus reticulata Blanco)和白附子(Rhizoma Bolbostemmatis)。它主要用于治疗乳腺增生及相关炎症和疼痛。XRC含有多种化学成分,包括酚酸、萜类、黄酮类和生物碱。然而,现有研究中对其化学成分的全面表征仍较为缺乏[32]。
本研究提出了一种基于深度学习辅助分类、优选离子列表指导采集和分子网络可视化分析(DPM)的工作流程,结合多维数据分析,并采用在线二维液相色谱四极杆飞行时间质谱(2DLC-Q-TOF-MS),对XRC中的复杂成分进行了全面表征和注释(图1)。首先,开发了一个全面的在线2DLC-Q-TOF-MS分析系统,并利用基于深度学习的智能MDF技术生成了几个PILs。随后,采用基于DDA的逐步迭代采集方法获取这九个PILs。然后使用基于窗口的DIA采集方法覆盖全部离子范围。最后,基于PILs的智能分类分子网络用于简化检测成分的可视化和结构注释。此外,通过整合特征诊断离子(CDIs)和中性丢失碎片(NLs)作为核心识别线索,以及在线和本地数据库,实现了高效、高置信度的注释。这种智能工作流程为中药配方中化学成分的快速准确表征提供了一种高效可靠的方法。