《Microchemical Journal》:MDFocus+: a novel UHPLC-HRMS data filtering software for rapid screening and characterization of chemical constituents, with Salvia miltiorrhiza Bunge as an example
编辑推荐:
杜振|杜海玲|王亚静|任梦鑫|王璐瑶|秦峰|熊志立沈阳药科大学药学院,中国辽宁省本溪市高新技术开发区华拓路26号,邮编117004摘要由于天然产物成分的结构复杂性和化学多样性,通过质谱技术对其进行全面表征仍然具有挑战性,这突显了对质谱数据有效后处理的必要性。为了解决这一需求,开发
杜振|杜海玲|王亚静|任梦鑫|王璐瑶|秦峰|熊志立
沈阳药科大学药学院,中国辽宁省本溪市高新技术开发区华拓路26号,邮编117004
摘要
由于天然产物成分的结构复杂性和化学多样性,通过质谱技术对其进行全面表征仍然具有挑战性,这突显了对质谱数据有效后处理的必要性。为了解决这一需求,开发了MDFocus+这一新型的一体化软件平台,它具有用户友好的图形用户界面,用于天然产物分析中的LC-MS数据后处理。与传统后处理工具不同,MDFocus+将用户定义的多边形质量缺陷过滤(MDF)与可视化输出相结合,在单一的可视化界面中整合了MDF、诊断离子过滤(DIF)和中性损失过滤(NLF),并自动化了前体离子与MS/MS数据的关联以进行结构注释。通过成功应用于丹参(Salvia miltiorrhiza)中酚酸(PAs)的分析,证明了MDFocus+的有效性。结果分别为单体、二聚体、三聚体和四聚体构建了多边形MDF窗口,实现了初步的目标筛选。值得注意的是,仅多边形MDF就分别去除了80.46%、95.41%、93.06%和96.59%的非目标前体离子,显著减少了假阳性干扰。此外,通过DIF和NLF的精细过滤,结合基于特征碎片行为和碎片离子丰度模式的知识引导识别策略,能够可靠地区分PA异构体。最终共鉴定了120种PA,其中包括5种此前未报道的化合物。总之,MDFocus+为LC-MS数据分析中天然产物的高效筛选和表征提供了一个强大且可扩展的开源解决方案。
引言
超高性能液相色谱与高分辨率质谱联用(UHPLC-HRMS)是阐明复杂混合物的强大工具,能够实现精确的质量测量和众多成分的初步分子式分配[1]、[2]。然而,化学复杂性、内源性干扰、较差的碎片化以及低丰度成分仍然阻碍了快速准确的化合物鉴定。为了加速UHPLC-HRMS数据处理,已经开发了几种后分析策略,包括质量缺陷过滤(MDF)、诊断离子过滤(DIF)和中性损失过滤(NLF)[3]、[4]、[5]。其中,MDF是一种基于精确质量和名义质量差异筛选结构同源化合物的有效数据挖掘策略[6]。尽管这些算法已被纳入多个商业平台,但其应用仍受到算法灵活性、数据依赖性、计算成本和可访问性等问题的限制[7]、[8]、[9]。此外,尽管多边形MDF可以提高筛选特异性,但其基于Excel软件的实现仍然劳动密集且缺乏前体离子与MS/MS光谱之间的直接关联[10]、[11]。这些限制凸显了需要一种更加集成和自动化的策略以实现快速准确的化合物注释。
丹参(Salvia miltiorrhiza)Bunge以其丰富的生物活性化合物组成而著称,尤其是酚酸(PAs)和丹参酮,这些成分对其治疗效果尤其是心血管和脑血管健康有显著贡献[12]。PA是S. miltiorrhiza的主要生物活性成分之一,由于它们多样的健康益处,在植物次级代谢领域受到了广泛关注[12]。然而,由于单体组成(如咖啡酸和丹参素)、化学键类型、取代基模式和聚合程度的不同,PA表现出高度复杂和多样的结构[13]。这种固有的多样性使得对其生物活性成分的深入探索尤为具有挑战性。
尽管有诊断离子搜索、数据库匹配、分子网络和深度学习等先进方法,但PA的定性分析仍然具有挑战性[14]、[15]。众多异构体、相似的碎片行为以及新型类似物的有限光谱库覆盖范围常常阻碍了准确鉴定并增加了假阳性注释[16]、[17]。因此,在基于UHPLC-HRMS的PA分析中,有效的异构体区分、假阳性减少和注释置信度的提高仍然是主要目标[18]、[19]。在这种情况下,碎片离子的相对强度可能为区分结构相似的PA提供有价值的补充信息[18]、[20]、[21]。
为了解决这些挑战,我们开发了MDFocus+,这是一个用于天然产物分析中UHPLC-HRMS数据后处理的集成且用户友好的软件平台。具体而言,本研究旨在开发一个快速数据筛选的集成平台,通过组合过滤和自动MS/MS关联来提高结构相关PA的注释置信度,并为复杂天然产物系统中的PA表征和异构体区分建立实用策略。
部分摘录
材料
HPLC级乙腈、乙醇和甲醇购自Tedia(美国俄亥俄州费尔菲尔德)。甲酸购自Dikma Technologies Co., Ltd.(中国上海)。纯化水购自Wahaha Co., Ltd.(中国杭州)。共购买了6种参考标准品,包括丹参素(DST241010–015)、石竹酸(DST250424–028)、迷迭香酸(DST220301)、丹参酚A(DSTDD000801)和咖啡酸(DSTDK001301),均由成都德赛特生物科技有限公司提供
根据聚合程度,PA可以分为单体、二聚体、三聚体、四聚体等类别[18]。单体PA最常见的结构框架是羟基苯甲酸和羟基肉桂酸骨架。相比之下,聚合PA的主要结构单元是2-苯基二氢苯并呋喃和反式茚骨架[18]、[19]。先前的研究发现,S.
结论
总之,MDFocus+在UHPLC-HRMS数据的处理和分析方面代表了重大进展,特别是在天然产物领域。这一开源平台通过实施知识引导的结构表征策略,弥合了高通量分析筛选与可靠数据解释之间的差距。MDFocus+通过多窗口可视化方式,实现了目标化合物的准确筛选和质谱数据中复杂信号的高效处理,
杜振:撰写——原始草案、可视化、验证、方法学、数据管理。杜海玲:方法学、数据管理。王亚静:数据管理。任梦鑫:验证、软件。王璐瑶:方法学。秦峰:方法学、数据管理。熊志立:撰写——审阅与编辑、监督、项目管理、资金获取。
作者声明他们没有已知的可能会影响本文所述工作的财务利益或个人关系。
本工作得到了国家自然科学基金(编号:82174235和81773694)的支持。