LUMIN:一种利用1D 1H NMR光谱进行自动混合物定量分析的新算法

《Analytica Chimica Acta》:LUMIN: A Novel Algorithm for Automated Mixture Quantification using 1D 1H NMR Spectra

【字体: 时间:2026年05月10日 来源:Analytica Chimica Acta 6

编辑推荐:

  ``Xinyuan Xie|Hongxu Zhang|Yingting Shi|Yuxia Jin|Kerui Fang|Qiuyi Chen|Jiayu Yang|Yuting Lu|Jianyang Pan|Haibin Qu 中国浙江大学药学院药学信息学研究所,杭州3100

  ``
Xinyuan Xie|Hongxu Zhang|Yingting Shi|Yuxia Jin|Kerui Fang|Qiuyi Chen|Jiayu Yang|Yuting Lu|Jianyang Pan|Haibin Qu
中国浙江大学药学院药学信息学研究所,杭州310058

摘要

背景

一维质子核磁共振(1D ^1H NMR)光谱是一种非破坏性、非针对性的分析技术,可以提供定性和定量信息,特别适用于混合物分析。定量 ^1H 核磁共振(^1H qNMR)光谱是分析混合物的强大工具,具有样品制备简单和无损测量的优点。尽管具有这些优势,但存在一个关键瓶颈:需要手动选择合适的量化峰。这一过程要求识别信噪比较高的信号且没有光谱重叠,耗时、主观性强,并且严重依赖分析人员的专业知识。对于复杂混合物和高通量分析来说,这一挑战尤为突出,严重限制了 qNMR 技术的效率和广泛应用。

结果

我们开发了一个用于自动化 qNMR 分析的工具,名为 LUMIN。该工具可以自动识别最佳量化峰,无需分析人员在参考库中进行预先定义的选择,并提供两种操作模式以平衡效率与分析深度。通过峰选择可靠性和浓度准确性对性能进行了评估。在合成模型混合物中,LUMIN 正确识别了超过 95% 的量化峰,与专家分配完全一致,且没有假阳性结果。与手动积分相比,定量准确性显示出极好的线性相关性,相对误差始终在 10% 以内。将该工具应用于植物和动物来源的真实世界混合物进一步证明了其稳健性和实际应用性。

意义

LUMIN 将专家的决策逻辑转化为一个稳健的自动化工作流程,用于 1D ^1H qNMR 分析。通过消除繁琐和主观的手动峰选择,它显著减少了分析时间,同时提高了客观性和可重复性。这个用户友好的工具支持高通量筛选和详细的光谱分析,降低了 qNMR 在复杂混合物的大规模研究中的应用障碍。

引言

复杂混合物在许多研究领域都很常见,例如代谢组学(例如血清)、天然产物分析(例如植物提取物)和生物制药开发(例如细胞培养基)。这类样品包含多种化学物质,带来了分析上的重大挑战。核磁共振(NMR)光谱能够在单次实验中提供定性和定量信息。特别是其中的一维 1D ^1H NMR 提供了广泛的分析窗口、最小的样品制备要求、无损采集以及无需外部校准曲线,这使得它比传统的色谱技术更适用于混合物分析[1]。然而,在 1D ^1H NMR 光谱中选择最佳量化峰仍然是一个手动、依赖专业知识的任务[2]、[3]。理想的峰必须具有高信噪比(SNR)和最小的重叠。在高通量分析领域(如药品质量控制、代谢组学和食品科学)中,手动选择最佳量化峰是一个重大瓶颈。当需要处理大量样品时,这个问题尤为突出。
为了加速 NMR 的定量混合物分析,所提出的自动化、基于库的方法可以分为两类:第一类涉及对整个光谱进行建模以从拟合系数中推导浓度;第二类则通过选择和积分特定的目标峰来进行传统的 NMR 定量[4]。第一类(全光谱建模)将量化问题转化为参数估计问题。虽然这种方法通常基于一个基本假设,即混合物光谱是缩放后的纯组分光谱的线性组合,但现实世界的 NMR 数据经常表现出非理想的变化,如峰位移、基线不稳定和噪声,这些都会挑战简单的线性模型。因此,现代算法已经发展得更加复杂,包含了更先进的机制。例如,ASICS 利用组分变形来处理光谱错位[5]、[6]、[7],SigMA 采用概率建模进行去卷积[8]、[9]。最近,基于 Wasserstein 度量(或地球移动者距离)的先进框架被引入,通过将 NMR 信号视为概率分布来提供稳健的量化,有效减轻了非线性位移的影响[10]、[11]、[12]。为了应对库大小超过关注代谢物数量时的稀疏问题,一些方法如 MagMet[13]、[14]、[15]、BAYESIL[16]、[17]、[18] 和 BATMAN[3]、[19]、[20] 将分析限制在预定义的化合物列表上,而 Vu 等人提出了基于位移校正的正则化回归方法[21]。这类方法经常面临稀疏性问题,并且严重依赖复杂的优化算法,导致计算成本较高。
第二类基于库的方法依赖于专家定义的量化峰,这些峰记录在库中并在量化过程中被调用。Dolphin[22] 和 SMolESY-select[23] 直接积分用户指定的峰进行量化。AQuA[24]、[25] 将纯化合物光谱转换为归一化强度矩阵,并根据每个化合物指定的“报告信号”通过矩阵运算实现量化。虽然这些方法有效利用了专家知识,但在处理未包含在参考库中的化合物或由不同实验条件引起的光谱变化时,它们的适应性可能受到限制。还有一些方法完全省略了库[26]、[27]、[28],从而避免了库的范围限制,但这些方法通常只报告峰积分而不提供化合物特定信息。显然,新型自动化量化策略仍有很大的发展空间。
同时,人工智能(AI)和机器学习的快速发展为 NMR 混合物分析和光谱处理带来了新的范式。最近的综述强调了 AI 支持的框架在 NMR 光谱中的日益融合,涵盖了光谱采集、重建、去噪、分配、自动化解释和质量评估[29]、[30]。虽然这些数据驱动的方法在处理复杂光谱模式和失真方面显示出巨大潜力,但它们往往透明度较低,可能需要大量注释数据进行可靠的训练和验证。这进一步推动了基于规则的自动化量化工作流程的发展,这些流程明确编码了专家逻辑,同时减少了训练数据的需求。
此前,我们的团队通过开发 LAMAIS[31] 来解决定性 1D ^1H NMR 分析的繁琐问题,这是一种基于库的方法,通过相似性评估自动化化合物识别,从而避免了光谱拟合的需要。扩展我们之前的工作,本研究引入了 LUMIN(Library-Utilized Mixture quantification in NMR),这是一种新型的自动化 1D ^1H NMR 定量化工具。LAMAIS 主要用于定性化合物识别,而 LUMIN 是专门为定量混合物分析开发的。为了实现可靠的浓度估计,LUMIN 结合了几种与我们之前工作不同的算法模块:用于准确峰积分的数学线型拟合、基于信号去卷积的二次筛选程序以及用于最小化残余共共振引起的积分偏差的干扰峰过滤策略。LUMIN 可以自动选择符合专家思维的最佳量化峰,无需在参考库中预先记录分析人员的选择。通过使用真实世界的复杂混合物(特别是植物提取物和 CHO 细胞培养基)进一步证明了该方法的稳健性和实际应用性。

部分摘录

材料和试剂

3-(Trimethylsilyl) propionic-2,2,3,3-d4 酸(TSP≥99.0%)、重氢氧化物(D?O,99.9%)和含有 0.05 wt% TSP 的 D?O 从 Sigma-Aldrich(美国密苏里州圣路易斯)购得。氨基酸、核苷和糖也从 Sigma-Aldrich 购得,其他化学标准品则从上海 Winherb Medical Technology Co., Ltd.(中国上海)购买。去离子水使用 Milli-Q Synthesis 超纯水系统(Millipore Corporation,美国)制备。

调整关键参数以实现稳健量化

LUMIN 的性能取决于两个用户定义的参数:搜索宽度(δr)和相似度阈值。δr 决定了搜索窗口的宽度。我们的初步研究表明,δr 决定了搜索窗口的宽度[31]。δr 过小可能会排除位移的共振峰,导致无法正确定位;而 δr 过大则会增加计算时间,并有可能包括具有相似线型的邻近化合物的峰,从而导致误识别。

结论

我们开发了 LUMIN,这是一个基于库的自动化工具,用于 1D ^1H NMR 定量化,它可以复制专家的峰选择逻辑。理想的量化峰应具有高信噪比和最小的光谱重叠。为了应对混合物光谱的复杂性,我们实现了有针对性的策略,包括二次筛选程序和干扰峰过滤方法。LUMIN 提供了两种操作模式,以平衡吞吐量和分析深度。

CRediT 作者贡献声明

Xinyuan Xie:撰写——原始草稿、可视化、验证、软件、方法学、研究、正式分析、数据管理、概念化。Hongxu Zhang:撰写——原始草稿、可视化。Kerui Fang:研究、数据管理。Qiuyi Chen:研究、数据管理。Yingting Shi:研究、数据管理。Yuxia Jin:研究、数据管理。Jianyang Pan:监督、资源管理、数据管理。Haibin Qu:撰写——审稿与编辑、监督、资源管理。

数据可用性

LUMIN 的 Python 脚本和本研究中生成的相关数据可从作者处获取。LUMIN 的可执行文件和核心代码可在以下链接获取:https://github.com/HxZhangZJU/LUMIN

利益冲突声明

? 作者声明他们没有已知的竞争财务利益或个人关系可能影响本文报告的工作。

致谢

本研究得到了 中国国家重点研发计划(批准号:2023YFC3504501)的支持。
```
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号