编辑推荐:
羟基黄酮类化合物保留时间预测及数据库构建研究,通过量子化学计算获取分子溶解自由能(EW)和氢键能量(EM)作为分子描述符,建立反向相色谱中QSRR模型,实现1023种羟基取代黄酮类化合物保留时间的线性预测。该模型与UHPLC-HRMS联用可提升未知蒽醌类化合物鉴定准确性,为天然产物分离鉴定提供新方法。
孙长海|肖梦欣|崔碧月|孙世元|沈淑双|张书婷|张欣然|穆丽婷
中国佳木斯大学药学院,邮政信箱154007,
摘要
基于当前的研究现状,黄酮类化合物异构体的鉴定仍面临一定的困难和挑战,而开发液相色谱分离条件需要大量资源。因此,本研究通过探索色谱保留时间(tR)与流动相中溶剂模型的溶剂化自由能和氢键能量之间的定量关系,构建了反相色谱中花青素的定量结构-保留关系(QSRR)模型。通过计算1023种羟基取代黄酮类化合物的分子描述符,建立了一个数据库。当使用UHPLC-HRMS技术与该数据库结合来鉴定未知花青素时,该模型可提供辅助鉴定,从而提高鉴定结果的准确性。该模型使用11种模型化合物和两种分子描述符来预测化合物的保留时间。实验结果表明,花青素的色谱保留时间与其在流动相中的溶剂化自由能呈线性相关。此外,还证明了基于电子密度的量子化学方法计算花青素与流动相之间氢键能量的可行性。本研究为结构相似化合物的反相色谱分离提供了新的见解,而构建的数据库为异构体研究提供了广泛的数据支持。
引言
黄酮类化合物作为植物的次生代谢产物,在自然界中广泛分布。同时,作为许多药用植物中的主要药理活性成分,它们一直是天然产物研究领域的重点[[1], [2]]。由于黄酮类化合物的结构特点,其异构体数量众多[3]。花青素作为黄酮类化合物的重要亚家族,也具有黄酮类化合物的特性。理论上,仅羟基取代的黄酮类化合物就有1023种之多。因此,黄酮类化合物的定性鉴定存在一定的难度。
尽管UHPLC-HRMS技术与数据库及质谱碎片化模式相结合可以在大多数复杂系统中实现对多组分化合物的定性分析[[4], [5]],但仅依赖高分辨率质谱提供的准确分子量、二次或多级质谱数据以及不完善的质谱数据库,仍然对众多异构体和尚未收录在质谱数据库中的未知化合物的精确定性分析构成挑战。此外,在使用数据库匹配时,多个色谱峰往往被归为同一化合物。不同化合物由于化学结构和官能团的差异而表现出不同的色谱保留行为。因此,保留时间可以作为化合物鉴定的有效补充方法。然而,利用色谱保留行为进行定性分析的前提是使用标准样品建立保留值数据库,或使用参考标准进行比较鉴定分析。标准样品成本较高,且许多化合物缺乏 commercially available standards(商业可用标准),这限制了该方法的适用性。
随着量子计算化学、色谱技术和统计学的进步,QSRR方法已广泛应用于多个科学领域,包括化合物保留时间的预测[[6], [7], [8]]、未知化合物的鉴定[9]以及在特定条件下的色谱分离机制研究[10]。然而,基于当前的研究现状,在实际应用之前仍存在一些问题。这些问题包括:构建连接分析物保留参数与分子描述符的数学模型的机制尚不明确、使用的分子描述符数量过多、需要采用半经验分子描述符,以及在对保留参数进行测量时对重复性问题的考虑不足[[11], [12]]。在之前的研究中,研究团队发现黄酮类化合物的量子化学参数(分子体积、氢键能和溶解自由能)与这些化合物的色谱行为(色谱保留值、黄酮类化合物的体积因子对数等)之间存在一定程度的相关性。然而,以往的研究仍存在一些局限性:它们仅在等温条件下考察了定性问题;色谱保留时间表示为Ln(k)而非直接的tR;数学模型中氢键能的计算方法依赖于文献估计,缺乏精确性;且模型的适用性未经过评估[[13], [14], [15]]。
本研究采用两种分子描述符(EW和EM),通过多元线性回归拟合构建了QSRR模型。使用留一法及模拟样品验证了该模型的可靠性、稳定性和实际应用性。建立了羟基取代黄酮类化合物的分子描述符数据库,并应用QSRR模型预测该数据库中化合物的理论保留时间。本研究为黄酮类化合物及其他结构相似化合物的分离和鉴定提供了新的理论和方法学支持。
材料与试剂
杨梅素(S1)、槲皮素(S2)、木犀草素(S3)、芹菜素(S4)、7-OH黄酮(S5)、6-OH黄酮(S6)、芸香苷(S7)、乙酰芸香苷(S8)、甘草苷(S9)、3-OH黄酮(S10)、5-OH黄酮(S11)、山柰酚(V1)、山柰酚苷(V2)、白芷素(V3)、非瑟酮(V4)、莫林(V5)。所有参考标准均从Aladdin购买。甲醇和甲酸购自美国Thermo Fisher Scientific公司。所有溶剂均为HPLC级。水购自上海Watsons公司。
分子描述符计算
结构优化
羟基取代黄酮类化合物数据库的初步构建
基于黄酮类化合物的核心结构和活性位点,计算了1,023种含有1至10个羟基取代基的黄酮类化合物。通过将两种分子描述符代入构建的QSRR模型,获得了1023种羟基取代黄酮类化合物的理论保留时间(tR?),从而建立了这些化合物的数据库。数据经过系统整理形成了该数据库。以10种单羟基取代黄酮类化合物为例,具体参数如下:
讨论
本研究重点关注花青素异构体难以区分和分离的特点。通过量子化学计算、多元线性回归模型和反相液相色谱的结合方法,构建了羟基取代黄酮类化合物的QSRR模型和数据库,为黄酮类化合物及相关天然产物的分离、鉴定和研究提供了可靠的理论和实验支持。
本研究选择了
结论
本研究基于两种分子描述符(EW和EM),成功构建了花青素的定性结构-响应关系(QSRR)模型,并建立了相应的花青素数据库。该QSRR模型的建立证实了花青素化合物在反相色谱中的保留行为与其通过量子化学理论计算得到的溶液自由能之间存在线性相关。这些发现为
资助
本研究得到了黑龙江省自然科学基金(LH2024H004)和佳木斯大学国家基础研究计划(JMSUGPZR2023-011)的资助。
作者声明
孙长海和肖梦欣在工作的构思或设计、数据获取、分析或解释方面做出了重要贡献;崔碧月、沈淑双和孙世元在实验数据的分析和处理方面提供了很大帮助。张欣然和穆丽婷起草或批判性地修改了工作内容;孙长海和张书婷批准了最终发表版本;我同意
CRediT作者贡献声明
孙长海:撰写 – 审稿与编辑,概念构思。肖梦欣:撰写 – 初稿,形式分析。崔碧月:数据管理。孙世元:数据管理。沈淑双:数据管理。张书婷:撰写 – 审稿与编辑。张欣然:撰写 – 审稿与编辑,撰写 – 初稿。穆丽婷:撰写 – 初稿。
利益冲突声明
无利益冲突需要声明。感谢您的理解。期待您的回复。