基于色谱条件的有机化合物结构与荧光关系多变量建模:概念验证研究

《Journal of Chromatography Open》:Experimental Multivariate Modeling of Structure-Fluorescence Relationships in Organic Compounds under Chromatographic Conditions: A Proof-of-Concept Study

【字体: 时间:2026年03月16日 来源:Journal of Chromatography Open 3.2

编辑推荐:

  虽然荧光提供宝贵的分析信息,但其理论解析仍具挑战。为探究荧光响应的内在机制,研究人员利用多元建模方法,对117种化合物在RP?HPLC?FLD条件下的荧光行为进行了系统研究。通过PLS和ANN模型,该研究明确了影响荧光强度的关键理化性质与结构描述符,并成功预测未知分子的荧光信号,为色谱条件下荧光行为的理论预测提供了实验支撑和计算框架。

  
在药品研发、环境监测和生物化学分析等诸多领域,荧光检测(Fluorescence Detection, FLD)凭借其高灵敏度和高选择性,扮演着不可或缺的角色。然而,一个长期困扰科研人员的根本问题是:我们能否在实验之前,就准确地预测一个从未见过的分子是否会发生荧光,以及其荧光强度会有多强?传统上,人们依赖经验规则,例如知道含有芳香环或大π共轭体系的分子容易发光,而含有某些特定官能团(如羰基)则会淬灭荧光。但这些定性规则在预测复杂分子在真实分析环境(如色谱)中的行为时,常常“失灵”。这是因为荧光是一个受多重因素调控的复杂光物理过程,分子结构、刚性、疏水性、极性以及它与溶剂环境的相互作用,都在其中扮演着微妙而关键的角色。如何系统地、量化地解码这些复杂因素,建立一个能够准确预测荧光响应的理论框架,是分析化学领域一个亟待解决的重要挑战。
为了回答这个核心问题,希腊塞萨洛尼基亚里士多德大学(Aristotle University of Thessaloniki)的Georgios Kamaris、Kyriakos Kachrimanis和Catherine K. Markopoulou研究团队在《Journal of Chromatography Open》上发表了一项开创性的研究。他们不再局限于对单一类别化合物的分析,而是将目光投向了一个包含117种结构多样化、具有药学相关性的化合物库。在严格控制的实验条件下,研究人员以甲醇为稀释剂和流动相,利用反相高效液相色谱-荧光检测(RP?HPLC?FLD)平台,精确测量了每一种化合物在各自最佳激发/发射波长下的荧光响应(以峰面积AUC的对数值表示)。随后,他们构建了一个庞大的描述符集,涵盖了36种物理化学性质和38种结构特征,总计74个预测变量(X)。运用偏最小二乘回归(PLS)和人工神经网络(ANN)这两种强大的多元建模工具,研究人员将复杂的荧光数据与分子描述符进行了深度关联,首次在色谱条件下,对有机化合物的结构-荧光关系进行了系统性的实验建模和理论解码。
本研究的关键技术方法主要包括:1. 色谱-荧光联用技术:使用配备荧光检测器(RF20-A)的Shimadzu HPLC系统,以甲醇为流动相,在C18色谱柱上对117种化合物进行分析,精确获取其在各自最优激发/发射波长下的色谱峰面积(AUC)作为荧光响应值(Y变量)。2. 分子描述符计算与数据库构建:利用Avogadro软件构建并优化分子三维结构,并综合使用ChemSpider、DataWarrior、PubChem、HyperChem等多种软件和数据库,计算或获取了包括logP/logD、极性表面积、分子平面性参数、HOMO-LUMO能隙等在内的74个物理化学和结构描述符(X变量)。3. 多元统计建模:应用SIMCA-P软件进行偏最小二乘(PLS)回归分析,量化各描述符对荧光响应的贡献(VIP值);并利用MATLAB的Netlab工具箱构建三层前馈反向传播人工神经网络(ANN)模型,对荧光强度进行非线性预测和验证。
3.1. Partial Least Squares methodology
通过PLS分析,研究客观量化了主导荧光行为的关键因素。结果显示,最重要的贡献者主要是结构特征,包括稠合或芳香环系统(正贡献)、共轭单双键(正贡献)、羰基(负贡献)、羧酸根基团(负贡献)、羟基(正贡献)、氨基(负贡献)以及含硫基团(负贡献)。同时,多种物理化学性质也扮演了重要角色,如亲脂性(正贡献)、极性表面积(负贡献)、分子平面性(正贡献)、氢键供体/受体能力(负贡献)以及分子柔性(负贡献)。该模型具有良好的稳健性(R2> 0.88, Q2> 0.76),并通过排列检验和分样本验证证实了其可靠性。
3.2. Neural networks methodology
与PLS相比,ANN模型展现了更优的预测性能(相关系数r > 0.85),能够以高可靠性预测未知分子的荧光强度。ANN成功捕捉了荧光响应与多重描述符之间复杂的非线性关系,但其“黑箱”特性使其在解释各描述符的具体贡献方面不如PLS直观。
3.3. Influence of Operating Conditions
研究还探讨了色谱操作条件对荧光信号的影响。发现流动相流速会显著影响检测信号,其关系可用公式y = aixc描述,其中指数c接近1,而系数ai与各分析物校准曲线的斜率成正比。这表明,在色谱条件下,分析物固有的荧光能力与流速共同决定了最终记录的发射信号强度。柱温的升高会因降低流动相粘度、缩短分析物在检测流通池中的停留时间,而导致峰面积成比例减小。
3.4. Chemical structures and fluorescence
通过对具体化合物系列的荧光行为进行解析,研究验证并深化了模型得出的结论。例如,简单烷烃链(戊烷、戊烯)无荧光;苯环是基本荧光单元;甲基取代能增强苯的荧光,且对位取代增强最显著;卤素取代会淬灭荧光,且淬灭效应随原子序数增加(I > Br > Cl)而增强;稠环芳烃(萘、蒽)的荧光强度随环数增加而显著升高;羟基通常增强荧光(如萘酚),而羰基、羧基、硝基等强吸电子基则完全淬灭荧光(如萘甲酸、硝基苯);在药物分子中,结构刚性、扩展的π共轭(如芪类化合物白藜芦醇)有利于荧光,而磺酰胺基团、重原子(硫、氯,如吩噻嗪类药物中的不同取代基效应)则会通过促进系间窜越等非辐射衰减途径抑制荧光。
这项研究通过整合实验测量与计算建模,首次在RP-HPLC色谱条件下,对结构多样的有机化合物进行了系统的荧光行为解码。其核心结论在于,PLS模型清晰地、客观地对塑造荧光行为的主导描述符进行了优先级排序,不仅证实了芳香性、共轭度、分子刚性等已知因素的核心作用,还揭示了LogD、极性表面积、分子平面性参数、折光指数等此前未被充分重视的物理化学性质的重要贡献。同时,ANN模型展现了出色的预测能力,为未知分子荧光强度的预测提供了可靠工具。此外,研究明确了在实际色谱分析中,流动相流速是调制最终检测信号的关键操作参数。
这项工作的意义深远。它超越了传统定性经验规则,提供了一个基于实验数据、可量化、可预测的理论框架,极大地增强了对荧光这一复杂现象的科学理解。所建立的多变量模型和识别出的关键描述符,未来可用于指导荧光探针的设计、优化色谱荧光检测方法,并为更广泛的涉及荧光化合物的项目(如药物发现、环境污染物筛查)中ANN预测软件的开发提供训练基础。尽管目前研究是在单一溶剂(甲醇)条件下进行的,但它为一个更宏大目标——在真实、多元的色谱条件下预测分析物的荧光潜力——奠定了坚实的概念验证基础。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号