利用碰撞截面积预测方法对Agave tequilana Weber var. azul植株中果聚糖异构体的结构特性进行分析
《Carbohydrate Polymers》:Structural characterisation of fructan isomers in Agave tequilana Weber var. azul plants using collision cross-section prediction
【字体:
大
中
小
】
时间:2026年05月10日
来源:Carbohydrate Polymers 12.5
编辑推荐:
路易斯·费尔南多·佩雷斯-维加 | 约瑟·胡安·奥尔达斯-奥尔蒂斯
代谢组学与质谱组,高级基因组学单元 – 国家理工学院研究与高级研究中心,利布拉米恩托北段9.6公里处,36824,伊拉普阿托,瓜纳华托州,墨西哥
摘要
果聚糖在植物生理学中扮演着重要角色,并已被报道
路易斯·费尔南多·佩雷斯-维加 | 约瑟·胡安·奥尔达斯-奥尔蒂斯
代谢组学与质谱组,高级基因组学单元 – 国家理工学院研究与高级研究中心,利布拉米恩托北段9.6公里处,36824,伊拉普阿托,瓜纳华托州,墨西哥
摘要
果聚糖在植物生理学中扮演着重要角色,并已被报道具有多种技术应用。它们是复杂的果糖寡糖和多糖,具有不同的聚合度(DP)和分支类型。这些特征使得确定植物不同异构体的结构变得困难。本研究介绍了一种结合实验和计算的方法,我们将实验得到的碰撞截面(CCSe)值与基于已报道特性的计算机生成的潜在果聚糖CCS(CCSt)数据库进行比较。我们识别出34个对应于DP12的果聚糖的CCSe值,其中24个(70%)与CCSt数据库中的条目相匹配,平均误差为0.29%,并成功指定了其结构。这种方法为分析不同分子和样品类型提供了有希望的方法。
1. 引言
龙舌兰属(通常称为龙舌兰或玛格伊)属于天门冬科,包含大约200种物种,其中166种存在于墨西哥(Alducin-Martínez等,2023)。它们是多肉、耐旱的单次结实植物,由肉质、坚硬的纤维状叶子组成,这些叶子围绕茎部呈莲座状排列,分布于山谷、平原、岩石丘陵和高山地区(Kablan等,2024)。龙舌兰植物被用于多种用途,如生产酒精饮料、糖浆、膳食纤维和牲畜饲料(Pérez-Zavala等,2020)。有趣的是,龙舌兰属能够主要以果糖聚合物和寡糖的形式储存碳水化合物,而不是淀粉(García-Villalba等,2022)。这些化合物被称为果聚糖,存在于15%的高等植物中,并在根、茎、叶、花和种子等不同器官中积累(Matros等,2019)。一般来说,果聚糖是水溶性的、含有果糖的寡糖和多糖,由蔗糖合成,其中果糖通过不同的糖苷键(β(2→1)和β(2→6)连接,构成大部分残基,可能含有也可能不含有其他单糖如葡萄糖(Hernández & Plou,2023;Pérez-López & Simpson,2020)。含有少量单糖残基或聚合度(DP)为10或更低的果聚糖通常被称为低聚果糖(FOS)。果聚糖可以根据果糖残基之间的主要连接类型进行分类:菊粉(以β(2→1)连接为主)、左旋低聚糖(以β(2→6)连接为主)、禾本科果聚糖(同时包含β(2→1)和β(2→6)连接)以及新系列(起始蔗糖中的葡萄糖连接到另一个果糖上),新系列进一步分为新菊粉(以β(2→1)连接为主)、新左旋低聚糖(以β(2→6)连接为主)和龙舌兰果聚糖(同时包含β(2→1)和β(2→6)连接且高度分支)(Pérez-López & Simpson,2020;Svara等,2020)。
正如名称所示,龙舌兰果聚糖是龙舌兰植物中主要的果聚糖成分,据报道它们可作为碳源和能量来源,并在植物繁殖、耐逆性和信号传导中发挥作用(Aldrete-Herrera等,2019;Gomez-Vargas等,2022;Márquez-López等,2022),同时也显示出有趣的技术应用(Espinosa-Andrews等,2021;García-Villalba等,2022;López & Salomé-Abarca,2024;Santiago-García等,2021)。这些化合物最近才被命名和描述(Mancilla-Margalli等,2006),是高度分支的新系列果聚糖,同时包含β(2→1)和β(2→6)糖苷键。在龙舌兰植物中,果聚糖的合成和降解由复杂的果聚糖转移酶和果聚糖外切酶系统调控(Cortés-Romero等,2012;Gomez-Vargas等,2022;Pérez-López & Simpson,2020),导致不同聚合度(DP)和分支类型的复杂混合物(Lopez等,2003)。此外,有文献记载果聚糖组成在植物发育过程中会发生变化,分支程度和DP与植物年龄相关(Arrizon等,2010;Mellado-Mojica & López,2012)。龙舌兰果聚糖复杂的合成和降解动态导致任何给定时间点植物中存在多种DP和异构体(同分异构体)。像所有其他异构体一样,果聚糖具有不同的结构以及物理、化学和生物学性质,这使得它们的区分成为一项重要任务(Wu等,2020)。了解龙舌兰果聚糖的结构多样性有助于更好地理解这些碳水化合物在繁殖、耐逆性中的作用,以及合成它们的酶的动态,同时也为开发化学修饰以改进(或生成)工业用途提供了可能,例如脂肪替代品、益生元和建筑材料,这些都受到结构多样性的影响(Díaz-Ramos等,2025)。
作为复杂的生物分子,像果聚糖这样的聚合物需要多种分析技术才能全面表征,这导致了耗时且成本高昂的分析(Ollivier等,2023)。质谱(MS)是一种强大的分析技术,用于分析不同化合物类别,包括碳水化合物,在许多研究领域、食品工业、制药业和产品开发中都有应用(Due?as等,2023;Shuken,2023;X. Zhang等,2021)。然而,在使用MS分析复杂混合物时存在许多局限性,包括异构体的存在(Alseekh等,2021;Habler等,2024)。即使借助色谱分离、化学衍生化和碎片模式分析,也难以分析像龙舌兰果聚糖这样的异构体(Furuhashi & Weckwerth,2023;Liu等,2023)。使用多种色谱技术(如高效阴离子交换色谱-脉冲安培检测器(HPAEC-PAD)、高效薄层层析(HPTLC)、气相色谱-质谱(GC–MS)和核磁共振(NMR)(Arrizon等,2010;Lopez等,2003;Mancilla-Margalli等,2006;Mellado-Mojica等,2017;Mellado-Mojica & López,2012;Salomé-Abarca等,2023;Wang & Cheong,2023)的许多尝试已经积累了关于果聚糖组成、结构和谱型的知识,但迄今为止仍难以详细了解龙舌兰植物中存在的特定异构体,特别是那些聚合度较高的异构体。当前的技术限制阻碍了对特定结构异构体的阐明,进一步分析这些技术需要更强大的设备以实现更好的纯化和分析,以便分离和研究高DP的异构体。另一个限制因素是缺乏商业化的果聚糖标准品,目前只有少数低DP的异构体可用。
传统分析技术的局限性可以通过离子迁移率质谱(IMS)来克服,这是一种利用电场在缓冲气体中分离离子的技术(Gabelica & Marklund,2018)。IMS相对于传统MS的一个重要优势在于能够测量碰撞截面(CCS),这是一种与分析物化学形状相关的物理化学参数(Paglia等,2021)。此外,即使对于具有相同质荷比(m/z)但三维结构不同的分子,CCS也会有所不同。CCS定义为离子发生碰撞所需的另一个粒子的旋转平均面积(Hinnenkamp等,2018),尽管它可能因溶剂组成而略有差异(Chung等,2024),但它基本上不受样品基质和色谱条件的影响(Song等,2023)。这些特性使得CCS成为可靠鉴定复杂样品中已知和未知化合物的重要参数,甚至可用于区分不同的异构体化合物(Delvaux等,2020;Hadavi等,2022;West等,2023;Wu等,2020)。在图1中,我们观察到了两种DP4的果聚糖异构体(1-尼斯糖和6-尼斯糖),并注意到它们的三维构型不同,从而导致CCS值不同。
下载:下载高分辨率图像(143KB)
下载:下载全尺寸图像
图1. 使用1-尼斯糖(上层)和6-尼斯糖(下层)作为示例的理论CCS(CCSt)值计算流程。A)分子结构建模。B)使用pKa作为标准进行分子电离(脱质子化)。C)离子化结构的3D优化。D)使用优化结构的原子坐标通过IMoS计算CCSt值。
实验上,CCS可以直接从漂移管(DT)细胞获得,或者通过在具有其他类型细胞(如行波(TWIMS)或循环IM(cIMS)细胞的设备中使用已知CCS值的标准品进行校准(Gier等,2025;Habibi & Nagy,2023;Lanucara等,2014;Moran-Garrido等,2022)。有了可用的标准品,实验得到的CCSe(CCSe)是一种强大的方法,可以用于创建数据库,从而快速鉴定类固醇、脂质、碳水化合物、核苷酸和肽等代谢物(Baker等,2023;Hernández-Mesa等,2018;McKenna等,2019;Zheng等,2017)。对于没有可用标准品的化合物的发现,这种策略较为有限,因为虽然可以得出CCSe值,但缺乏结构信息。
另一方面,CCS也可以从离子的优化3D模型理论预测。有三种主要的CCS计算方法:最不准确的方法是投影面积(PA),该方法涉及从不同方向投影离子的“阴影”并平均这些面积,忽略了离子之间的可能相互作用;其次是硬球散射(HSS)方法,该方法基于沿直线轨迹撞击离子的气体分子;第三是轨迹方法(TM),该方法包括个别原子与气体分子之间的相互作用和诱导偶极势(Larriba-Andaluz & Prell,2020)。通过这些方法,我们可以获得与CCSe值相似的理论CCSt值。许多研究基于上述方法或使用机器学习方法预测了不同化合物的CCS(Lee等,2021;Plante等,2019;Rainey等,2022;Ross等,2020;H. Zhang等,2023)。
当结合这些方法时,提供了一种分析代谢物特别是异构体结构组成的有趣替代方案。对未知结构化合物的实验分析会产生CCSe和m/z数据。同时,关于分析物的有限信息为潜在结构提供了线索,有助于计算CCSt。最终,将分析物的CCSe值与CCSt数据库进行比较可以促进其鉴定,并确定可能的结构。以龙舌兰果聚糖为例,特别是A. tequilana Weber var. azul,我们的研究小组首次使用IMS对其进行了结构阐明,利用PA方法生成的CCSt数据库和[M?+?Na]+及[M?+?K]+加合物鉴定出几种DP9的异构体。尽管这种初步方法为了解龙舌兰果聚糖的结构组成及其时空分布提供了宝贵的新见解,但我们认为应用轨迹方法可以更准确地预测CCSt并增强对A. tequilana中果聚糖的鉴定。因此,该项目旨在提供关于A. tequilana Weber var. azul植物中果聚糖复杂性的新结构见解,该植物在墨西哥具有重要的文化和经济意义(Casillas & Romero,2025),因其广泛的用途和所含碳水化合物。为此,我们采用了实验和计算相结合的方法,从A. tequilana茎样本中获取CCSe值,并将其与可能的果聚糖结构CCSt数据库进行比较。该CCSt数据库是使用负离子分子([M-H]?)和TM方法生成的。
2. 材料与方法
2.1. 材料
2.1.1. 溶剂
用于LC-MS的溶剂制备,使用了ACN(JT Baker,美国)级溶剂,超纯水则使用Simplicity UV水系统(Merck,德国)从蒸馏水中制备。氢氧化铵(NH4OH)购自Sigma-Aldrich(德国)。
2.1.2. 标准品
甲酸盐和亮氨酸脑啡肽标准品购自Waters Corporation(美国)。用于CCS校准的Poly-(D/L)-Alanine(PolyAla)购自Sigma-Aldrich。果糖(Fru)、葡萄糖(Glu)、蔗糖(Suc)、1-凯斯糖(Kes)、拉芬糖(Raf)、蜜三糖(Mlz)、麦芽三糖(Mal)和1-尼斯糖(Nys)购自ThermoFischer Scientific(美国)。Orafti HP菊粉购自Beno(比利时)。
2.1.3. 生物材料
在墨西哥瓜纳华托州Pénjamo市镇收集了一株6年的A. tequilana Weber var. azul植物,作为FOS和果聚糖的来源。
2.2. 方法
2.2.1. 果聚糖的提取
果聚糖的提取遵循Pérez-López等(2021)的方法进行了一些修改。将龙舌兰植物解剖后,将其茎切成小块。将茎块冷冻并冻干,然后用研钵研磨。加入超纯水,比例为15 mL每1克粉末,加热至75°C 30分钟,然后以3500 rpm离心10分钟。上清液通过20 μm PTFE过滤器过滤并冻干。回收的果聚糖储存在室温下的密封容器中。菊苣菊粉的提取过程与水提取步骤相同,以获得可溶性组分。2.2.2. 样品制备所有标准品(Fru、Glu、Suc、Kes、Raf、Mlz、Mal和Nys)均制备在ACN 50% + 0.3% NH4OH溶液中,浓度为1 mg/mL。果聚糖和菊苣菊粉则制备在ACN 50% + 0.3% NH4OH溶液中,浓度为2 mg/mL。2.2.3. 直接注入参数数据使用Waters Corporation公司的SYNAPT? HDMS质谱仪收集,该质谱仪配备了驻波离子迁移(TWIMS)单元,并在负离子化模式(ESI-,W模式)下运行。样品以20 μL/min的流速直接注入,浓度根据预先指定。相关的采集参数包括:100–2000 m/z,源温度和脱溶剂温度分别为150°C和250°C。样品重复分析三次。波速和波高分别设置为300 m/s和8 V。进行质量校准以校正整个m/z范围内的质量准确性。首先使用5 mM的甲酸钠(90%异丙醇)进行多点校准。第二次校准使用酪氨酸脑啡肽溶液(2 ng/mL,ACN 50%)在ESI-模式下的m/z 554.2615进行,以最小化质量误差漂移。两次校准均按照制造商的说明进行。CCS校准包括从PolyAla溶液(1 mg/mL,ACN 50%)中获取数据。2.2.4. 数据处理使用Waters Corporation公司的DriftScope v2.8软件可视化IM数据,并根据PolyAla标准品的离子迁移率生成校准曲线,并报告以氮气为背景的CCS值(Forsythe et al., 2015)。然后使用生成的校准曲线确定不同糖标准品的CCS值,单位为平方埃(?2)。2.2.5. 理论CCS值的计算为了生成CCSt值,我们基于多位作者之前报告的碳水化合物标准和果聚糖的已知结构构建了一个果聚糖数据库(Lopez et al., 2003; Mancilla-Margalli et al., 2006; Pérez-López et al., 2021)。结构使用ChemDraw(v20.1.1,Perkin Elmer Informatics)进行建模。还建模了其他可能的果聚糖结构,包括Mancilla-Margalli et al.(2006)描述的A. tequilana植物中的结构(第三组)。不同结构的命名规则为DPn-X,其中n表示结构中的单糖残基数,X表示基于菊粉类型的果聚糖的结构取代基。•n表示含有末端葡萄糖残基的FOS/果聚糖类型,从起始蔗糖连接的果糖,其余单糖均为β(2→1)连接的果糖。•ni表示只有β(2→1)连接的果糖,不含葡萄糖。•n-6G表示一种新系列果聚糖,其中有一个果糖连接到葡萄糖的C6位;如果6G旁边有数字,则表示有一个果糖寡糖连接到C6位。•n-L表示一个果糖通过β(2→6)连接到起始蔗糖的果糖。见图2。下载:下载高分辨率图像(161KB)下载:下载完整尺寸图像图2. 果聚糖命名法中的代表性结构特征。示例包含四糖(DP4)的变体。建模后,根据所有氢原子的pKa值使用MarvinSketch工具(v25.1.3,ChemAxon)对分子进行去质子化,以获得最可能的离子化结构。下一步是将离子导出到Avogadro2(v1.102.1,Avogadro Chemistry)中,这是一个免费的跨平台分子编辑器,可以通通过寻找能量最小配置来自行优化离子的三维结构。自动优化使用了Halgren的分子力场MMFF94方法。MMFF94适用于寻找有机分子的能量最小值(Halgren, 1996; Lewis-Atwell et al., 2021)。优化后的原子坐标和部分电荷被导出到*.xlsx文件中,按列组织,符合IMoS输入文件的规范(v1.13,Coots et al., 2020)。文件加载到IMoS中,并应用预定义参数使用轨迹方法获得CCS值(单位为?2)。计算使用氮气(423.15 K)。这里概述的整体流程如图1所示。2.2.6. 实验值和理论值的比较通过计算同一化合物的理论值与实验值之间的百分比误差(%E)来进行实验值和理论值的比较。使用线性回归来评估预测的(CCSt)和实验获得的CCS之间的相似性。这使我们能够观察到每个DP的CCS增加的一般趋势,并作为基于Lapthorn等人(2015)类似方法的校正因子。用适当的因子校正CCSt后,将从A. tequilana中提取的agavins的CCSe与最接近的CCSt进行结构匹配。此外,接受标准是CCSe和CCSt之间的差异小于2%和3 ?2。3. 结果与讨论3.1. 实验CCS值糖标准品的实验值显示在表1中(CCSe列)。这些值是通过使用PolyAla肽标准进行校准获得的。一个明显的趋势是:CCS随着分子中单糖数量的增加而增加,并且很大程度上取决于果聚糖的分子结构。果糖和葡萄糖的CCS值最小,而1-nystose的CCS值最大。对于果糖和葡萄糖,大约有2 ?2的差异(表1)。表1. 碳水化合物标准品、菊苣菊粉(Inu)和龙舌兰果聚糖(At)的CCS值。化合物CCSe (?2)CCSt(?2)%ECCStcorr (?2)%ECCSML (?2)%EFructose154.170101.05934.450146.6244.895128.516.650Glucose156.900102.49834.673147.5005.991131.516.189Sucrose172.460144.29416.332172.9410.279168.72.1801-kestose198.940191.5213.729201.6871.3812000.533Raffinose194.170199.6122.803206.6116.407197.81.869Melezitose190.770197.0533.293205.0547.488200.24.943Maltotriose204.410193.9395.123203.1580.6122021.1791-nystose223.590225.2810.756222.2360.606223.50.040Inu_DP3199.903191.5214.193201.6870.892223.511.804Inu_DP4223.058225.2810.997222.2360.369249.211.720Inu_DP5244.723261.4546.837244.2530.192274.212.045Inu_DP6263.469312.87618.752275.5534.586274.54.187Inu_DP7273.881343.49825.419294.1927.416299.89.464Inu_DP8292.943360.50423.063304.5433.960325.211.011At_DP3*201.835190.377–––––At_DP4*224.271228.679–––––At_DP5*253.951264.426–––––At_DP6*275.617314.382–––––At_DP7*294.359346.629–––––At_DP8*312.954376.847–––––At_DP9*336.543400.942–––––At_DP10*352.884430.172–––––At_DP11*372.486463.079–––––At_DP12*388.832489.338–––––第2列(CCSe)包含使用Synapt HDMS的直接注入-ESI负离子化模式获得的实验CCS值。第3列包含IMoS衍生的CCS值(CCSt)。第5列包含从AllCCS2(CCSML;H. Zhang et al., 2023)获得的校正后的CCS值(CCStcorr)以及相对于CCSe计算的绝对误差。%E列包含相对于CCSe计算的绝对误差。在CCSe处,值是从龙舌兰样本中获得的该特定DP的所有实验值的平均值。CCS的变化表明不同的结构构象,值范围从190.77 ?2到204.41 ?2。表1还显示了菊苣菊粉(Inu)的CCSe值。由于我们只从菊苣菊粉样本中回收了可溶性组分,因此预期只保留了较小的DP进行分析。这解释了为什么在我们的研究中只识别出DP 3–8。对于菊粉,我们观察到CCS随DP的增加而持续增加,平均增加量为18 ?2。因为在这种情况下所有的果聚糖都属于菊粉系列,这是预期之中的。对于龙舌兰样本,图3A显示了直接注入的6年生龙舌兰茎提取物的复合质谱图。正如我们所见,仅凭质谱图无法根据质量电荷比区分FOS/果聚糖。如果检查图1中的示例结构,质谱图只会显示一个665.2的峰值,我们无法确定该峰值是由单个异构体还是多个异构体产生的。下载:下载高分辨率图像(632KB)下载:下载完整尺寸图像图3. A)龙舌兰茎提取物的质谱图。仅凭质谱图无法区分果聚糖异构体。B)龙舌兰茎提取物的直接注入迁移图。通过离子迁移率可以在DT中分离异构体。离子迁移率提供了额外的信息维度,使我们能够将看似纯的单一体积电荷比峰分离为其异构组成部分。在图3B中,我们观察到用于3A中质谱图的样本的迁移图。如图所示,对于单个m/z,不同红色的点分布在漂移时间(DT)上。DT维度表示离子在TWIMS单元分离后到达检测器所需的时间。这表明,对于异构化合物,即使在相对复杂的样本(如龙舌兰提取物)中,我们也可以检测到离子迁移率的差异。在表2中,我们展示了从龙舌兰茎样本实验获得的FOS/果聚糖的CCS值。在这种情况下,从龙舌兰茎中回收的可溶性组分包含带有一个电荷的物种([M-H]?),DP范围从3到12。我们发现每个DP(或m/z)有几个实验值,有些DP只有2个CCS值,有的有多达6个CCS值。具有相同DP的果聚糖是异构化合物,尽管单糖残基的连接方式不同,但它们具有相同的分子质量。这意味着对于单个表2. 来自6年生A. tequilana植物的FOS/果聚糖的实验CCS值(CCSe)。DPAgave CCSe (?2)123453194.227198.551199.603208.871–4222.367223.971225.048––5243.623251.122259.362––6274.757275.903–––7283.043285.573296.502303.264–8305.030313.208310.896316.342–9328.525339.216–––10344.006348.753350.155356.055358.05411363.498368.735372.850377.671–12380.646387.026392.685––每行包含一个DP。不同的CCS值按列分开。对于每个DP,我们预期有不同的结构构象(即图1中的两个DP4示例),因此有不同的CCS值。尽管具有相同的m/z,但这些结构变化导致不同的CCS值,范围从大约1 ?2到超过10 ?2。在龙舌兰茎样本中总共识别出34个CCSe。我们认为,像cIMS设备这样的IMS分辨率的提高可以帮助我们不仅识别结构异构体,还可以识别异构体(如van de Put等人,2024年所示)甚至构象体。有趣的是,在分析龙舌兰茎提取物的质谱数据时,我们还观察到了双电荷离子([M-2H]2?)。由于PolyAla校准和我们的CCSt数据库都是针对带一个电荷的物种进行的,这些离子被排除在分析之外,但它们为进一步的工作提供了有趣的视角。3.2. 理论CCS值和CCSe的比较在表1(CCSt列)中,我们显示了所用化合物的IMoS衍生CCSt及其%E。对于糖标准品,大多数预测的CCS值相差超过3 ?2,单糖的CCS值约为55 ?2。平均%E为12.6%。当线性比较CCSe和CCSt值时,如图4所示,我们发现预测值大约是实验确定值的两倍,R2为0.9304。这种差异可能是由于多种因素造成的,例如从头算能量计算步骤的次优化、IMoS中模拟碰撞次数不足,或者最具能量的构象与实际不同的构象。值得注意的是,三种非FOS三糖(Raffinose、Melezitose和Maltotriose)显著偏离了回归线。下载:下载高分辨率图像(87KB)下载:下载完整尺寸图像图4. 果糖、葡萄糖、蔗糖、1-kestose、Raffinose、Melezitose、Maltotriose和1-nystose分析标准的理论值和实验值的比较。为了更好地理解CCSt的行为,我们将菊苣菊粉(Inu数据)添加到回归模型中(表1中的Inu数据)。这样做是为了扩大m/z和DT的范围,并包括更多的果聚糖家族化合物。这种线性回归显示在图5中。这种添加表明,CCSt与CCSe值的比率几乎翻了一番,R2增加到0.9802。Raffinose和Melezitose仍然显著偏离回归线。下载:下载高分辨率图像(78KB)下载:下载完整尺寸图像图5. 果糖、葡萄糖、蔗糖、1-kestose、Raffinose、Melezitose、Maltotriose和菊苣菊粉(DP3到DP8)的理论值和实验值的比较。由于菊苣菊粉只含有β(2→1)连接的果糖残基,这可能会限制β(2→6)连接和果聚糖新系列的准确识别,从而对任何得到的校正因子产生负面影响。这也适用于非FOS三糖,如Raffinose、Melezitose和Maltotriose,它们具有独特的结构特征。因此,我们进行了第三次线性回归,包括了Fructose、Glucose、Sucrose、1-kestose、1-nystose、菊苣菊粉(Inu)以及龙舌兰果聚糖(At)的平均CCSe和CCSt值,同时排除了非FOS三糖。用于此回归的数据显示在表1中(CCSe和CCSt列,排除了非FOS),回归结果显示在图6中。下载:下载高分辨率图像(76KB)下载:下载完整尺寸图像图6. 单糖、蔗糖、1-kestose、1-nystose、菊苣菊粉(从DP3到DP8)和龙舌兰果聚糖(每个DP的平均值)的理论值和实验值的比较。回归中使用的CCSt值的平均误差为15.3%。与仅FOS的CCS值相比,%E更高。这可能是因为随着菊苣菊粉DP的增加,CCSt开始显示出更大的差异。如图6所示,加入龙舌兰果聚糖数据后,斜率降低到约1.6,使得CCSt与CCSe的比例变为1.6:1,同时R2值提高到0.9886。这表明,正如预期的那样,果聚糖保持了一种规律性的增加CCSt的趋势,而其他单糖组成和连接类型的寡糖(如拉芬糖、梅莱齐糖、麦芽三糖)则不符合这一趋势,可能在各自的糖类家族中有其独特的变化规律。借鉴Lapthorn等人(2015年)的研究方法,我们使用线性回归为CCSt数据库制定了一个校正因子:CCStcorr = CCSt + 139.831.6429。使用这个新的校正因子后,CCStcorr与其与CCSe之间的差异(表1中的CCStcorr列)降低到了2.8%。虽然这种策略通过包含龙舌兰样本数据考虑了不同类型的果聚糖,但其缺点在于依赖于一个平均值而非具体数值。不同类型的果聚糖在CCSt增量上可能表现出不同的趋势。然而,由于缺乏商用标准品,这限制了使用真实标准品对这些化合物的分析鉴定以及更精细的计算策略的开发。此外,我们还使用了AllCCS2来生成CCSt值,并评估了我们的方法与一种从SMILES预测CCSt值的机器学习工具的比较结果。AllCCS2的数据可以在表1(CCSML列及相应的%E)中找到。AllCCS2的预测结果比未经校正的IMoS值(8.7%误差)好,但略低于CCStcorr(2.8%误差),表明我们的方法能够产生更准确的预测。
在表3中,我们展示了使用图1所示方法以及图6中得出的校正因子生成的各类FOS和果聚糖的CCSt值,测试范围达到了DP12(我们样本中的最大DP值)。该表按照不同分支类型进行了分类。
表3. 使用线性回归因子得到的各类FOS/果聚糖结构(DP最高至12)的校正后CCSt(CCStcorr)值。
| DP | CCStcorr (?2) | 分支类型 |
|---|-----------|---------|
| n-6G | 1.687 | |
| Gn-6G | 198.7 | |
| GLn-6G | 220 | |
| (2)n-6G | 199.6 | |
| (2)n-6G | 222 | |
| Ln-6G | 227.5 | |
| (2)n-6G | 226.8 | |
| L(2)n-L | 220.3 | |
| L(2)n-L | 229.5 | |
| 320 | 244.2 | |
| 253 | 255.6 | |
| 250 | 237.4 | |
| 239.5 | |
| 248.7 | |
| 264.4 | |
| 275.5 | |
| 250.7 | |
| 237.4 | |
| 239.5 | |
| 282.7 | |
| 287.9 | |
| 286.0 | |
| 294.1 | |
| 291.7 | |
| 307.6 | |
| 281.5 | |
| 303.9 | |
| 293.4 | |
| 242 | |
| 294.4 | |
| 331 | |
| 306 | |
| 293.1 | |
| 311 | |
| 336 | |
| 320 | |
| 313 | |
| 327 | |
| 337 | |
| 351 | |
| 330 | |
| 331 | |
| 310 | |
| 325 | |
| 358 | |
| 350 | |
| 237 | |
| 239 | |
| 282 | |
| 287 | |
在表3中,我们展示了使用图1方法以及图6中的回归得到的校正因子,对龙舌兰茎中的FOS和果聚糖进行测定的结果。对于龙舌兰茎,我们匹配到了34个实验CCSt值中的24个,识别率为70%。如前所述,CCSe的匹配标准是与CCStcorr数据库中最接近的CCSt之间的差异小于2%且结构差异小于3 ?2。匹配结果及其误差百分比(%E)显示在表4中。总体而言,所有情况的识别误差百分比均小于1%,平均值为0.29%。在所有分支级别(DP)中,至少都找到了一个与CCStcorr数据库的匹配结果。匹配次数最少的是DP6,只有1个CCSe结构与之匹配。在DP11的情况下,有4个匹配结果。通过IMS技术,我们对A. tequilana果聚糖的细微结构多样性获得了新的认识,这些信息有助于进一步理解这些化合物的生物学作用,并为龙舌兰果聚糖开发新的工业应用。
表4. 分支级别为3至12的果聚糖异构体识别匹配结果。
根据Pérez-López和Simpson(2020年)的研究,果聚糖的结构会随着植物年龄的增长而变大和变复杂,且分支级别(DP)的增加会提升可能的异构体数量。在我们的研究中,我们鉴定出了三糖类物质—inulotriose(DP3i)和6-kestose(DP3-L),这与之前的研究结果(Mellado-Mojica & López, 2012年)不同。我们未能找到1-kestose或neokestose,这可能是由于这些三糖的浓度低于检测限。总体而言,我们发现了属于graminan和neoseries类型的支化结构(例如DP5-6G、DP7-6G(2)L(2)、DP11-6G(2)L),这与之前报道的结果一致(Lopez等人,2003年),并且我们的部分结构也被其他研究者发现(Cortés-Romero等人,2012年;Mellado-Mojica & López, 2012年;Pérez-López等人,2021年)。图7展示了一些被识别的结构,可以看出它们具有多种分支形式。剩余的10个未匹配值可能有多种原因:首先,线性回归校正因子是一种通用方法,需要使用涵盖广泛DP和果聚糖类型的标 Produkte进一步微调;其次,目前只有小分子的果聚糖标准品,而更大、更复杂的结构的定制合成既昂贵又耗时;最后,模型中还需要考虑更多多样的结构,一些最初未被纳入的结构可能是未匹配的原因。要解决这些问题需要额外的计算时间和资源。此外,可以采用更强大的(但更耗时的)结构优化算法来提高CCSt数据库的预测精度。
下载:下载高分辨率图片(278KB)
下载:下载全尺寸图片
图7. 使用CCSt数据库识别出的龙舌兰果聚糖示例。
4. 结论
龙舌兰FOS和果聚糖是结构复杂的碳水化合物,使用传统的色谱和质谱等技术进行分离和分析非常困难。我们采用了一种结合实验和理论计算的方法来生成FOS/果聚糖的CCSt值,从而识别出龙舌兰茎提取物中3至12分支级别的34种可能的异构体。其中24种结构的鉴定无需依赖分析标准品或色谱步骤,减少了设备使用和数据处理时间。改进建模算法可以提高CCSt数据库的性能并辅助识别工作。这种方法也可以应用于其他在分析上具有挑战性的复杂生物分子。未来的研究应着重于优化几何结构以降低误差百分比(%E),扩展果聚糖结构的覆盖范围(从而增加匹配数量),提高IMS的分辨率,并通过质谱/质谱联用实验进一步验证研究结果。此外,还可以进一步研究这些化合物的年龄和组织特异性多样性,以及特定结构配置在技术应用中的潜力。
**作者贡献声明**
Luis Fernando Pérez-Vega:撰写原创草稿、方法设计、数据分析、数据处理。
José Juan Ordaz-Ortiz:撰写修订版、监督工作、方法指导、资金申请、概念框架设计。
**资助**
本研究得到了墨西哥国家科学技术委员会(Conacyt,现称为Secihti:科学、人文、技术与创新部)的资助,项目编号为CB 2017–2018 A1-S-26695,资助对象为JJOO。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号