《Food Chemistry: X》:Classification and metabolomic profiling of walnut pellicle polyphenols using a Pseudotargeted metabolomics approach
编辑推荐:
本研究针对核桃种衣多酚结构复杂、地域差异大及传统代谢组学方法局限等问题,采用伪靶向代谢组学策略,整合UHPLC-QTOF-MS非靶向分析和QTRAP系统MRM半定量技术,系统分析了来自新疆、云南和太行山区的21份样本,鉴定出406种多酚,并通过多元统计分析揭示了区域特异性代谢指纹。研究为核桃品质溯源、靶向育种及功能产品开发提供了方法学支撑和化学标记物,具有重要的理论与应用价值。
核桃(Juglans regia L.)作为全球四大坚果作物之一,以其丰富的营养价值和经济价值备受青睐。中国作为最大的核桃生产国,其主产区分布在云南、新疆和太行山区。核桃种衣(即内种皮)富含多酚类化合物,这些物质以其卓越的抗氧化、抗炎和神经保护活性而闻名,是核桃健康益处的关键贡献者。然而,由于多酚结构的多样性、产地的变异性以及传统代谢组学方法的局限性,全面解析核桃种衣的多酚组成并揭示其地域特异性模式一直面临挑战。传统的非靶向代谢组学虽能广泛发现代谢物,但定性和定量能力不足;而靶向方法虽定量精准,却覆盖范围有限。这种方法论上的空白限制了对核桃多酚化学多样性的深入理解,也阻碍了其在品质保证、产地溯源和功能性产品开发中的应用。为了弥补这一空白,发表在《Food Chemistry: X》上的这项研究,创新性地采用了一种名为“伪靶向代谢组学”的混合策略,旨在对来自中国三大主产区的核桃种衣多酚进行系统性、高覆盖度的剖析,并挖掘其地理溯源标志物。
研究人员为开展此项研究,主要运用了几个关键技术方法。首先,他们从新疆、云南和太行山区这三个具有不同生态特征的产区收集了21个核桃种衣样本。核心实验技术是伪靶向代谢组学工作流程:第一步,利用超高效液相色谱-四极杆-飞行时间质谱(UHPLC-QTOF-MS)在信息依赖采集(IDA)模式下对样本进行非靶向分析,以获得全面的多酚谱图。第二步,基于非靶向数据,使用专门的软件工具筛选和优化多对离子对(母离子-子离子),构建了一个包含406个多酚特征的伪靶向多反应监测(MRM)面板。第三步,在AB Sciex QTRAP 5500 LC/MS/MS系统上使用动态MRM模式进行半定量分析。代谢物的注释遵循代谢组学标准倡议(MSI)指南,大部分化合物被归类为MSI Level 2(推定注释化合物)或Level 3(推定特征化合物类别)。数据分析方面,研究采用了主成分分析(PCA)、偏最小二乘判别分析(PLS-DA)和正交偏最小二乘判别分析(OPLS-DA)等多变量统计分析来区分不同产地的样本,并利用KEGG通路富集分析揭示差异代谢物涉及的生物合成途径。
3.1. 伪靶向代谢组学流程
研究成功建立并应用了基于LC-MS/MS的伪靶向代谢组学工作流程。该流程始于使用UHPLC-QTOF-MS对质量控制(QC)样本进行非靶向分析,通过在正负离子模式下使用阶梯碰撞能(如正离子模式15, 30, 40 V;负离子模式-15, -30, -40 V)获取高质量的MS/MS谱图。初始检测到大量离子对,经过去卷积去除同位素、中性丢失峰和加合离子等冗余信息后,最终构建了一个包含高置信度前体-产物离子对的数据集,用于后续MRM方法开发。该策略通过将QTOF的广谱发现能力与三重四极杆质谱的高灵敏度和选择性定量相结合,实现了对核桃种衣代谢组中低丰度多酚的准确检测和优异的样本间可比性。
3.2. 核桃种衣多酚的全面分析
伪靶向LC-MS/MS分析实现了对核桃种衣多酚的全面推定注释,共鉴定出406个非冗余的多酚特征(MSI Levels 2–4)。这些多酚被分为几大类:黄酮类化合物(201种)是主要类别,包括黄酮醇、黄酮、黄烷-3-醇(如儿茶素和表儿茶素)等亚类;酚酸(71种),包括羟基苯甲酸和羟基肉桂酸及其衍生物;可水解单宁(71种),主要是没食子单宁和鞣花单宁(如卡苏阿里宁);此外还包括木脂素(19种)、原花青素(20种)、香豆素(15种)以及少量其他类别。负离子模式对酸性酚类(如酚酸和单宁)灵敏度更高,而正离子模式则有利于检测黄酮苷元等中性化合物。这些多酚的相对丰度在三个地区间表现出广泛的动态范围,许多鞣花单宁、黄烷-3-醇和芪类化合物属于高丰度且变异较大的特征。
3.3. 基于无监督模型的组别区分
为了探索地理起源如何影响核桃种衣的代谢组特征,研究首先对完整的406个化合物数据矩阵进行了无监督模式识别分析。层次聚类分析(HCA)热图显示,样本根据地理起源形成了明显的簇,表明不同地区的样本共享部分代谢物特征,同时也存在独特的特征。主成分分析(PCA)得分图(PC1 vs. PC2)也显示,来自BF(太行山区)、YN(云南)和XJ(新疆)的样本呈现出部分分离的趋势,尽管组间存在一些重叠。PC1和PC2分别解释了总方差的14.56%和10.08%。这种部分但可辨别的分离表明三个产地的核桃种衣在代谢物组成上存在中等程度的内在差异,为后续的监督模型分析奠定了基础。
3.4. 基于PLS-DA的组别分离
为了更正式地根据起源区分样本并识别驱动这些差异的代谢物,研究对全部数据集进行了PLS-DA分析。PLS-DA得分图显示出三个组别之间的清晰分离,表明基于多酚谱具有很强的判别能力。模型的累积统计量R2X = 0.426, R2Y = 0.95, Q2= 0.90,超过了模型稳定性的常用阈值。经过200次标签置换检验,得到的Q2截距为负值(-1.328),证明模型没有过拟合。通过重复50次的7折交叉验证,模型总体准确率达到0.954,平衡准确率为0.956。通过检查变量重要性投影(VIP)得分,研究确定了区分不同产地的关键代谢物。排名前10的判别代谢物包括鞣花单宁(如卡苏阿里宁、甘比宁A1)、黄酮类(如普鲁宁,即柚皮素-7-O-β-D-葡萄糖苷)以及酚酸衍生物(如相酸酸,即反式咖啡酰-L-苹果酸)等。这些代谢物在不同产地的相对丰度存在显著差异,形成了各自独特的代谢指纹。
3.5. OPLS-DA与差异代谢物分析
为了进一步研究每对产地之间的差异,研究构建了BF vs. YN, BF vs. XJ, 和 YN vs. XJ的OPLS-DA模型。所有两两比较的OPLS-DA模型均实现了组间的清晰分离,模型性能优异(Q2≈ 0.91–0.96),且置换检验证实模型稳健。OPLS-DA载荷图显示,在所有两两比较中,多酚类代谢物(主要是酚酸、黄酮类和可水解单宁)主导了预测成分。具体而言,BF产地的特征是高水平的鞣花单宁(如卡苏阿里宁);YN产地则富含更广泛的黄酮类和酚酸(如普鲁宁);而XJ产地的多酚总体水平相对较低,但某些芪类化合物(如ε-葡萄素)相对富集。单变量统计分析(ANOVA或Kruskal-Wallis检验,经错误发现率FDR校正)进一步证实了多酚的区域差异性。在406个代谢物中,有214个在地区间存在显著差异(q < 0.05)。火山图分析显示,在BF vs. YN, BF vs. XJ, 和 YN vs. XJ的比较中,分别有104、102和166个代谢物满足|log2FC| > 0.585(即倍数变化>1.5)且q < 0.05的显著性标准。卡苏阿里宁、普鲁宁和ε-葡萄素因其高VIP值、显著的统计学差异和较大的丰度变化,被优先考虑作为地理标志物的候选物。
3.6. 基于起源的差异代谢物KEGG通路富集分析
为了阐明不同产地核桃种衣在生化途径上的差异,研究对映射到KEGG化合物ID的差异代谢物进行了通路富集分析。在所有两两比较中,次级代谢途径,尤其是多酚生物合成途径,得到了显著富集(p < 0.05)。黄酮生物合成(map00941)是所有比较中最突出的通路,这与核桃富含黄酮和单宁的特点一致。在BF vs. YN比较中,除了黄酮生物合成,还富集了酪氨酸代谢(map00350)、芪类/二芳基庚烷类/姜辣素生物合成(map00945)、苯丙烷生物合成(map00940)和异黄酮生物合成(map00943)。在BF vs. XJ比较中,富集的通路包括黄酮生物合成、黄酮和黄酮醇生物合成(map00944)、芪类/二芳基庚烷类/姜辣素生物合成以及苯丙烷生物合成。在YN vs. XJ比较中,富集的通路包括黄酮生物合成、苯丙烷生物合成、异黄酮生物合成和酪氨酸代谢。这些通路富集结果揭示了不同产地核桃在苯丙烷和黄酮类代谢途径上存在系统性差异,反映了遗传背景和当地气候/土壤条件对其次级代谢的协同影响。
综上所述,本研究首次将伪靶向代谢组学策略全面应用于核桃种衣多酚分析,成功构建了涵盖406种多酚的化学图谱,并清晰揭示了其地域特异性代谢指纹。该方法有效弥合了非靶向发现与靶向定量之间的鸿沟。研究发现,太行山区(BF)的核桃种衣以高含量的鞣花单宁(如卡苏阿里宁)为特征,云南(YN)产地则表现出更丰富的黄酮类和酚酸(如普鲁宁)多样性,而新疆(XJ)产地的多酚总体水平相对较低,但某些芪类化合物(如ε-葡萄素)相对富集。这些独特的化学指纹不仅为核桃的地理溯源提供了可靠的化学标记物,有助于打击食品欺诈和保护原产地品牌,而且为针对特定健康或感官性状的靶向育种和农业实践提供了科学依据。尽管本研究存在采样范围和季节单一等局限性,且推定的生物活性有待实验验证,但其建立的伪靶向代谢组学方法学和发现的地理标志物,为深入理解核桃的化学多样性、提升其营养价值和推动产业可持续发展奠定了坚实基础。未来的研究可扩大采样规模,结合多组学技术和功能验证,进一步阐明多酚生物合成的调控机制及其与健康效益的因果关系。