基于LF-NMR弛豫预测椰枣理化特性：回归、多元分析与机器学习

《Food and Bioprocess Technology》：Prediction of Physicochemical Properties of Date Fruits from LF-NMR Relaxation: Regressions, Multivariate Analysis, and Machine Learning

【字体：大中小】 时间：2026年02月26日 来源：Food and Bioprocess Technology 5.8

编辑推荐：

　　传统的食品质量检测方法通常耗时且具有破坏性。为解决这一问题，研究人员开展了一项主题为“利用低场核磁共振（LF-NMR）弛豫结合多元分析与机器学习预测椰枣理化特性”的研究。他们发现LF-NMR T2弛豫参数与水分、粗纤维和果胶含量显著相关。通过决策树和人工神经网络模型，可以高效预测这些特性，例如水分预测R2高达0.990。这项工作证明了将LF-NMR与机器学习结合，为食品成分的快速、无损评估提供了一个有前景的分析框架。

在食品工业中，准确评估水果的理化特性对于保证产品质量、延长保质期以及优化加工工艺至关重要。然而，传统的化学和物理化学分析方法往往是破坏性的，不仅耗时，还需要使用昂贵的仪器和化学试剂，这极大地限制了其在实时、在线质量控制中的应用。例如，要测定一颗椰枣的水分、糖分、纤维含量，通常需要将其研磨、提取、并进行一系列化学分析，样品本身在测试后便无法用于销售或进一步加工。因此，开发一种快速、简便且无损的检测技术，成为了食品科学家和工业界长期追求的目标。在这样的背景下，低场核磁共振（Low-Field Nuclear Magnetic Resonance, LF-NMR）技术因其非侵入性、快速和操作简便等优点，在食品分析领域备受关注。它能够通过探测样品中氢质子的弛豫行为，灵敏地反映水分子与其他成分（如多糖、纤维）之间的相互作用及其流动性，从而间接揭示样品的内部结构和组成。

尽管LF-NMR在水果体系水分动态研究中已有应用，但其在椰枣这种成分复杂的果实上的应用仍十分有限。以往的研究多侧重于对弛豫参数的描述性解释，而将其与多元分析、机器学习等先进数据处理方法结合，用于定量预测关键理化特性的潜力尚未得到充分探索。椰枣富含水分、糖类、膳食纤维和果胶，其复杂的基质使得水分和溶质的相互作用对弛豫信号的影响更为错综复杂。为了填补这一研究空白，并探索LF-NMR在预测椰枣关键品质指标方面的实用价值，Singh, V., Rahman, M. S., Guizani, N. 等研究人员在《Food and Bioprocess Technology》期刊上发表了一项创新性研究。他们系统地探究了LF-NMR弛豫参数（纵向弛豫时间T₁和横向弛豫时间T₂）与椰枣多项理化特性（水分、pH、糖分、粗纤维、果胶）之间的关联，并首次将主成分分析（PCA）、决策树和人工神经网络（ANN）等多元统计与机器学习模型引入到该领域，建立了一个从弛豫数据到理化属性的有效预测框架。

本研究主要采用了几个关键技术方法：首先，研究人员从当地超市购买了九批不同品质的椰枣样品（均处于Tamar成熟阶段），进行了系统的理化特性分析。核心分析技术是低场核磁共振（LF-NMR），使用布鲁克Minispec分析仪在20 MHz共振频率下测量了样品的T₁和T₂弛豫曲线，并从中提取了代表刚性、半刚性和可移动质子的弛豫时间及初始强度等描述符。在数据分析方面，研究结合了传统统计方法（如Pearson和Spearman相关性分析、多元回归）、无监督学习方法（主成分分析PCA和聚类分析CA）以及有监督的机器学习模型（最小二乘提升决策树和两种人工神经网络，包括使用WEKA软件的多层感知器和使用DTREG软件的广义回归神经网络GRNN），以全面评估LF-NMR参数预测理化特性的能力。

结果部分的主要发现如下：

弛豫参数与理化特性的相关性

研究分析了椰枣样品的横向（T₂）和纵向（T₁）弛豫时间。结果表明，T₂弛豫时间对水分含量非常敏感，水分较高的样品表现出更长的T₂₂（可移动质子）弛豫时间，而水分较低的样品则T₂时间更短，这与水分子流动性受限制的情况一致。相关性分析显示，T₂弛豫参数（如T₂₁、T₂₂、I_2b、I₂₂）与水分、粗纤维和果胶含量存在显著的线性和非线性相关（p < 0.05或p < 0.10）。相比之下，T₁参数与这些特性的关联较弱。蔗糖含量与T₁₂显著相关，而pH、果糖和葡萄糖含量与任何弛豫参数均未显示出显著相关性，这可能是由于它们在高溶解状态下分子流动性相似，在低磁场强度下难以产生独特的弛豫行为。

多元分析揭示数据结构

主成分分析（PCA）被用于探索数据集的方差结构。前五个主成分共解释了95.5%的总方差，其中第一主成分（PC1）贡献了53.7%的方差，主要与水分、粗纤维、果胶以及几乎所有的T₂和T₁弛豫参数高度相关，这再次证实了弛豫行为与样品水合状态及结构成分的紧密联系。聚类分析（CA）进一步将九批椰枣样品分成了五个组，同一组内的样品在水分流动性、粗纤维和果胶含量上具有相似性，这从另一个角度支持了LF-NMR参数能够有效区分不同内部结构的样品。

机器学习模型的预测性能

研究构建了基于最小二乘提升（LS Boost）的决策树模型来预测水分含量。该模型以T₂₂和T₂₁等弛豫参数作为关键节点进行分割，实现了对水分的高精度预测，训练R²高达0.990。此外，人工神经网络模型也展现出强大的预测能力。广义回归神经网络（GRNN）在预测蔗糖和粗纤维含量时，显示出近乎完美的内部预测性能（R²分别为0.998和1.000）。这些结果凸显了机器学习模型在处理LF-NMR弛豫数据与复杂理化特性之间非线性关系方面的优势，其预测精度超越了传统的多元回归方法。

结论与讨论

本研究系统地证实了LF-NMR弛豫技术，特别是横向弛豫（T₂），在无损评估椰枣关键理化特性方面的巨大潜力。T₂参数对水分、粗纤维和果胶含量表现出比T₁参数更强的敏感性，这主要归因于其对介观尺度水分流动性以及与生物聚合物相互作用的出色响应能力。通过多元分析（PCA和CA），研究揭示了不同批次椰枣样品基于其弛豫行为和成分的聚类趋势，为样品分类和质量分级提供了依据。

最重要的是，研究成功地将机器学习模型（决策树和人工神经网络）与LF-NMR数据相结合，建立了一个高效的预测框架。决策树模型能够以清晰的规则（例如，基于T₂₂和T_2b的阈值）快速分类样品的水分含量，而神经网络模型则能更精细地捕捉多个理化属性与弛豫参数之间复杂的非线性映射关系。这些模型的高预测精度（如水分R²= 0.990）表明，LF-NMR结合机器学习有望发展成为一种可靠的、替代传统破坏性方法的快速检测工具。

这项研究的意义在于，它为食品工业，特别是椰枣加工业，提供了一种全新的、高效的质量控制思路。通过一次简单的LF-NMR扫描，就有可能同时估测出样品的多种重要成分含量，实现实时、在线的品质监控。尽管当前研究基于有限批次（n=9）的样品，模型的外部泛化能力有待在更广泛品种和成熟度的样品上进一步验证，但其所建立的方法学框架具有普适性，可推广至其他复杂食品基质的无损分析中，推动食品分析领域向智能化、无损化方向发展。

热点排行