《Food Research International》:Identification of antihypertensive, antidiabetic, and antioxidant peptides derived from hydrolysates of dairy white wastewaters containing milk proteins using machine learning insights
编辑推荐:
本研究针对代谢综合征相关慢性疾病治疗需求,创新性地将机器学习与实验验证相结合,从乳品工业废水中高效发掘多功能生物活性肽。研究人员通过酶解乳清废水蛋白,利用PLS-DA和QSAR模型筛选出60个特征肽段,其中20条合成肽的实验验证表明LRF、GAWY等肽段具有显著ACE抑制活性(IC50低至4.93 μM),PPF、GPIVL展现DPP-IV抑制能力,SFNPTQL表现出强抗氧化活性,为功能性食品开发提供新策略。
随着全球代谢综合征(包括高血压、高血糖等风险因素)患病率的持续攀升,传统药物治疗虽然有效但常伴随副作用和高成本问题。这促使科研界将目光转向天然来源的生物活性肽,它们以其治疗益处和最小不良反应的特点成为研究热点。在循环经济背景下,食品加工副产物作为生物活性肽的潜在宝库受到广泛关注,其中乳品工业产生的乳清废水(White Wastewater, WW)因其富含牛奶蛋白而显得尤为特殊。据统计,每加工1升牛奶就会产生2.5-10升乳清废水,这些废水中含有1.28%的蛋白质成分,成为回收具有健康益处肽段的理想资源。
尽管乳清废水蕴含丰富蛋白质,但直接从中生产生物活性肽的研究相对有限。先前研究表明,通过酶解处理可以释放出具有抗菌活性的肽段,但这些研究多局限于单一生物活性的探索,未能全面评估不同酶解条件对多种生物活性的影响,也未深入鉴定具体的活性肽序列。面对复杂水解产物中众多肽段的鉴定难题,传统定量构效关系(QSAR)模型存在预测准确性不足的局限,特别是对于抑制二肽基肽酶IV(DPP-IV)和血管紧张素转换酶(ACE)的肽段活性预测常出现低估现象。
在这项发表于《Food Research International》的研究中,研究人员开展了一项创新性探索,将机器学习与实验验证相结合,旨在从乳清废水蛋白水解物中系统发掘具有降血压、抗糖尿病和抗氧化活性的多功能肽。研究团队设置了四个具体目标:评估四种不同酶(胃蛋白酶、胰蛋白酶、嗜热菌蛋白酶和Pronase E)对生成肽段生物活性的影响;表征产生的肽段群体;运用基于回归的机器学习方法(PLS-DA)并结合QSAR模型识别新型生物活性肽;最后通过合成选定肽段并实验验证其生物活性。
关键技术方法包括:使用工业乳清废水为原料,在各自最适条件下进行酶解处理;通过UPLC-MS/MS技术分析肽段组成;采用细胞模型(Caco-2细胞)评估DPP-IV抑制活性,荧光法测定ACE抑制活性,DPPH法评估抗氧化能力(以Trolox当量表示);运用偏最小二乘判别分析(PLS-DA)进行多变量统计分析;结合QSAR模型预测肽段活性;通过固相肽合成(SPPS)制备候选肽段。
肽段群体表征结果显示,经过4小时酶解后共鉴定出693条肽段,每种酶都贡献了独特且重叠的肽段谱。热图分析清晰展示了不同酶在同一水解时间点以及同一酶在不同时间点产生的肽段群体差异。嗜热菌蛋白酶产生的独特肽段最多(181条),这与它偏好疏水性残基的切割特性相符;胃蛋白酶产生153条独特肽段;胰蛋白酶产生126条;而具有广谱切割活性的Pronase E产生83条独特肽段。随着水解时间延长,肽段逐渐降解为更小片段,这种动态变化直接影响生物活性的表现。
水解产物生物活性评估揭示了不同酶解产物的特性差异。在ACE抑制方面,嗜热菌蛋白酶水解物表现出最强活性,IC50值低至21.0 μg蛋白/mL;胃蛋白酶和Pronase E水解物则显示出DPP-IV抑制活性,IC50值为2.4-3.1 mg蛋白/mL;而胃蛋白酶水解物的抗氧化能力最高,达到3.5 μM Trolox当量/mg蛋白。值得注意的是,水解时间(30-240分钟)对酶效能的显著影响有限,表明活性肽段在早期水解阶段即可有效产生。
基于酶处理的PLS-DA分析成功将不同酶解产物按生物活性特征进行区分。成分1(解释45%方差)显示嗜热菌蛋白酶处理与较高ACE抑制活性相关,而胃蛋白酶处理则与TEAC值相关;成分2(解释32.2%方差)将胰蛋白酶样品与其他酶区分开来。肽段分析进一步揭示了每种酶特有的肽段谱,如SFNPTQL、KIDALNENKVLV等肽段与胃蛋白酶鉴别相关,可能具有抗氧化活性;而FNPTQ、INQ等肽段与嗜热菌蛋白酶相关,可能增强ACE抑制能力。
关键肽段鉴定环节中,研究人员从PLS-DA分析中筛选出60个特征肽段,其中17个是已知具有降血压、降血糖和/或抗氧化生物活性的肽段。QSAR模型分析显示,所有60个肽段都表现出ACE抑制活性,而只有21个显示DPP-IV抑制能力。肽段QW的预测ACE抑制IC50值最低(10.08 μM),显示出极强的抑制活性。
基于PLS-DA载荷、QSAR评分、相对于已知生物活性肽的新颖性以及物理化学多样性等多重要素,研究人员最终选择了20条肽段进行合成和实验验证。这些合成肽段的生物活性测试结果验证了预测模型的准确性:16条肽段显示ACE抑制活性,3条显示DPP-IV抑制活性,所有20条肽段均表现出抗氧化能力。特别值得注意的是,LRF肽段展现出卓越的ACE抑制能力(IC50为4.93 μM),按摩尔浓度计算比化学合成的ACE抑制剂卡托普利(IC50为63.06 μM)活性强近五倍。同时,PPF、GPIVL和GAWY三条新发现的序列在所有三种测定中都表现出生物活性,这是首次报道它们的多功能性,凸显了它们作为新型生物活性肽的潜力。
物化性质分析揭示了肽段生物活性与其结构特征之间的内在联系。高效ACE抑制肽通常长度较短,具有与酶环境pH匹配的等电点(pI),如LRF(pI 9.75)在较少酸性条件下表现出有效的溶解性和相互作用。富含疏水性或芳香族残基的较短肽段往往表现出较强的ACE抑制活性,而具有较高极性氨基酸比例的肽段则与抗氧化活性相关。
研究结论强调,这种集成机器学习与实验验证的方法成功实现了乳清废水蛋白的价值化,将其转化为具有抗氧化、降血压和降血糖特性的生物活性肽的可持续来源。PLS-DA和QSAR模型在从复杂水解产物中精确定位生物活性化合物方面表现出高效性,尽管它们作为启发式工具而非精确预测器,需要与生物测试相结合。实验验证证实了LRF、GAWY和QW等肽段具有强效ACE抑制活性,PPF和GPIVL表现出DPP-IV抑制能力,而SFNPTQL则是特别有效的抗氧化剂。特别值得关注的是,PPF、GIPVL和GAWY三种新序列在所有三种生物活性测定中均表现活跃,标志着它们作为新型多功能生物活性肽的发现。
讨论部分指出,预测模型与实验结果之间的差异凸显了实验验证对于确保模型可靠性的必要性,特别是在从理论框架转向实际应用时。虽然PLS-DA和QSAR在复杂水解产物中优先考虑候选肽段方面很有用,但它们应被视为启发式工具而非精确预测器。它们的性能在很大程度上取决于输入数据的质量和多样性,可能会低估、高估或遗漏某些生物活性肽段。
这项研究的成功为生物技术和治疗创新开辟了令人兴奋的途径,为可持续和高效的肽基应用铺平了道路。未来研究应重点关注肽段的稳定性、生物利用度和体内功效,以便将这些发现转化为治疗或功能性食品应用。此外,未来的研究应专注于整合来自不同来源的数据,包括体内和临床研究,以开发更强大的模型。最终,将这一过程扩大到营养保健品、制药和可持续生物技术的工业应用,可以释放乳清废水衍生肽的全部潜力,促进它们在健康聚焦的创新和循环经济背景下的使用。