机器学习在微藻生物技术中用于优化生物质和高价值代谢产物的生产:综述

《Algal Research》:Machine learning for optimizing biomass and high-value metabolite production in microalgal biotechnology: A review

【字体: 时间:2026年02月27日 来源:Algal Research 4.6

编辑推荐:

  机器学习通过处理非线性关系和多变量交互优化微藻培养,涵盖菌株筛选、生长预测、实时监控等环节,但存在数据异质性和验证不足等问题,需转向可信赖的智能系统开发。

  
唐建新|孙志文|张子洲|王静涵|孔帆涛|池占友
中国辽宁省大连市大连理工大学生物工程学院生物智能制造教育部重点实验室,116024

摘要

机器学习(ML)已成为优化微藻培养过程的关键工具,由于其处理非线性和多变量相互作用的能力,已经超越了传统的建模方法。本文系统地探讨了ML在提高生物量和高价值代谢物生产中的应用,提供了重要的视角。首先,本文建立了一个以任务为导向的框架,用于选择适合特定培养任务的ML算法。然后,对ML在关键领域的当前应用和局限性进行了深入分析,包括菌株筛选、生长预测与优化、生长阶段和生理状态监测以及实时控制。由于数据异质性和稀缺性导致的乐观估计偏差以及可重复性和泛化能力不足等问题常常被忽视。因此,本文认为该领域必须将重点从追求单一的预测准确性转向开发可靠的ML系统。这种转变需要建立标准化基准和共享数据库以进行公平评估,并将多组学、过程动态和其他多模态数据与智能控制架构相结合。因此,本文作为一份全面的指南和战略路线图,为研究社区提供了应对现有挑战并推进适应性、数据驱动的微藻培养系统提供了支持。

引言

微藻(包括真核微藻和原核蓝细菌)是能够将光能、CO2和营养物质转化为多种有价值生物产品的光合微生物[1]、[2]、[3]。它们具有较高的光合效率,贡献了全球约50%的氧气供应[4]。微藻的生长速度快、CO2固定效率高,且对耕地或淡水的需求极少,使其成为可再生能源生产、环境修复和可持续生物制造的有吸引力的平台[5]、[6]、[7]、[8]、[9]。此外,它们的碳封存潜力——每生产1公斤生物量可捕获约1.83公斤CO2——突显了其环境重要性[10]。
除了环境效益外,微藻生物量还是蛋白质、脂质、碳水化合物和类胡萝卜素等有价值化合物的丰富来源,这些化合物在营养保健品、制药、化妆品和生物燃料等领域有广泛的应用[11]、[12]、[13]。这些产品的商业价值范围广泛,从低价的碳水化合物(0.10美元/克)、蛋白质(0.20美元/克)和脂质(0.41美元/克)到高端的高价值类胡萝卜素(115美元/克)[14]。这一巨大的经济潜力推动了该行业的发展,预计基于微藻的产品市场将从2017年的326亿美元增长到2026年的534.3亿美元[15]。然而,尽管经过数十年的研究并且市场潜力巨大,微藻生物技术的商业化仍受到生产力低下和成本高昂等持续挑战的制约。因此,提高微藻生产力对于推动该行业的发展至关重要。
微藻培养的固有复杂性进一步加剧了这一挑战,因为它涉及众多环境、生理和操作参数之间的复杂和非线性相互作用。传统的优化方法——如一次一个因素(OFAT)实验、机理动力学模型(例如Monod模型)和统计方法(如响应面方法RSM)——往往难以准确捕捉这些动态过程。这些方法通常需要完整的数据集,依赖于预定义的数学关系,并且缺乏适应新条件或复杂多变量相互作用的能力[16]、[17]。这些固有的局限性促使人们寻找更加适应性和智能化的优化策略。
人工智能(AI)和机器学习(ML)的最新进展通过提供强大的数据驱动工具来应对这些挑战,带来了范式的转变。ML算法可以整合来自实时传感器和历史培养记录的多样化数据集,揭示过程变量与生物结果之间的隐藏关系,从而提高培养系统的效率[18]、[19]。与传统模型不同,ML擅长处理不完整的数据、捕捉复杂的非线性关系,并且无需预先了解潜在机制即可整合多个变量[20]。因此,ML已成为微藻生物技术中的变革性工具,其应用涵盖了整个生产链,从上游过程(如菌株筛选[21]、生长预测[22]和培养基优化[23])到下游操作(包括收获和转化[24])。如图1所示,ML可以无缝集成到微藻研究和培养的工作流程中,将数据采集、预测建模和反馈驱动的优化链接成一个连续的、自我改进的学习循环。通过直接从数据中学习复杂模式,ML实现了强大的预测建模、自适应控制和智能优化,这对于动态生物过程中的实时监测和决策至关重要[25]。
鉴于这一快速进展,已经出现了一些综述文章,总结了特定领域的发展,包括用于微藻检测的ML[17]、培养系统优化[19]、可持续生物燃料生产[20]、[26]、[27]、[28]、藻华检测[29]、[30]以及合成生物学应用[31]。然而,专门针对同时提高生物量积累和高价值代谢物生产的ML策略的系统性综述却明显缺失。因此,本文旨在通过提供关于ML和深度学习(DL)算法、应用、现有挑战和未来发展轨迹的全面和有针对性的分析,来填补这一关键空白,特别是在优化微藻培养中的生物量和代谢物生产方面。这项工作为开发智能微藻生物工艺提供了明确的路线图。

部分摘录

微藻生物技术中的建模和优化ML范式

在微藻培养中有效部署ML取决于算法能力与生物过程挑战之间的战略匹配。为系统地解决这一问题,本节首先介绍了一个概念框架,将核心生物过程任务(如连续预测、状态分类、模式发现和顺序控制)与合适的ML算法家族相对应,如表1所示。图2进一步阐述了这些ML算法的架构原理。

利用ML提高微藻生物量生产

微藻过程开发的核心挑战在于可预测且高效地积累生物量。ML不仅作为一种建模工具,还作为一种将数据转化为培养策略的框架。本章从两个相互关联的层面探讨了这一框架:从历史数据集中发现特征和预测生物量(静态建模),以及其在实时优化自适应控制循环中作为决策引擎的新兴作用

利用ML提高高价值代谢物的生产

虽然最大化生物量奠定了基础,但微藻生物技术的经济可行性在很大程度上取决于引导细胞代谢产生特定高价值化合物的能力。从生长优化向产品合成工程的转变为ML模型带来了质的不同挑战。
生物量积累主要受宏观环境参数(如光照、营养物质、温度)的控制,通常遵循更单调的规律

微藻生物技术中ML面临的挑战

尽管在多种应用中取得了显著进展,但ML在微藻生物技术中的整合仍受到几个关键挑战的制约。这些限制包括数据获取、模型可解释性、计算可扩展性和生物泛化能力。解决这些障碍对于实现智能、ML驱动的微藻培养的全部潜力至关重要。

ML驱动的微藻生物技术的整合与未来展望

基于上述挑战,微藻生物技术中ML的下一阶段发展将依赖于深度跨学科整合和新兴计算范式的采用。ML与系统生物学、反应器工程和合成生物学的结合,再加上数据基础设施和可持续性框架的创新,将定义下一代智能微藻生物工艺(图5)。

结论

ML正在通过将培养从经验驱动的做法转变为智能、数据驱动的学科来重新定义微藻生物技术。通过解码生物、环境和操作因素之间的复杂非线性关系,ML提高了生物量生产力和高价值代谢物的合成。然而,诸如数据标准化有限、模型可解释性不足和可扩展性约束等持续存在的挑战仍然阻碍了其全面发展

CRediT作者贡献声明

唐建新:撰写——综述与编辑、撰写——初稿、可视化、方法论、数据管理、概念化。孙志文:验证。张子洲:验证。王静涵:资源准备。孔帆涛:资源准备。池占友:监督、资金获取。

利益冲突声明
作者声明他们没有已知的财务利益或个人关系可能影响本文所述的工作。

致谢
本工作得到了中央高校基本科研业务费(DUT24LAB106)的支持。

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号