融合数据与神经网络:提升单克隆抗体CHO细胞培养中精氨酸浓度的拉曼光谱原位监测与预测

《New Biotechnology》:Advancing bioprocess monitoring: data fusion and ANN-based prediction of arginine concentration in monoclonal antibody-producing CHO cell cultures

【字体: 时间:2026年03月15日 来源:New Biotechnology 4.9

编辑推荐:

  本研究针对哺乳动物细胞培养中复杂、非线性环境下传统线性建模方法(如偏最小二乘回归PLSR)在精氨酸(ARG)浓度预测上精度有限、稳健性不足的问题,开展了一项创新性研究。研究者提出了一种多模态数据融合策略,将在线拉曼光谱、过程变量与介电光谱测量的活细胞密度(VCD)相结合,并利用前馈人工神经网络(ANN)进行建模。结果显示,与PLSR模型相比,该数据融合ANN模型显著提高了预测精度(预测均方根误差RMSEP从342.9 μM降至295.4 μM),并在不同补料策略下表现出更优的稳健性,为生物制药过程的实时监控与先进控制提供了有效框架。

  
在生物制药行业,中国仓鼠卵巢(Chinese hamster ovary, CHO)细胞是生产治疗性蛋白(尤其是单克隆抗体)的主力平台。然而,哺乳动物细胞的培养过程复杂且对环境变化敏感,确保产品质量和生产稳定性始终是巨大的挑战。传统的离线分析方法存在延迟,无法实现过程的实时调控。过程分析技术(Process Analytical Technology, PAT)应运而生,旨在通过实时监测来减少批次间差异。其中,拉曼光谱(Raman spectroscopy)作为一种快速、非侵入性的光谱技术,能够直接在线获取培养液中营养成分(如氨基酸)的复杂信息,展现出巨大的应用潜力。
然而,从这些多维数据中提取准确信息并非易事。长期以来,偏最小二乘回归(Partial Least Squares Regression, PLSR)因其简单和可解释性,成为最常用的化学计量学方法。但PLSR是一种线性方法,在面对哺乳动物细胞培养系统复杂的非线性动态时,其预测精度往往受限,且模型在应用于新工艺条件或不同生产规模时,经常需要重新校准,稳健性和通用性不足。此外,复杂培养基中拉曼光谱信号的重叠和非线性本质,进一步限制了线性建模方法的有效性。
为了克服这些局限性,研究人员将目光投向了人工神经网络(Artificial Neural Networks, ANNs)等机器学习方法。这类非线性模型在从拉曼数据预测葡萄糖、乳酸等关键物质时,已被证明能获得比PLSR更低的预测误差和更强的稳健性。不过,在培养后期,高细胞密度和细胞碎片的积累会带来额外复杂性。如何进一步提升模型在此类条件下的稳健性和预测精度,是研究人员面临的下一个关键问题。
发表在《New Biotechnology》上的这项研究,正是为了应对这一挑战。研究团队聚焦于在CHO细胞培养过程中,对一种关键氨基酸——精氨酸(Arginine, ARG)——的浓度进行实时监测。他们提出了一个新颖的解决方案:将拉曼光谱数据与其他过程信息进行“数据融合”,并利用ANN模型进行预测。这项工作的主要贡献在于,首次开发了用于哺乳动物细胞培养中基于拉曼光谱定量精氨酸的专用ANN模型,并系统性地比较了其与PLSR模型的性能。更重要的是,研究证明,通过融合拉曼光谱、基于介电光谱的活细胞密度(Viable Cell Density, VCD)测量以及其他过程相关变量(如培养时间、精氨酸补料量),可以构建出更稳健、更可靠的预测模型,从而推进生物过程的在线监测和控制水平。
为了开展这项研究,研究者们采用了多项关键技术方法。细胞培养在2L台式生物反应器中进行,使用表达阿达木单抗生物类似物的CHO-DG44细胞。在线监测采用了多种传感器:通过拉曼浸入式生物探头(785 nm激光)每15分钟采集一次光谱,用于捕获培养液生化信息;利用介电光谱仪(Incyte 220)每10分钟测量一次电容等参数,用于推算活细胞密度。离线参考测量则通过自动氨基酸分析仪(Sykam S-433)对采集的细胞培养上清液进行精氨酸浓度的准确定量,为模型校准提供“金标准”。在数据处理与建模方面,研究运用了变量重要性投影(Variable Importance in Projection, VIP)进行光谱变量选择,并比较了两种建模方法:传统的偏最小二乘回归(PLSR)和基于数据融合策略的前馈人工神经网络(ANN)。ANN模型的输入不仅包括经主成分分析(Principal Component Analysis, PCA)降维后的拉曼光谱主成分,还融入了精氨酸补料量、培养时间和活细胞密度(VCD)信息。模型性能通过校准均方根误差(Root Mean Square Error of Calibration, RMSEC)、预测均方根误差(Root Mean Square Error of Prediction, RMSEP)和决定系数(R2)进行评估,并使用自助法(Bootstrap)估计模型不确定性。
3.1. 校准模型
研究首先基于338个拉曼光谱数据点开发了PLSR和ANN校准模型,用于预测精氨酸浓度。
3.1.1. 偏最小二乘回归模型
作为参考模型,研究构建了基于拉曼光谱的PLSR模型。经过光谱预处理和变量选择优化后,最佳模型使用了5个潜变量,其校准均方根误差(RMSEC)为323.5 μM,决定系数(R2C)为0.8256。在四个独立的验证批次(VAL1-VAL4)上进行测试时,该模型的预测均方根误差(RMSEP)为342.9 μM,预测决定系数(R2P)为0.5035,表明模型具备一定的预测能力,但在新的工艺条件下表现有所下降。
3.1.2. 人工神经网络模型
研究进一步开发了两种ANN模型。ANN1模型的输入包括拉曼光谱的主成分、培养时间和精氨酸补料量;ANN2_VCD模型则在ANN1的基础上,额外加入了来自介电光谱的活细胞密度(VCD)信息。ANN1模型使用2个隐藏层神经元,ANN2_VCD模型使用3个神经元。性能对比显示,ANN2_VCD模型在校准集上取得了最佳表现(RMSEC: 172.7 μM, R2C: 0.9570)。更重要的是,在验证集上,ANN2_VCD模型的预测误差(RMSEP: 295.4 μM)低于PLSR模型(342.9 μM),显示出数据融合带来的优势。尽管ANN模型的预测R2值相对较低,但这主要是由于测量数据点的范围较窄所致。
3.1.3. PLSR和ANN模型的比较
通过比较各模型在四个不同验证批次上的RMSEP值,可以深入评估其稳健性。在精氨酸浓度被动态控制在2500 μM的VAL1和VAL2批次中,所有模型都表现出较低的预测误差。然而,在VAL3批次(该批次采用谷氨酰胺控制而非精氨酸控制,这是一种校准数据集中未出现过的补料策略)中,所有模型的预测误差均显著增加,但ANN2_VCD模型(RMSEP: 424.8 μM)的表现优于PLSR模型(487.3 μM)和ANN1模型(533.0 μM)。这表明,融入VCD信息增强了ANN模型在面对未知工艺条件时的稳健性。在VAL4批次(仅控制葡萄糖)中,ANN1模型表现较弱,而PLSR模型表现较好。
3.2. 模拟实时监测
研究进一步模拟了所开发模型在验证批次中进行实时浓度监测的效果。对于PLSR模型,在培养后期或遇到全新补料策略(如VAL3)时,其预测精度下降,置信区间变宽,凸显了线性模型在复杂、非线性生物过程中的局限性。相比之下,ANN模型,特别是融合了VCD信息的ANN2_VCD模型,在大多数情况下能更紧密地跟踪离线测量值,尤其在VAL2批次中实现了异常准确的预测。尽管ANN模型因模型复杂性和输入变量不确定性而呈现出更宽的置信区间,但其在应对工艺变化(如VAL3)时展现出了更好的适应性和鲁棒性。
结论与讨论
本研究通过将拉曼光谱与先进的人工神经网络及数据融合策略相结合,成功克服了传统PLSR模型在复杂生物过程监控中的局限。研究的主要结论是,基于数据融合的人工神经网络模型在预测CHO细胞培养中的精氨酸浓度时,比传统的PLSR方法更准确、更稳健。具体而言,融入活细胞密度等过程变量的ANN模型(ANN2_VCD)将预测均方根误差从PLSR的342.9 μM降低至295.4 μM,并在面对校准数据未涵盖的补料策略时(如VAL3的谷氨酰胺控制),表现出更强的适应能力。这证明了数据融合策略能够捕捉培养过程的复杂动态,将生化(拉曼光谱)、生理(活细胞密度)和操作(补料、时间)信息纳入统一的建模框架,从而提升模型的预测性能和通用性。
这项工作的意义在于,它为非线性的、多源信息融合的生物过程监控提供了一个可扩展的框架。该方法不仅限于精氨酸,理论上可推广至其他关键氨基酸、代谢物或过程参数的原位监测。所开发的ANN-拉曼模型为CHO细胞培养提供了可靠的实时监控工具,有望实现更精确的营养物质控制,从而提高单克隆抗体生产的工艺稳定性与产品一致性,推动了“质量源于设计”(Quality by Design, QbD)理念在生物制药中的实践。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号