机器学习辅助单细胞拉曼成像用于植物细胞培养中类胡萝卜素的快速、高灵敏度检测及胞内定位作图

《Plant Cell Reports》:Machine learning-assisted single-cell Raman imaging for rapid, sensitive detection and intracellular mapping of carotenoids in plant cell cultures

【字体: 时间:2026年05月24日 来源:Plant Cell Reports 4.5

编辑推荐:

  类胡萝卜素是天然四萜类色素,具有重要的营养特性和广泛的工业应用。提升其在植物生物工厂中的产量,为当前制造过程提供了一种可持续替代方案。本研究开发了一种无标记(label-free)单细胞分析平台,将拉曼成像与多层感知机神经网络(MLP)相结合,基于类胡萝卜素含

类胡萝卜素是天然四萜类色素,具有重要的营养特性和广泛的工业应用。提升其在植物生物工厂中的产量,为当前制造过程提供了一种可持续替代方案。本研究开发了一种无标记(label-free)单细胞分析平台,将拉曼成像与多层感知机神经网络(MLP)相结合,基于类胡萝卜素含量对烟草BY-2细胞进行分类。由于可用浓度较低,研究人员采用疏水性金纳米星进行表面增强拉曼散射(SERS),分析了包括虾青素、角黄素和β-胡萝卜素在内的类胡萝卜素标准品。该分析实现了关键类胡萝卜素特征拉曼峰的归属,尤其是1160 cm?1和1520 cm?1,并借助拉曼成像在细胞内部对其进行识别。拉曼指纹与高效液相色谱(HPLC)获得的类胡萝卜素谱相关联,从而能够准确区分野生型与转基因细胞系。在所分析的转基因细胞系中,类胡萝卜素积累于靠近细胞核及沿细胞质膜分布的囊泡样结构中。该方法提供了一种非破坏性、无标记的分析途径,具有较高分类准确性和基于类胡萝卜素组成的分选潜力,可能成为植物合成生物学与代谢工程中的有用工具。
该文发表于《Plant Cell Reports》,围绕植物细胞工厂中类胡萝卜素的单细胞无损检测与胞内定位问题展开。类胡萝卜素是一类广泛存在于自然界中的天然四萜色素,兼具营养、生理和工业价值,在保健、制药、化妆品、饲料及染料等领域具有重要应用前景。近年来,借助代谢工程提升植物体系中类胡萝卜素的产量,已成为实现可持续制造的重要方向。然而,传统色谱技术如高效液相色谱(HPLC)虽然能够可靠分离和定量类胡萝卜素,但样品前处理繁琐、检测周期长,难以满足快速、高通量和单细胞水平分析的需求。另一方面,研究对象如果是非光合、未分化的植物细胞,如烟草BY-2悬浮细胞,则其缺乏典型叶绿体或有色体等成熟储存结构,类胡萝卜素究竟在细胞内何处积累、以何种亚细胞形态存在,仍不清楚。因此,建立一种既能保持细胞活性与结构完整、又能在单细胞分辨率下识别并定位类胡萝卜素的新方法,具有明确的方法学和生物学意义。

研究人员据此构建了一套结合拉曼成像与机器学习的单细胞分析平台,用于识别烟草BY-2不同细胞系中的类胡萝卜素组成,并解析其胞内分布。研究首先基于虾青素、角黄素和β-胡萝卜素标准品的表面增强拉曼散射(SERS)光谱,确定了1160 cm?1与1520 cm?1两个关键特征峰,再将其用于BY-2单细胞拉曼图谱中信息谱的筛选。随后,研究人员结合HPLC获得的群体水平类胡萝卜素组成信息,对多层感知机回归模型(MLPRegressor)进行训练,实现对不同BY-2细胞系类胡萝卜素组成的自动预测与区分。研究结果表明,转基因BY-2细胞中类胡萝卜素主要积累于靠近细胞核和细胞质膜的囊泡样结构中;同时,基于拉曼指纹和神经网络的自动分析流程能够较准确地区分野生型与不同代谢工程细胞系。该研究的重要意义在于,为植物细胞工厂中次生代谢产物的无标记、非破坏性、单细胞分析提供了新工具,并为植物合成生物学(synthetic biology)和代谢工程(metabolic engineering)中的高通量筛选提供了技术基础。

主要技术方法概括如下:研究对象为烟草BY-2野生型细胞系WT-D、WT-L及5种代谢工程细胞系W04、YW02、IW09、YIW6和YIW135。研究人员采用Lugol碘染色和明场显微镜观察淀粉体形成,以评估质体向造粉体(amyloplast)分化;采用HPLC检测各细胞系类胡萝卜素谱;采用疏水性1-dodecanethiol修饰金纳米星进行SERS标准品分析,确定特征峰;采用532 nm激发的共聚焦单细胞拉曼成像进行胞内定位;在数据分析上,使用基线校正、尖峰去除、特征峰筛选、信息谱聚类、特征标准化、多标签分层K折交叉验证及多层感知机神经网络回归模型,实现类胡萝卜素组成的自动识别。

以下结合论文结果部分各小标题进行解读。

Differentiation of BY-2 amyloplasts led to starch accumulation
研究人员首先关注BY-2细胞中是否存在可能用于类胡萝卜素储存的质体相关结构。由于BY-2属于未分化、非光合细胞,通常不具备成熟叶绿体或有色体,因此研究人员通过调节培养条件诱导其质体分化。结果显示,在去除生长素2,4-D并补加激动素(kinetin)后,WT-L细胞在24–48 h内出现增殖下降,并经Lugol碘染色观察到明显淀粉颗粒,提示原质体或黄化体向造粉体分化。标准培养条件下的WT细胞则无明显染色。该结果说明,BY-2细胞具有形成特定质体结构的潜能,这些结构可能与类胡萝卜素积累有关。研究人员据此认为,BY-2细胞中可能存在能够承担类胡萝卜素隔离与储存功能的细胞器基础,但其与真实类胡萝卜素储存位点之间的关系仍需进一步确认。

Engineered tobacco BY-2 cells display vesicle-type structures
在5个已建立的代谢工程BY-2细胞系中,研究人员通过显微观察发现,囊泡样结构在工程细胞中较WT-L更为丰富。鉴于叶绿体是植物细胞中类胡萝卜素累积的重要细胞器,研究最初考虑这些结构是否可能为发育中的叶绿体。然而荧光显微镜未检测到叶绿素典型的红色自发荧光,说明这些结构并非功能成熟的叶绿体。这与既往关于BY-2细胞中质体长期处于未分化状态、缺乏类囊体膜组织的报道相一致。文章进一步结合其他植物体系中的已知现象指出,类胡萝卜素过量积累可诱导形成囊泡状、晶体状或脂质相关结构,甚至导致质体内部重塑。因此,BY-2中的囊泡样结构更可能是与质体相关的储存结构,或与脂质膜系统相关的隔离区室,而非真正成熟的叶绿体。该部分结果为后续拉曼定位提供了明确的亚细胞观察靶点。

Intracellular localization of carotenoids confirmed by Raman microscopy
为在单细胞水平直接验证类胡萝卜素的胞内定位,研究人员对虾青素、角黄素和β-胡萝卜素标准品先行开展SERS分析。由于标准品浓度低于常规拉曼检测限,研究人员采用金纳米星(gold nanostars, GNSs)增强信号,并通过1-dodecanethiol修饰提高类胡萝卜素吸附稳定性。结果显示,三种标准品均出现清晰而可辨识的振动峰,主要集中于约1009–1012 cm?1、1160–1161 cm?1和1516–1518 cm?1。其中,约1160 cm?1对应C–C伸缩振动,约1516–1518 cm?1对应C=C伸缩振动,是识别类胡萝卜素最具诊断意义的峰位。基于这些标准峰,研究人员进一步对WT-D、WT-L及各转基因BY-2细胞进行532 nm激发的单细胞拉曼成像。

拉曼图谱表明,转基因细胞系中类胡萝卜素信号明显增强,而WT-D细胞中信号极弱。WT-D、WT-L及YIW6中带有类胡萝卜素特征峰的拉曼谱与β-胡萝卜素指纹较为吻合,这与HPLC结果一致。与此同时,工程细胞中峰位出现轻微偏移,研究人员认为这可能与不同共轭双键数目、侧基差异,以及番茄红素、玉米黄质前体或中间体等结构相近类胡萝卜素共同存在有关。更重要的是,拉曼成像直接显示,类胡萝卜素主要积累于囊泡样亚细胞结构,分布位置集中在细胞核周围以及细胞质膜附近。这一观察证明,在未分化的非光合BY-2细胞中,类胡萝卜素并非均匀弥散存在,而是被区隔在特定细胞内微区中。该结果为理解代谢工程植物细胞如何缓冲疏水性色素过量积累带来的潜在毒性提供了直接证据。

Automated Raman spectra analysis for the identification of carotenoids
尽管拉曼显微镜能够实现无损定位,但仅凭人工读取图谱难以精确区分各类细胞中复杂的类胡萝卜素混合组成。为此,研究人员设计了自动化光谱处理和机器学习分析流程。首先,依据标准品SERS光谱自动识别最关键的k个特征峰,最终确定1160 cm?1与1520 cm?1为最重要峰。随后,在BY-2单细胞拉曼图谱中,对每条光谱在这两个峰位的强度求和,构建排序向量,并利用曲线拐点将光谱划分为“信息谱”和“非信息谱”,从而剔除大量不含类胡萝卜素指纹的背景数据。这一策略显著减少了数据体量,也降低了无关信号对模型训练的干扰。

在模型建立方面,研究人员对标准品数据和各细胞系代表性拉曼谱进行插值统一、归一化处理,并采用多标签分层K折交叉验证保持标签分布均衡。随后构建多层感知机回归模型,其输入层特征数为412,两个隐藏层分别含100和10个神经元,输出层为3个节点,对应三种标准类胡萝卜素。模型分别采用L-BFGS和ADAM优化器训练50次。结果显示,L-BFGS优化器表现更优,最佳R2值达到0.9868,高于ADAM的0.9216,说明模型能够较高精度地根据单细胞拉曼谱预测类胡萝卜素组成。该结果表明,拉曼成像与机器学习结合不仅能完成空间定位,还能实现复杂代谢表型的自动化判别,体现出高通量筛选和智能分析潜力。

讨论部分总结
本文讨论的核心在于两个层面。其一是生物学层面:在未分化、非光合的烟草BY-2细胞中,代谢工程引导的类胡萝卜素积累与囊泡样结构形成密切相关,且这些结构主要位于核周及细胞质膜附近。结合既往关于烟草属植物中胞质囊泡、晶体结构及外质体储存的研究,研究人员认为,这些储存位点可能反映了细胞对类胡萝卜素过量积累的适应性重塑。其二是方法学层面:传统HPLC适于群体平均分析,但无法表征单细胞异质性;而拉曼成像虽可提供空间信息,却存在数据量大、人工判读困难的问题。本文通过特征峰驱动的数据过滤和神经网络建模,有效解决了单细胞拉曼数据处理中“信息稀疏”和“高维复杂”的双重难题,提升了分析效率、稳定性与可推广性。研究同时强调,该方法不仅适用于类胡萝卜素,也可扩展到其他生物分子或工程化植物体系,为振动光谱与代谢表型分析的整合提供了通用框架。

研究结论翻译
本研究表明,拉曼显微技术结合基于机器学习的自动化工作流程,可为工程化植物细胞系中类胡萝卜素的单细胞鉴定提供一种非破坏性、快速且无标记的方法。该方法揭示,在BY-2细胞中,囊泡样胞内结构是类胡萝卜素积累的主要位点。这些发现与既往关于烟草属植物中外质体类胡萝卜素储存的研究一致,其中在植烯和番茄红素过量生成时可观察到类似囊泡状或晶体状结构。此外,这类通常位于胞质、具有脂质特征的结构也见于非绿色组织的有色体中,并且近期已通过透射电子显微镜(TEM)在工程化积累β-胡萝卜素的N. benthamiana叶片中得到证实。上述观察强化了这样一种观点:类胡萝卜素隔离结构不仅可由发育程序预设,也可能由代谢物过量积累所诱导,甚至发生于质体区室之外。拉曼技术在BY-2细胞中检测到的含类胡萝卜素囊泡样结构,很可能代表与质体相关的区室,如原质体,但也不能排除其为胞质脂滴或其他膜性结构的可能。

除生物学认识外,研究还整合了先进的光谱预处理和机器学习方法,在无需人工干预的情况下实现了类胡萝卜素组成的准确预测。通过基于特征峰的过滤策略,该方法去除非信息光谱并保留用于后续神经网络回归的相关信号,从而可直接依据单细胞拉曼图谱实现无标记类胡萝卜素组成预测,显著降低专家工作量并减少人工偏差。机器学习尤其适合处理拉曼光谱产生的大规模复杂数据集,能够识别细微光谱模式,并提高不同生物学重复间的分类准确性。模型表现出的强性能说明其具备高通量应用潜力。这种全自动且数据感知的方法优势明确:可显著减少人工工作量,避免手工处理相关误差,并实现一致、可扩展的类胡萝卜素定量分析。此外,该流程也为未来研究和应用奠定了基础,包括实时分析、扩展至其他生物分子,或整合进生物医学与环境研究中的高通量系统。除类胡萝卜素分析外,该工作流程还可适配于其他生物分子或工程体系,为在植物合成生物学中整合振动光谱学与代谢表型分析提供了可推广框架。

订阅生物通快讯

订阅快讯:

最新文章

限时促销

会展信息

关注订阅号/掌握最新资讯

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号