《SCIENCE ADVANCES》:Machine learning-based paleobathymetric reconstructions using archaeal lipid biomarkers
编辑推荐:
为解决古海洋水深定量重建的难题,研究人员利用古菌脂类生物标志物甘油二烷基甘油四醚(GDGTs),结合随机森林机器学习模型,成功开发出高精度(R2= 0.85, RMSE = 646 m)的定量古水深重建方法。该方法应用于澳大利亚西北陆架600万年沉积记录,成功揭示了构造驱动的古水深演变,为探究海洋学与构造学联系提供了新框架。
重现远古海洋的深度对于理解地球构造演化、气候变迁以及生物演化至关重要。想象一下,我们试图描绘数千万年前大陆边缘的轮廓、海平面的涨落以及深海洋流的路径,但这些信息大多深藏在海底沉积物之中,难以直接测量。古水深重建,作为连接地球内部构造过程与表层气候系统的关键桥梁,长期以来面临方法学上的困境。现有的手段,例如依靠有孔虫等古生物化石、沉积学特征或地球化学指标,常常受到保存偏差、环境异质性以及指标校准不确定性的制约,导致多数重建结果停留在定性或半定量水平,缺乏一个普适且精准的定量工具。
正是在这样的背景下,一项发表于《SCIENCE ADVANCES》的研究为我们打开了一扇新的大门。研究团队将目光投向了一类特殊的分子化石——古菌脂类生物标志物,特别是甘油二烷基甘油四醚(Glycerol Dialkyl Glycerol Tetraethers,简称GDGTs)。这类化合物主要由海洋中的浮游氨氧化古菌(Ammonia-Oxidizing Archaea)产生,广泛分布于海洋沉积物中,其结构分布对环境变化极为敏感。长期以来,科学家们利用GDGTs的环化指数(例如TEX86)来重建古海水温度,取得了巨大成功。然而,越来越多的证据表明,GDGTs的分布不仅受温度影响,还可能与水深、溶解氧、营养盐等多种因素相关。其中,水深作为一个无处不在的海洋基本物理参数,是否在GDGTs的“分子记忆”中留下了独特的印迹?这项研究旨在系统性地探索GDGTs作为定量古水深代用指标的潜力,并利用先进的机器学习方法,构建一个全新的、高精度的古水深重建框架。
为了开展这项研究,研究人员综合运用了多种关键技术与方法。他们首先建立并分析了一个全球海洋表层沉积物GDGTs数据库,数据源自已发表的文献。研究聚焦于两类主要的GDGTs:异戊二烯醇GDGTs(isoGDGTs,包括GDGT-1至GDGT-3、crenarchaeol及其异构体)和羟基化GDGTs(OH-GDGTs)。为了确保数据质量,他们应用了多个筛选指标,如BIT指数(Branched and isoprenoid tetraether index)、甲烷指数(MI)和GDGT-0的相对丰度,以排除陆源输入和产甲烷作用等干扰。研究核心采用了随机森林(Random Forest)这一机器学习回归算法来建立GDGTs组成与水深的预测模型。模型开发过程中,使用了贝叶斯优化方法对超参数进行调优,并通过交叉验证评估模型性能。为了解释模型的决策机制,研究人员采用了基于博弈论的SHAP(Shapley Additive Explanations)值分析,以量化每种GDGT化合物对水深预测的贡献度。最后,他们将训练好的模型应用于来自国际大洋发现计划(IODP)U1461站位的沉积岩芯数据,该岩芯记录了澳大利亚西北陆架过去约600万年的连续沉积历史,从而验证模型在实际地质记录中的重建能力。
研究结果与讨论
水深对GDGT组成的影响
研究人员对全球海洋表层沉积物数据集进行了主成分分析(PCA)。结果显示,GDGT的分布表现出与水深的系统性变化。与浅水区沉积物相比,深水区样品含有更高比例的GDGT-1、GDGT-2和crenarchaeol异构体,而GDGT-3、OH-GDGT-1、OH-GDGT-2和crenarchaeol的比例则较低。这初步证实了GDGT组成与水深之间存在关联。2和均方根误差(RMSE)。">
开发用于古水深重建的机器学习模型
为了量化上述关系并处理其潜在的非线性特征,研究团队构建了基于随机森林的机器学习模型。他们评估了三种不同的GDGT组合:仅含isoGDGTs、仅含OH-GDGTs以及两者结合(isoGDGTs + OH-GDGTs)。结果显示,结合模型取得了最高的预测精度(验证集R2= 0.85,RMSE = 646米)。仅含isoGDGTs的模型表现次之(R2= 0.84),而仅含OH-GDGTs的模型预测能力相对较弱。这表明整合多种GDGT类型能有效提升古水深重建的可靠性。
为了理解模型背后的生物学机制,研究人员进行了SHAP分析。分析揭示,在所有模型中,crenarchaeol都是影响力最大的特征,其丰度的降低与更深的水深相关。这可能是高压环境下合成减少的结果。研究还发现,随着水深增加,GDGT的环化程度呈现下降趋势。这一发现与经典的“温度升高导致环化增加”的模式相反,表明在深海高压环境下,古菌可能通过减少环化来对抗高压导致的膜刚性增加,这是一种典型的膜流动性适应机制。此外,研究观察到随着水深增加,crenarchaeol的异构化程度升高,这进一步支持了这些脂质分子在适应高压环境中的作用。值得注意的是,之前研究中与水深呈线性相关的GDGT-2/GDGT-3比值,在SHAP分析中并未显示出显著影响,提示该比值可能更多地反映了古菌生态型的转变,而非直接的静水压力效应。
在沉积记录中验证古水深重建
为了检验模型的实用性,研究人员将其应用于澳大利亚西北陆架U1461站位的沉积岩芯记录。使用传统的GDGT-2/GDGT-3比值和线性回归模型进行的重建产生了不合理的结果(例如负水深),并且与基于有孔虫的古水深重建记录不吻合。相比之下,基于isoGDGT模型和结合模型(isoGDGTs + OH-GDGTs)的重建结果,成功捕捉到了有孔虫记录揭示的主要古水深变化趋势:从600万年前到500万年前的沉降与水深增加、500万到200万年前的相对稳定阶段,以及200万年后构造抬升导致的水深变浅。其中,结合模型的重建曲线波动更小,与有孔虫记录的趋势一致性最高,因此被推荐为古水深重建的首选方法。
研究结论与重要意义
这项研究系统性地证明,水深对海洋沉积物中GDGTs的组成具有显著且可预测的影响。通过整合isoGDGTs和OH-GDGTs数据,并运用可解释的随机森林机器学习模型,研究团队成功开发出一种高精度的定量古水深重建新方法。该方法不仅弥补了现有古水深重建手段的不足,提供了更稳健、更定量的解决方案,还为我们理解古菌的生理适应机制提供了新视角。研究表明,古菌可能通过调整其膜脂GDGTs的组成(如减少crenarchaeol、降低环化程度、增加异构化)来适应深海的高静水压力环境,这连接了微生物水平的生理适应与盆地尺度的环境重建。
在应用层面,该方法成功重建了澳大利亚西北陆架600万年来的构造-水深演化历史,并为进一步理解区域古海洋过程提供了新线索。例如,重建结果显示在400万至200万年前水深达到约1500米,这可能促进了南极中层水(AAIW)侵入陆架,增强了垂向混合,从而抑制了温暖的李温洋流(Leeuwin Current)的强度。而约200万年后的构造抬升则可能限制了南极中层水的入侵,有利于李温洋流的增强。这一发现揭示了构造活动通过改变水深和水团结构来影响洋流演化的潜在机制。
综上所述,这项研究建立了一个基于GDGTs和机器学习的强大框架,将古菌脂类生物标志物的应用从传统的温度重建拓展到了古水深定量重建领域。它不仅是古海洋学和古气候学研究方法学上的一项重要突破,也为探究地球深时历史中构造、气候和海洋环流之间的复杂相互作用提供了新的有力工具。