利用机器学习聚类和贝叶斯混合模型阐明波兰南部上西里西亚煤田中硫酸盐的来源

《Applied Geochemistry》:Elucidating the origin of sulphate in the Upper Silesian Coal Basin in southern Poland using machine learning clustering and Bayesian mixing model

【字体: 时间:2026年05月11日 来源:Applied Geochemistry 3.4

编辑推荐:

  卡塔日娜·桑博尔斯卡-戈伊克 | 奥德拉·斯拉切克 工业区生态研究所,科苏塔街6号,卡托维兹,40-844,波兰 **摘要** 上西里西亚煤田(USCB)是欧洲最大和最富生产力的煤田之一。该煤田的地质结构以及其广泛的竖井和地下通道网络,形成了一个极其复杂的水文系统。

  卡塔日娜·桑博尔斯卡-戈伊克 | 奥德拉·斯拉切克
工业区生态研究所,科苏塔街6号,卡托维兹,40-844,波兰

**摘要**
上西里西亚煤田(USCB)是欧洲最大和最富生产力的煤田之一。该煤田的地质结构以及其广泛的竖井和地下通道网络,形成了一个极其复杂的水文系统。本研究采用了机器学习聚类和贝叶斯建模方法,并结合了对矿井水中溶解硫酸盐的同位素分析,以确定硫酸盐的主要来源。地质解释进一步验证了聚类结果,加强了其概念框架。研究结果表明,所调查矿井中的硫酸盐源自三个同位素特征不同的来源:(1)硫化物矿物和有机物的氧化;(2)巴登期蒸发岩的溶解(其特征是δ34S和δ18O值范围狭窄);(3)来自更深地层的高矿化盐水的补给(其硫酸盐同位素特征表明起源于早三叠世)。据我们所知,这是首次仅利用同位素数据建立聚类模型来识别矿井水中硫酸盐来源,并通过独立的化学和地质证据进行验证的研究。此外,本研究还创新性地将聚类结果(聚类中心)与贝叶斯同位素混合模型相结合,以评估簇内的均匀性并量化混合过程及其相对贡献。这些发现表明,聚类方法能够提供对水文地球化学系统的稳健洞察,特别是在缺乏或数据有限的情况下尤为重要。此外,矿井水越来越多地被视为可饮用和工业用水的潜在资源,而不仅仅是废弃物。因此,研究其来源、演变和质量对于评估未来的供水机会和支持可持续的水资源管理策略至关重要。

**引言**
上西里西亚煤田(USCB)是欧洲最大和最富生产力的煤田之一(Pounds, 1958; Wehnert et al., 2018),覆盖面积约7250平方公里,其中5650平方公里位于波兰境内(Jonek-Kowalska and Turek, 2022)。采矿活动在18世纪加剧,尽管早在之前就已开始(Janson et al., 2009),其复杂的发展过程在Ró?kowski(2008)的著作中有详细记录。采矿深度从20世纪初的约80米增加到20世纪80年代末的约1200米(Caba?a et al., 2004)。目前,波兰有19家在运营的矿山(WUG, 2024),开采43层煤层,而已知共有164层煤层(PIG, 2024)。由于可开采煤层的厚度和多样性,采矿活动在多个深度层次同时进行。

长期的地下采矿和密集的工业发展极大地改变了自然水文地质状况和地下水地球化学特征。这些变化的程度取决于地质和操作因素,包括采矿深度、持续时间、作业范围和开采方法。尽管如此,无论地层年龄如何,地下水矿化程度通常会随深度增加而增加,这反映了长期的水-岩相互作用以及深层地层中原始或残余盐水的日益重要影响。

**矿井水的化学分析**
对矿井水的化学分析揭示了上西里西亚煤田碳纪地层中明显的水文地球化学相序。识别出三个主要的水文地球化学区域:(1)地下水补给区;(2)中间混合水区;(3)深层残余盐水区(Ró?kowski, 1995, 2000; Wagner, 1998)。这些区域的划分基于水文地球化学指标、总溶解固体(TDS)以及气体和同位素组成(Ró?kowski, 1995, 1998, 2000; Ró?kowski, eds., 2004)。地下水补给通常延伸至80-300米深处,而混合水区的下限在盆地内有所不同,通常位于240-650米之间。在这个区间以下,以残余地下水系统为主。

**矿井水质量的评估**
在淡水资源减少和努力限制地表水盐化的背景下,对矿井水质量和溶解成分的详细评估变得越来越重要,因为这可能导致严重的生态退化。无论是来自活跃矿山还是废弃矿山的矿井水,通常都需要被抽出到地面并进行处理,以符合排放的环境标准。例如,在波兰,2022年抽出的约0.75立方公里的矿井水中,只有0.41%用于饮用水供应,而仅有5.1%被重新用于非排放用途(Cień et al., 2024)。然而,随着向气候中立的过渡,越来越多的资源被鼓励再利用,包括与关闭矿山相关的基础设施,这一过程已经在进行中。

**煤中硫的来源**
煤中硫的主要来源包括海洋和非海洋水体、植物物质以及在沉积过程中引入的外来矿物物质(Ryan and Ledda, 1997; Nath, 2022)。次生硫也可能通过地下水引入,无论是在煤形成过程中还是沉积后通过成岩作用和后沉积阶段,可能重新动员来自海水或植被中弱结合有机化合物的硫(Ryan and Ledda, 1997)。硫以多种形式存在,包括硫化物矿物、有机硫和硫酸盐,其中黄铁矿是硫化物组分的主要成分(Ryan and Ledda, 1997; Gluskoter, 1977)。在氧化条件下,硫化物会迅速氧化形成不同的亚铁和高铁硫酸盐相,具体取决于pH值和氧化还原条件(Gzyl and Banks, 2007; Matysek et al., 2014)。硫酸盐通常被认为是煤中的次要矿物,是在煤化过程中形成的,其次是通过硫化物和有机硫的风化和氧化过程形成的,尤其是在黄铁矿硫含量较低的煤层中(Pearson and Kwong, 1979; Dai et al., 2021)。

**同位素组成**
煤中的硫同位素组成(δ34S)通常在-20到+20‰之间(Tang et al., 2001; Dai et al., 2002),尽管也有更广泛的变化范围。黄铁矿硫的δ34S值可能从-20‰到+50‰不等(Smith and Batts, 1974),而有机硫的δ34S值可高达+28‰(Hámor-Vidó and Hámor, 2007)。矿井水中的溶解硫酸盐也表现出广泛的同位素变异性,反映了地表来源和地质硫库的贡献以及煤中硫形式的异质分布(McCarthy et al., 1998)。然而,通常观察到一个与深度相关的趋势:浅层重力排水水的δ34S值通常低于+10‰,这反映了来自黄铁矿和/或有机硫氧化的硫酸盐。相比之下,深层循环矿井水的盐度更高,硫酸盐浓度更高,δ34S值通常超过+14‰,在某些情况下甚至接近+30‰。这些较高的值通常归因于蒸发岩的溶解和海洋来源盐水的混合。在还原条件下,微生物硫酸盐还原也可能导致进一步的同位素富集(Pluta, 2000, 2005; Pluta et al., 2000; Labus, 2007; Banks et al., 2020; Banks and Boyce, 2023)。

**结论**
上西里西亚煤田的煤在硫同位素组成上表现出显著的变化。报告的δ34S值范围为:黄铁矿硫-6.6‰至+10.5‰(平均值+2.51‰),硫酸盐硫-1.9‰至+13.7‰(平均值+5.1‰),有机硫+3.9‰至+15.9‰(平均值+7.0‰)(Chmielewski et al., 2002)。虽然一些矿床随深度变化显示出相对均匀的同位素组成,但其他矿床则表现出米级的变异性,表明局部地球化学性质的明显差异。在USCB南部,观察到更窄的δ34S范围(+3.5‰至+9.0‰)(Pluta, 2002)。一般来说,同位素变异性随硫含量的增加而增加:低硫含量的煤层显示出相对受限的同位素特征,而高硫含量的煤层(总硫>1%)则表现出更宽的范围(Udomkan et al., 2003)。

**源鉴定**
先前已有研究使用稳定硫(δ34S)(Banks and Boyce, 2023)和氧(δ18O)同位素(Pluta, 2000, 2005; Pluta et al., 2000)来研究USCB矿井水中溶解硫酸盐的来源。然而,这些研究中的来源归属主要是定性的,依赖于与文献报道的同位素范围的比较,而非正式的统计分类。在USCB,报告的黄铁矿硫、有机硫和硫酸盐硫的δ34S值有相当大的重叠,矿井水通常代表了浅层氧化硫化物衍生的硫酸盐和深层蒸发岩盐水的混合物。在这种情况下,基于文献同位素范围的确定性分配变得不明确,特别是当中间值可能反映混合或分馏过程时。这一局限性要求使用能够识别同位素数据集中内在一致性的客观统计框架。

为了克服描述性同位素范围比较的局限性,广泛应用了结合同位素特征的数学混合模型。这些方法使用质量平衡公式在混合条件下实现定量来源分配。线性模型提供受预定义端元限制的确定性解决方案(Phillips and Koch, 2002; Phillips and Gregg, 2003),而贝叶斯框架则考虑了来源组成和分馏的不确定性,得出概率性的来源贡献估计(Moore and Semmens, 2008; Parnell et al., 2013)。这样的模型已在水文地球化学系统中成功应用,包括硫同位素分析(Samborska and Halas, 2010; Ward et al., 2010; Samborska et al., 2013),并进一步扩展到复杂多源环境的层次化和概率方法(Longman et al., 2018; Souto-Oliveira et al., 2021; Liu et al., 2023)。此外,机器学习(ML)方法最近也被应用于基于同位素的来源识别、化合物鉴别和产物来源分析(O’Sullivan et al., 2023; Yang et al., 2024; Sarkar et al., 2025; Samborska-Goik and Wassenaar, 2025)。监督算法如随机森林、决策树、支持向量机和人工神经网络能够在高维同位素数据集中进行分类和回归,无需严格假设线性混合或预定义的端元分布(Fernández-Delgado et al., 2014; Bataille et al., 2018; Cemek et al., 2022; Erdelyi et al., 2023; Delgado et al., 2025)。这些模型通常具有高预测准确性、稳健的交叉验证性能和强大的泛化能力,尤其是在整合多个同位素系统和辅助地球化学变量时。

**无监督学习技术**
除了监督分类框架外,无监督机器学习技术如层次聚类、k-Means聚类、自组织映射(SOM)和基于密度的算法也越来越应用于同位素地球化学(Esmaeiloghli and Tabatabaei, 2020; Bigdeli et al., 2022)。聚类方法在环境研究中已得到广泛应用,用于根据盐度梯度对地表水进行分类(McNeil et al., 2005)、地下水质量评估(Fabbrocino et al., 2019),以及作为贝叶斯混合模型的预处理步骤来识别矿井水中的来源(Mao et al., 2023)。在大多数先前的应用中,聚类与主要离子化学或多参数水文化学数据集结合使用,以划定水类型并在定量分配前定义潜在的端元。

**本研究的特点**
据作者所知,本研究是首次仅基于同位素数据应用无监督聚类来阐明水力连通矿井系统中矿井水中硫酸盐的来源,其中来自不同来源的采矿水经历了广泛的混合。通过将同位素信号与传统的地球化学指标分离,这种方法能够在不依赖预定义端元的情况下识别数据集中与来源相关的结构。因此,本研究旨在评估和比较几种聚类算法,以便根据硫酸盐来源对矿井水样本进行分类,并使用独立的地质和地球水文化学证据来支持这些分类。通过仅依靠硫酸盐同位素组成,所提出的框架旨在减少来源归属的不确定性,尤其是在主要离子化学可能反映蒸发、氧化、稀释或混合等次级过程的系统中。更广泛地说,这项研究表明,无监督聚类即使在相对较小、异质的数据集中也能解决地球化学来源模式的问题,突显了其作为复杂水文地球化学环境中概率混合模型补充工具的潜力。该数据集进一步补充了来自该盆地煤炭中硫化合物平均含量的数据(Wawrzynkiewicz和Sablik,2002年),以及上西里西亚煤炭中含硫化合物的同位素组成(δ34S和δ18O)(Hydrochemical and Isotopic Data)。研究矿水中硫酸盐浓度范围为45至3830毫克/升,中位数为1205毫克/升;氯化物浓度范围为124至129,990毫克/升,中位数为21,440毫克/升;钠浓度范围为105至64,980毫克/升,中位数为14,300毫克/升(图2)。钠和氯化物浓度之间具有很高的相关性,皮尔逊相关系数为0.99。在同一样本中观察到了最高的钠和氯化物浓度。

**结论**
本研究表明,上西里西亚煤炭盆地矿水中溶解的硫酸盐可以分为三组具有水文地球化学意义的组别:
(i)浅层硫化物和/或有机物质氧化;
(ii)巴登期蒸发岩的影响;
(iii)与三叠纪蒸发岩溶解相关的深层卤水。
这些分组不仅得到了同位素数据的支持,还与其采样深度、水文化学特征以及地下水年龄 interpretation 相关。

**参与同意**
作者声明他们参与了本文的撰写,并保留了他们的同意记录。

**发表同意**
作者授权出版商发表该研究成果。

**伦理批准**
我们声明这项研究是我们自己的原创工作,尚未提交给任何期刊。

**资金支持**
作者在提交该研究时未获得任何组织的资助。

**CRedIT作者贡献声明**
Katarzyna Samborska-Goik:概念化、数据整理、形式分析、方法论、软件使用、监督、验证、数据可视化、初稿撰写、审稿与编辑。
Ondra Sracek:数据整理、审稿与编辑。

**利益冲突声明**
作者声明与任何组织或实体均无关联或参与,无论是在财务利益(如酬金、教育资助、参与演讲机构、就业、咨询服务、股权持有或其他权益,以及专家证词或专利许可安排)方面,还是在非财务利益(如个人或专业关系、隶属关系、知识或信仰)方面,均与所讨论的主题或材料无关。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号