一种用于地质复杂地区地球化学河流沉积物数据解释的新统计方法：德国西南部黑森林中部地区的河流沉积物调查

《Journal of Geochemical Exploration》：A new statistical approach for geochemical stream sediment data interpretation in geologically complex terranes: Stream sediment reconnaissance survey in middle Black Forest, South Western Germany

【字体：大中小】 时间：2026年03月15日 来源：Journal of Geochemical Exploration 3.3

编辑推荐：

　　本文以德国黑森林Kinzig流域为例，提出线性对数（lin-log）数据预处理结合K-means与模糊聚类分析的新方法，有效识别复杂地质背景下流沉积物中的微小地球化学异常及背景特征，相比传统ilr/alr方法提升10%-50%的识别精度。

作者：Utz. Kramar、Hans-Christoph Einfalt、Jochen Kolb、Aleksej Mrinski、Kirsten Drüppel 公司：Kramar und Hoeppener-Kramar Consulting GBR（德国卡尔斯鲁厄）

摘要

在地球化学勘探和环境调查中，通常需要检测大量样品以分析其中的多种成分。从这些大量数据中提取相关信息，最佳方法是使用适当的统计方法。本文以德国黑森林地区的Kinzig区域为例，介绍了一种溪流沉积物勘探方法。在该地区存在多种不同的地质岩层，对于每种岩层，必须使用其特征背景浓度来识别微小异常值。因此，需要通过逐步统计分析对不同的岩层和异常值进行地球化学映射。为了确定这些异常值，必须对溪流沉积物的分析数据进行处理（数据预处理）；之后再对这些数据进行处理，例如进行主成分分析、因子分析或聚类分析。考虑到溪流沉积物数据并非简单地服从正态分布或对数正态分布，我们证明了一种新的数据预处理方法与常用的方法（如ilr、alr）结合K-means聚类分析和模糊聚类分析相比，能够获得更好的结果。新的线性-对数（lin-log）方法在识别异常值和复杂地球化学背景方面，比clr/ilr方法提高了10%的准确性，比alr方法提高了50%的准确性。lin-log方法与K-means和模糊聚类的结合被证明是识别已知矿化异常或环境污染物以及复杂地球化学背景的有效工具。

引言

地球化学勘探和环境分析认为，矿床附近或人为污染区域的物质化学成分与没有矿床或污染的类似物质的化学成分不同（Govett, 1983）。从溪流中采集的沉积物代表了上游区域岩石和覆盖层的混合物，每种来源都贡献了其独特的化学特征（Ottensen和Theobald, 1994；Chen等人, 2025）。因此，单个溪流沉积物样本仅能代表排水系统的一小部分区域。为了检测沉积物中的异常值，需要分析大量样本。此外，仅通过分析一个元素通常无法提取相关信息，因此需要使用多变量统计方法（Howarth和Sinding-Larsen, 1983；Grunsky, 2010；Zhao等人, 2024）。

在地球化学调查中，常用的方法包括主成分分析（PCA）或因子分析（FA）（Gielar等人, 2012；Liu等人, 2014；Tiangang等人, 2024；Dominech等人, 2025）、逐步因子分析（Yousefi等人, 2014；Yousefi等人, 2012）、K-means聚类分析（Clare和Cohen, 2001；Templ等人, 2008）或模糊C均值（FCM）聚类分析（Rantitsch, 2000；Hajihosseinlou等人, 2024）。

传统的单变量方法（如平均值、标准差）以及一些多变量方法（如PCA和FA）假设变量值服从正态分布或对数正态分布（Timm, 2002；Reimann和Filzmoser, 2000）。然而，地球化学调查中的大多数数据，尤其是溪流沉积物数据，并不服从正态分布或对数正态分布（Bj?rklund, 1983）。风化和沉积作用改变了溪流沉积物中记录的岩石特异性地球化学特征（Matschullat等人, 2000）。与溪流系统接触的脉状矿床会产生一个近似指数衰减的地球化学信号，该信号叠加在基岩产生的地球化学背景信号上，看起来类似于对数正态分布，但实际上是由一个分布和一个近似指数衰减函数组合而成的（见图2）。因此，不应使用因子分析来评估复杂的区域性或环境地球化学数据（Reimann等人, 2002）。

对于这类复杂的数据，数据分析必须分多个层次进行。首先进行单变量分析以确定分布形态，然后进行双变量分析以识别相关性、分组和异常值。最后使用多变量方法（如聚类分析）来区分不同组别（例如基岩和热液叠加或人为污染），或使用主成分分析来揭示过程的功能关系（例如风化作用），并始终通过GIS等手段对结果进行空间可视化。

对于单变量分析，应优先选择对异常值和频率分布类型不敏感的稳健方法，如中位数、四分位数、箱线图、密度迹线或一维散点图（Reimann等人, 2005；Pucko等人, 2024；Chambers等人, 1983；Hoaglin等人, 1983）。为了将频率分布转换为变量的准正态分布，通常会对数据应用非稳健的alr（Aitchison, 1986）、clr或ilr（Egozcue等人, 2003；Egozcue等人, 2024；Hron等人, 2022）变换（Filzmoser等人, 2012；Martín-Fernández等人, 2012）。然而，alr、clr和ilr变换没有考虑到溪流沉积物中的元素浓度并非对数正态分布，而是由背景浓度的正态分布和异常值（如果存在的话）的近似指数衰减函数叠加而成。因此，使用alr、clr或ilr变换无法识别溪流沉积物中的微弱异常值。

如果忽略数据的这种复杂叠加关系，在地质结构复杂的区域就无法总是识别出不同的岩层。我们的方法是发明了一种新的数据变换方法，在应用稳健的数据变换方法Lin-log之后添加对数分布（见第3.3.2节）。基于单变量分析结果，在优化数据变换后应用逐步受限的模糊聚类（Kramar, 1995）。这些结果用于识别底层岩层以及包含已知矿脉和可能未知矿化的异常区域。为了优化数据变换，我们将稳健的线性变换、alr变换、clr变换和ilr变换与基于溪流沉积物数据开发的新lin-log变换进行了比较。

研究区域

Kinzig区域位于德国西南部的黑森林中部（见图1）。该区域由中欧瓦里斯坎造山带的Moldanubian期岩浆岩和变质岩构成，上面覆盖着晚古生代至中生代的沉积岩，主要是上三叠统的Buntsandstein砂岩（Kalt等人, 1994；Krohe和Eisbacher, 1988）。这里曾是银、锌、钴、铅和铜矿的密集开采区，主要矿脉含有五种元素（Markl等人）。

采样与样品制备

我们使用德国黑森林Kinzig山谷地区的溪流沉积物数据作为天然实验室，因为该地区的地质结构复杂且已详细测绘，同时存在大量特征明确的矿脉（银、铋、钴、镍、砷），以及大量历史采矿产生的尾矿，这些尾矿是该地区最严重的环境污染物。总共从约400平方公里的区域内采集了1576个溪流沉积物样本，并分析了25种主要元素和微量元素。

地球化学

溪流沉积物样本的地球化学数据显示，主要元素的变异比为4–130（最大值/最小值），特征元素的变异比为7–124；中位数值分别为：SiO₂ 47 wt%，TiO₂ 0.65 wt%，Fe₂O₃ 4 wt%，CaO 1.1 wt%，K₂O 2.67 wt%，Cr 59 mg/kg，Ga 16.6 mg/kg，Rb 129 mg/kg，Zr 428 mg/kg，Nb 10 mg/kg，Sn 4.2 mg/kg，Ce 81 mg/kg（表3）。微量元素的变异范围更广，最大值/最小值比为14–312，中位数值分别为S 835 mg/kg，...

讨论

将alr、clr和ilr变换后的数值与稳健线性和稳健线性对数变换结果进行了比较，并通过密度迹线和聚类分析进行了验证。结果表明，alr、clr和ilr变换能够抑制不同岩类型和异常群体之间的微量元素组成差异，尽管这些岩类型的化学成分差异较小。

总结与结论

溪流沉积物中的主要元素和微量元素组成受源区岩石的矿物学和化学成分、地质成因和人为异常、风化作用及沉积条件的控制。我们在Kinzig山谷的研究区域发现了具有多种地球化学成分的岩石（如正片麻岩和副片麻岩、正长岩、花岗闪长岩和石英砂岩），其中含有富集银、锑、砷、钴等元素的熱液氟石-重晶石矿脉。

作者贡献声明

Utz. Kramar：撰写、审稿与编辑、初稿撰写、方法论制定、调查实施、数据分析、概念化。Hans-Christoph Einfalt：撰写、审稿与编辑、资源管理、项目协调。Jochen Kolb：撰写、审稿与编辑。Aleksej Mrinski：初稿撰写、资源管理、方法论制定、数据管理。Kirsten Drüppel：撰写、审稿与编辑、资源管理、数据管理。

未引用的参考文献

Bezdek, 1981

Bons等人, 2014

Filzmoser等人, 2009

Ivanisevic等人, 2023

Kumar Rai等人, 2026

Sadeghi和Cohen, 2023

Shahrestani和Sanislav, 2025

南格陵兰溪流沉积物地球化学数据的空间因子分析, 1997

Stenger等人, 1989

利益冲突声明

作者声明没有已知的财务利益或个人关系可能影响本文的研究结果。

致谢

作者感谢所有参与勘探课程的KIT学生，他们完成了采样、样品制备和分析工作。此外，还要感谢Mirko Sauer在其硕士论文中补充了采样区域和分析工作。特别感谢Sachtleben Bergbau GmbH & Co KG公司的Nelles先生和Sch?pf先生，以及Haslach市政府在课程组织和样品准备方面的支持。

摘要

引言