多变量地球化学在矿床特征描述中的应用:以加拿大安大略省西部含钯矿的Lac Des Iles矿床群为例

《Journal of Geochemical Exploration》:Applications of multivariate geochemistry to mineral deposit characterization: A case study from the Pd-mineralized Lac Des Iles Complex, western Ontario, Canada

【字体: 时间:2026年03月15日 来源:Journal of Geochemical Exploration 3.3

编辑推荐:

  UMAP降维算法在Lac des Iles Complex高维地质数据分析中的应用,通过处理含12,440个样本的商用全岩地球化学数据,揭示不同岩性(如 dunite、clinopyroxenite)的非线性结构特征,并验证算法在岩性分类、成矿过程解析中的有效性,强调需结合地质学方法综合应用。

  
威廉·D·史密斯 | 刘坤·张 | 贝赫纳姆·萨德吉 | M·利奥内尔·琼 | 詹姆斯·E·芒加尔
CSIRO矿物资源部,迪克·佩里大道26号,肯辛顿,珀斯,西澳大利亚州,6151,澳大利亚

摘要

降维算法越来越多地应用于高维地球化学数据集,以支持数据查询和岩石分类。然而,特别是在处理封闭的地球化学数据时,其负责任的实施需要仔细考虑。本研究将均匀流形近似与投影(UMAP)应用于来自钯矿化Lac des Iles复合体(LDIC)的商业化全岩地球化学数据集。LDIC是一个理想的案例研究,因为它包含不同的化学成分和多种岩石类型,这些类型又受到纹理变化和热液蚀变的叠加影响,使得地质情况难以系统地建模和解释。
工作流程包括:(1)重新计算无水、无硫化物的成分;(2)选择适当的输入变量;(3)填补缺失值;(4)进行转换以减轻闭合效应;(5)调整算法超参数;(6)评估低维嵌入;(7)查询和选择聚类。对UMAP嵌入的查询表明,独特的、通常接近单矿物的岩石类型(例如辉石岩、单斜辉石岩)比其他岩石类型(例如辉长岩、辉长闪长岩)更一致地聚类。这些独特的岩石类型也比其他岩石类型更一致地被记录下来,通过将生成的客观聚类与人员记录的岩石类型进行比较,可以突出那些特别难以一致记录的岩石类型。
在累积的镁铁质-超镁铁质岩石中,局部UMAP结构反映了累积的矿物组成、岩浆间熔体比例和蚀变情况,而全局结构可能与岩浆分化有关。因此,UMAP嵌入有助于探索地球化学结构以及任何对矿化的岩石地球化学控制因素。从UMAP嵌入中得出的客观聚类可以作为分类变量,帮助生成定制的区分图、检查钻芯记录并构建三维地质模型。重要的是,降维算法是辅助数据查询的工具;它们不提供答案,但有助于地质学家提出有洞察力的问题。如果使用这些算法,应将其与岩石学、岩石地球化学评估和地理空间分析结合使用。

引言

降维算法在矿产勘探领域中的应用越来越广泛,用于查询庞大且高维(即包含许多化学元素)的地球化学数据集。这些数据集通常包含数十种主要元素、次要元素和微量元素的浓度,以及元数据和用户添加的计算结果(例如标准化矿物学、元素比率)。传统的解释方法是通过双变量或多变量图表来分析化学变化。当人类难以通过众多双变量图表解释高维变化时,多变量图表可以捕捉高维数据结构,并将其重新投影到更易于处理的低维空间中(van der Maaten和Hinton,2008;McInnes等人,2018)。多变量分析由于集成到了商业软件中,因此易于地质科学家使用;然而,其负责任的使用(即适当的预处理、参数调整、可视化)以及输出的解释对于地质科学数据来说仍然具有挑战性。
在地质科学中,多变量算法目前用于单元区分和化学成分划分(Horrocks等人,2019)、自动化钻芯记录(Hill等人,2021)以及勘探潜力绘图(Chudasama等人,2022)。这些算法通过计算低维嵌入来降低数据集的维度(即变量数量),同时试图保留高维数据集的结构。主成分分析是一种线性降维方法的例子(即许多元素变为少数几个主成分),它假设数据集中的变化可以通过线性关系来捕捉(Jolliffe和Cadima,2016及其中的参考文献);然而,非线性降维方法,如t分布随机邻居嵌入(t-SNE:van der Maaten和Hinton,2008)和均匀流形近似与投影(UMAP:McInnes等人,2018),可以捕捉复杂地球化学数据集中的非线性关系。尽管多变量算法在客观查询高维数据集方面更优越,但仍需适当配置算法,并能够在其矿物系统的背景下解释低维嵌入。
矿物系统是对岩石圈尺度上成矿过程进行概念化时的整体、多尺度考虑(Wyborn等人,1994;McCuaig和Hronsky,2014)。岩浆硫化物矿物系统包括以下阶段:(1)构造环境;(2)富集的原始熔体和母熔体的形成;(3)母熔体的地壳迁移;(4)母熔体的侵位;(5)硫化物熔体的分离、富集和沉积;(6)保存和可检测性(Naldrett,2011;Barnes等人,2016)。地球物理学是解决第(3)和第(4)阶段问题的主要工具,岩石地球化学对于理解第(2)和第(5)阶段至关重要,两者结合对于发现有利的矿化环境和隐蔽的矿体至关重要。本研究探讨了UMAP多变量算法在查询加拿大安大略省西部Lac des Iles复合体(LDIC)的商业化地球化学数据集方面的实用性。研究结论是,当适当应用时,多变量算法不是提供答案的工具,但它们是查询复杂地球化学数据集的宝贵工具。

部分内容摘录

Lac des Iles复合体的地质

LDIC是几个新太古代(约26.9亿年前)形成的镁铁质-超镁铁质侵入体之一,它们侵入到沿NE走向的断层结构中的tonalitic片麻岩中,这些断层结构从Wabigoon-Quetico次省边界延伸出来(Brügmann等人,1997;Stone等人,2003)。LDIC大致分为北部主要为超镁铁质的复合体和南部主要为镁铁质的较老复合体(图1)。该地区的地质情况已由多位研究人员描述过(

数据来源和方法

LDIC的商业化全岩地球化学数据集(n = 12,440个样本)由Impala Canada提供。样本代表了大约1米间隔的半芯样本,由ALS Geochemistry(加拿大温哥华)进行准备和分析。关于采样、数据采集和处理的信息总结在图2中,并在电子补充材料1(ESM 1)中详细说明。标准化矿物学使用shinyNORRRM(González-Guzmán等人,2023)计算得出。数据

算法性能和保留指标

在一个标准笔记本电脑上,对包含12,440个观测值的数据集进行100次优化算法迭代(该算法使用多种子平均和复合目标函数)大约需要282分钟。这意味着每次迭代耗时不到三分钟。通过减少每次迭代使用的随机子样本大小、简化目标函数或减少评估的种子数量,可以减少运行时间。其他研究表明

结论

多变量算法是查询庞大且高维地球化学数据集的强大工具。随着这些算法变得更加易用和广泛使用,有必要在其地质背景的背景下彻底检查其输出,以识别有意义的模式并产生可检验的假设。本文展示了如何利用非线性降维算法(如UMAP)来获得更深入的见解

CRediT作者贡献声明

威廉·D·史密斯:撰写——审阅与编辑、撰写——初稿、可视化、软件、资源管理、方法论、调查、正式分析、数据管理。刘坤·张:撰写——审阅与编辑、验证、方法论、正式分析。贝赫纳姆·萨德吉:验证、方法论、正式分析。M·利奥内尔·琼:撰写——审阅与编辑、验证、数据管理、概念化。詹姆斯·E·芒加尔:撰写——审阅与编辑、监督、调查,

未引用的参考文献

Ozgode Yigin和Saygili,2022 Xu等人,2019 Zhou Li等人,2025

利益冲突声明

作者声明他们没有已知的利益冲突或个人关系可能会影响本文所述的工作。

致谢

作者感谢Impala Canada提供原始地球化学数据集并允许发表研究成果。这项工作得到了James E Mungall获得的GC-130029S项目的资助。感谢Morgan Williams博士、Margaux Le Vaillant博士和M Christopher Jenkins博士对早期手稿提供的建设性评论。感谢四位匿名审稿人和主编Martiya Sadeghi博士提出的意见,这些意见有助于改进手稿的质量。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号