《Journal of Geochemical Exploration》:A machine learning approach in type-discrimination and exploration of gold deposits using pyrite trace element chemistry
编辑推荐:
方铅矿痕量元素组成结合XGBoost、LightGBM和CatBoost三种机器学习算法,实现了对Carlin型、高/低硫化热液型、斑岩型、IOCG型及造山带型金矿床的准确分类(>94%准确率),并区分 barren(Se含量高)与 mineralized(Au、Sb含量高)方铅矿(>97%准确率)。通过SHAP分析识别出Cu、Co、As为关键判别元素,并开发了在线模型应用平台。
阿米特·蒙达尔(Amit Mondal)| 鲁帕什里·萨哈(Rupashree Saha)| 德瓦希什·乌帕德亚耶(Dewashish Upadhyay)| 斯姆鲁蒂·普拉卡什·马尔里克(Smruti Prakash Mallick)| 卡马尔·洛昌·普鲁塞特(Kamal Lochan Pruseth)| 阿扬·查克拉博蒂(Ayan Chakraborty)
印度理工学院地质与地球物理系,卡尔阿格普尔,721302,印度
摘要
黄铁矿的微量元素组成可以为我们提供关于矿床形成的宝贵见解。然而,由于微量元素特征的重叠,区分不同类型的矿床仍然具有挑战性。本研究利用先进的机器学习技术,根据黄铁矿的微量元素组成将其与六种不同类型的金矿床(即卡林型(Carlin)、高硫化热液型(HSE)、铁氧化物铜金型(IOCG)、低硫化热液型(LSE)、造山型和斑岩型)进行区分。我们汇编了一个包含112个矿床中8598个黄铁矿分析数据的大型数据集。应用了三种最先进的机器学习(ML)算法——XGBoost、LightGBM和CatBoost——基于十一种微量元素对矿床类型进行分类。所有三种模型在矿床类型区分方面的准确率均超过94%。通过SHAP(Shapley Additive Explanations)分析确定了每种矿床类型的关键区分元素。控制这种区分作用的最重要元素是Cu、Co和As。我们还构建了ML模型来区分贫瘠的沉积黄铁矿和矿化的黄铁矿,在所有三种模型中实现了超过97%的分类准确率。金、锑(Sb)和硒(Se)被确定为关键区分元素。与金矿化相关的黄铁矿含有较高浓度的Au和Sb,反映了热液富集作用,而贫瘠的沉积黄铁矿通常表现出较高的Se浓度。我们开发了一个用户友好的网络应用程序,可以利用黄铁矿的微量元素数据实时分类金矿床。通过皮亚尼安齐造山金矿床和双龙IOCG矿床的案例研究证明了这些模型的有效性。
引言
热液金矿床有多种类型,包括造山型、卡林型、高硫化热液型(HSE)、低硫化热液型(LSE)、斑岩型和铁氧化物铜金型(IOCG)(Cline等人,2005年;Goldfarb等人,2005年;Muntean等人,2011年;Goldfarb和Groves,2015年),这些类型在矿化过程中存在显著差异。因此,金矿勘探具有挑战性,需要优先了解具体的矿床类型/矿化方式。全球有大量的金矿床的地球化学数据,这为区分不同金矿床之间的化学差异提供了机会。最近的一些研究利用机器学习和多变量统计分析处理大数据,以解决复杂的地质问题(Zhai等人,2018年;Gregory等人,2019年;Dmitrijeva等人,2020年;Saha等人,2021年;Zhong等人,2021年;Wang等人,2021a年;Parsa等人,2022年;Miranda等人,2022年;Babedi等人,2022年;Zhao等人,2023年;Cao等人,2023年;Saha等人,2024年;Wang等人,2024年;Guo和Chen,2024年;Bhuyan等人,2025年)。然而,确定矿床的起源具有挑战性,因为不同矿床类型的矿物可能具有重叠的化学性质(Huang等人,2018年;Wang等人,2021b年)。黄铁矿几乎存在于所有类型的金矿床中。因此,黄铁矿的地球化学变化可能用于区分矿床类型,并限制不同金矿床中成矿流体的性质和来源(Cook等人,2013年;Belousov等人,2016年;Gregory等人,2016年;Hazarika等人,2017年;Voute等人,2019年;Baidya等人,2021年;Zhang等人,2022年)。此外,能够区分贫瘠的沉积黄铁矿和与金矿化相关的黄铁矿对于勘探工作也有帮助。
Babedi等人(2022年)汇编了一个全球黄铁矿主要和微量元素数据集,并利用它深入了解了不同矿床类型的地球化学特征。然而,该研究依赖于传统的统计方法。相比之下,少数近期研究使用了机器学习(ML)技术对黄铁矿成分进行矿床类型分类。例如,Gregory等人(2019年)使用随机森林算法对不同类型的黄铁矿进行了分类,取得了良好的分类准确率。然而,他们的数据集缺乏一些经济上重要的矿床类型,如卡林型和IOCG型,并且分析数量有限。Zhong等人(2021年)使用人工神经网络和支持向量机在较小的数据集上进行了分类,准确率较低,矿床类型代表性也有限。Cao等人(2023年)专门研究了造山型金矿床,利用4092个黄铁矿分析数据建立了地球化学指标。Wang等人(2024年)应用决策图来可视化黄铁矿数据的ML分类结果,提高了可解释性,但使用的数据集相对较小。尽管有这些研究,但在考虑所有多样化的矿床类型时,对金矿化过程的理解仍存在一些差距。
在这项研究中,我们汇编了一个包含112个矿床中8598个黄铁矿微量元素分析数据的大型数据集,涵盖了六种主要金矿床类型。我们使用三种最先进的ML算法(XGBoost、LightGBM和CatBoost)构建了能够高准确率区分上述矿床类型的ML模型。我们的数据集和ML模型提供了更全面的覆盖范围,使得模型更加稳健和通用。我们还使用SHAP(Shapley Additive Explanations)算法来确定黄铁矿中哪些微量元素对模型预测和矿床类型区分贡献最大。这为了解单个关键元素在分类决策中的作用提供了重要见解,可能在矿产勘探中具有价值。此外,我们还尝试使用基于ML的方法,利用其微量元素数据区分矿化的黄铁矿和贫瘠的沉积黄铁矿。最后,我们通过皮亚尼安齐造山金矿床和双龙IOCG矿床的黄铁矿微量元素数据案例研究,展示了我们模型的实际应用能力。值得注意的是,我们开发了一个用户友好的网络应用程序,允许用户使用我们训练的模型对未知的黄铁矿微量元素数据集进行矿床类型识别。
数据编译
我们从已发表的文献中编译了一个全面的数据集。该数据集包含来自112个不同金矿/矿物/矿床的8598个黄铁矿微量元素测量结果(补充表1)。该数据集包括六种不同金矿床类型的黄铁矿分析结果:5160个造山型矿床、497个卡林型矿床、648个斑岩型矿床、741个IOCG矿床、851个高硫化热液型矿床和701个低硫化热液型矿床的分析结果。
描述性统计和散点图
我们首先可视化了数据分布,并进行了描述性统计分析,如计算每个变量的平均值、标准差以及最高值和最低值,还包括数据计数和缺失计数。数据集包括11种黄铁矿微量元素,包括Au(0–3200 ppm)、Co(0.001–17,000 ppm)、Ni(0.0075–10,390 ppm)、Cu(0–42,500 ppm)、Zn(0–5600 ppm)、As(0.042–122,200 ppm)、Se(0.02–2200 ppm)、Sb(0–25,400 ppm)、Pb(0–10,789 ppm)、Bi(0–2800 ppm)等。
不同类型金矿床中黄铁矿的微量元素特征
黄铁矿的微量元素组成受到矿床形成地质环境、流体来源和整体构造环境的控制。下面我们讨论了六种金矿床中黄铁矿的微量元素特征,并将其与相关的成矿过程联系起来(图7、图8、图9)。然而,我们需要记住Stepanov等人(2021年)的实验和自然观察表明,在某些条件下砷在黄铁矿中的溶解度会发生变化。来自中国扬子克拉通皮亚尼安齐造山金矿床和中国天山东部双龙IOCG矿床的案例研究
为了评估我们的ML模型在识别未知矿床类型方面的适用性,我们使用来自中国皮亚尼安齐金矿床和双龙金矿床的黄铁矿微量元素分析进行了两项案例研究。这些分析并不属于我们的工作/训练数据集。
ML模型的Web应用程序界面
我们使用Python的Streamlit包开发了一个直观的网络应用程序。该应用程序部署在Heroku平台上,旨在根据黄铁矿的微量元素数据对矿床类型进行分类。用户可以交互并可视化我们的工作数据库和模型输出。在应用模型时,建议用户上传从金矿化系统中获得的、经过纹理和共生关系限定的黄铁矿数据。
结论
本研究利用先进的ML模型准确区分了贫瘠的沉积黄铁矿和矿化的黄铁矿(包括卡林型、HSE型、IOCG型、LSE型、造山型和斑岩型),并准确分类了不同类型的金矿床。XGBoost、LightGBM和CatBoost模型在区分贫瘠沉积黄铁矿和矿化黄铁矿方面的准确率超过了97%。Au、Sb和Se等元素对于区分这六种类型的黄铁矿至关重要。
CRediT作者贡献声明
阿米特·蒙达尔(Amit Mondal):撰写 – 审稿与编辑、初稿撰写、可视化、验证、软件开发、方法论研究、数据分析、概念化。鲁帕什里·萨哈(Rupashree Saha):撰写 – 审稿与编辑、初稿撰写、软件开发、方法论研究、数据分析。德瓦希什·乌帕德亚耶(Dewashish Upadhyay):撰写 – 审稿与编辑、监督、研究。斯姆鲁蒂·普拉卡什·马尔里克(Smruti Prakash Mallick):撰写 – 审稿与编辑、数据分析。卡马尔·洛昌·普鲁塞特(Kamal Lochan Pruseth):撰写 – 审稿与编辑。
利益冲突声明
作者声明他们没有已知的竞争性财务利益或个人关系可能影响本文所述的工作。
致谢
AM感谢印度新德里的科学与工业研究委员会(CSIR)提供的博士学位奖学金。同时,衷心感谢A.S. Stepanov和一位匿名审稿人的建设性评论和建议,这些评论和建议显著帮助改进了手稿。还要感谢M Sadeghi和P. Ebrahimi在编辑方面的工作。