矿产潜力绘图(MPM)是一门利用知识和数据驱动的地理计算技术来提取、权衡和综合多源地理信息,以支持金属勘探的科学和技术(Bonham-Carter, 1994; Carranza, 2011, 2008; Yousefi et al., 2019; Saremi et al., 2024; Hoseinzade et al., 2025)。近年来,随着人工智能时代的到来,机器学习(ML)和深度学习(DL)技术因其在处理具有复杂概率分布的多源地球科学数据集以及学习预测图与目标变量之间的非线性关系方面的强大能力而受到广泛关注(Karpatne et al., 2018; Bergen et al., 2019; Reichstein et al., 2019)。这些算法大致可以分为监督学习和无监督学习两类。在监督学习场景中,通常会训练分类器来学习预测层与标记勘探数据之间的空间交互(Carranza and Laborte, 2015a; Rodriguez-Galiano et al., 2015)。相比之下,无监督模型完全基于未标记的勘探数据进行训练,寻找多源地球科学数据集中的潜在空间模式(Chen, 2015; Chen and Wu, 2017; Esmaeiloghli et al., 2021a; Esmaeiloghli and Yousefi, 2025; Masoumi et al., 2026)。
近年来,在各种ML框架中,提升学习技术因其能够量化勘探变量之间的非线性关系、提供关于预测层对潜力模型贡献的信息、更短的运行时间以及较低的过拟合可能性而成为数据驱动MPM中用户友好的解决方案(例如,Brandmeier et al., 2020; Fan et al., 2023)。这些算法遵循集成学习方法,通过组合性能略优于随机猜测的分类器来获得更高性能的分类函数(Brandmeier et al., 2020)。表1概述了在各种实际案例研究中成功应用提升算法进行矿产潜力预测的研究成果。可以清楚地看到,XGBoost(即极端梯度提升)已成为矿产勘探文献中预测建模的旗舰提升模型(表1)。它提供了可扩展、可解释的工作流程,并因其能够产生稳健的结果、提高准确性和缩短执行时间而优于其他ML/DL算法。此外,XGBoost模型能够处理大型数据集,从而提供可解释的结果,并内置了交叉验证和提前停止功能(Chen and Guestrin, 2016)。
尽管XGBoost模型在提高预测能力方面表现出色,但其应用仍需要微调初始化参数(即超参数)以实现最佳的MPM预测(Yin and Li, 2022; Roshanravan and Kreuzer, 2025)。超参数的错误初始化可能会降低学习函数的性能。相反,准确的超参数校准可以显著提高ML模型的准确性、稳健性和泛化能力。然而,超参数调整往往既费时又需要专业知识(Feurer and Hutter, 2019; Yang and Shami, 2020)。在矿产勘探领域,常见的超参数调整方法包括试错搜索(例如,Xiong and Zuo, 2022; Soltani et al., 2025, 2024)、随机搜索(例如,Silva dos Santos et al., 2022; Fan et al., 2023)、网格搜索(例如,Shaw et al., 2022; Dong and Zhang, 2024)和贝叶斯优化(例如,Fan et al., 2023, 2022; Yin and Li, 2022)。试错搜索是一种手动测试策略,对于多个超参数来说并不容易实现。相比之下,网格搜索需要测试所有超参数的组合,这种过程不节省内存且不适合高维计算。随机搜索的执行速度比网格搜索快,但无法保证找到全局最优解(Feurer et al., 2022)。贝叶斯优化策略通过概率替代建模提供样本效率,而元启发式算法则无需梯度信息就能在高维、非凸搜索空间中导航。此外,元启发式算法在超参数调整过程中保持了探索与利用之间的平衡(Yang, 2010a, 2010b)。这些特性使它们特别适合优化复杂的ML模型,因为在这些模型中超参数是相互依赖的,且响应面不规则。因此,最近的研究人员使用元启发式优化器来克服局部最优问题并发现全局最优超参数(表2)。这些优化器旨在探索可用解决方案的空间,并在传统策略不足或不切实际时同时检查和比较多个解决方案,从而收敛到全局最优解(Yang, 2010a, 2010b)。
对于XGBoost模型来说,确定最优超参数是一个更为复杂的挑战,因为与传统的ML模型(例如RF和SVM)不同,它需要调整更多的超参数才能实现高精度的MPM预测(Parsa, 2021; Yin and Li, 2022)。如表2所示,目前还没有研究使用元启发式算法来调整XGBoost相关超参数。受此启发,我们组织了这项研究,开发了一个计算框架,该框架采用粒子群优化(PSO)算法来找到能够产生最高精度MPM预测的超参数。PSO是群体智能领域中用于优化工程问题的成熟元启发式算法(Shi, 2001)。当感兴趣的解位于连续数值空间时,它具有比其他元启发式优化方法更明显的优势(Eberhart and Kennedy, 1995)。因此,当超参数空间包括整数和连续参数时,PSO适合优化XGBoost相关超参数,其连续性质允许进行细粒度的探索而不会产生离散化伪影。此外,PSO算法的基于种群的架构使得候选超参数设置的并行评估成为可能,从而加速了计算密集型基于树的模型的优化过程。PSO优化的XGBoost模型被命名为PSO-XGBoost,并在R编程语言中实现。通过将其应用于伊朗南部Baft-Sarduiyeh地区的斑岩型铜矿化勘探目标,证明了PSO-XGBoost在MPM中的相关性。混淆矩阵和接收者操作特征(ROC)曲线被用作定量和图形评估指标,以评估PSO-XGBoost模型在预测研究区域铜矿存在性方面的有效性。