地下水对于维持生态系统、促进社会经济发展以及保障人类生存至关重要(Li等人,2025年)。由于其较高的纯度、稳定性和可用性,地下水通常被认为比地表水更具有重要意义,而且其提取和利用成本也更为经济(Berhanu等人,2024年)。然而,由于管理不善和保护不足,地下水越来越容易受到多种来源的污染。地下水质量受到自然地质过程和人类活动的综合影响,如地质构造、水文地质条件、矿物组成、水化学反应、蒸发作用和过度抽取(Meena等人,2025年;Devi等人,2021年)。
氟化物( )是最轻的卤素元素,通常通过含氟矿物的溶解和分解进入地下水,这些矿物包括萤石、角闪石、白云母和黑云母,它们是岩石和含水层中的主要氟化物来源(Devi等人,2021年;Hao等人,2022年)。氟化物污染对饮用水安全和人类健康构成重大风险。长期饮用含氟地下水可能导致严重的健康问题,包括骨骼氟中毒、癌症和焦虑症。因此,评估地下水污染物的空间和季节性变化对于有效管理当地水资源、保护公共卫生以及实现可持续发展目标(SDG-6)至关重要(Qu等人,2023年;Giri等人,2021年;Zahra等人,2025年;Sridhar等人,2025a;Xie等人,2025年)。
在印度,氟中毒仍然是一个普遍存在的公共卫生问题,影响了大约6600万人,涉及21个邦(Mohammed等人,2024年;Prapanchan等人,2025年;Ambade等人,2024年)。评估地下水的物理化学特性对于判断其适用性至关重要(APHA,2005年;Nadjai等人,2024年;WHO,2022年)。此类评估还有助于了解地下水地球化学特性,并通过考虑季节性变化来识别主要控制因素(Li等人,2025年;Ambade等人,2024年)。
多变量和地质统计技术已被广泛用于检测地下水质量并识别潜在污染源(Iqbal等人,2025年;Rashid等人,2023年;Ruidas等人,2024年;Rondano等人,2020年;Mostafa等人,2024年;Zango等人,2025年;Faraji和Shahryari,2023年)。相关性分析、水质指数建模和主成分分析(PCA)等方法在确定污染源和评估水质适用性方面非常有效(Ali等人,2024年)。传统的水质指数方法在处理复杂的水文地质系统时存在局限性。为克服这些不足,研究人员开发了改进的指数,包括基于熵的加权方案,这些方案减少了参数重要性分配的主观性,并保留了关键的水质信息(Singh等人,2024a;Veskovic等人,2024a;Gao等人,2024年;Kumar和Augustine,2022年;Zhang等人,2024年)。
机器学习(ML)方法因能够快速准确地估计水质指数而受到越来越多的关注,尤其是在处理非线性关系、复杂交互作用和异构数据集时(Singh等人,2024b;Das,2025年)。尽管取得了这些进展,许多先前的研究仍然依赖于简单的训练-测试数据分割,并未充分考虑季节性变化或严格评估模型的泛化能力和过拟合问题(Tian等人,2025年;Rajeev等人,2025年;Sarker等人,2025年)。
基于此背景,本研究将基于熵的水质指数(EGWQI)与潘巴尔河流域四个不同水文地质时期的机器学习分类相结合,这四个时期分别是季风前(PRMS)、东北季风(NEMS)、西南季风(SWMS)和季风后(POMS)。模型性能通过独立保留测试和分层交叉验证进行评估,特别针对人工神经网络(ANN)和XGBoost等复杂模型,以明确评估其鲁棒性和过拟合情况(Das,2025年;Elmotawakkil等人,2025年)。这种综合框架相比大多数现有的区域研究,能够更透明和可靠地评估地下水质量动态。
为了评估暴露机制对公共健康的影响,已经建立了标准化的人类健康危害评估方法,美国环境保护署(USEPA,2014年)的框架是用于估计口服暴露途径相关潜在健康风险的最常用方法之一。全球范围内报告了地下水中氟化物水平升高的情况,特别是在巴基斯坦、韩国、印度、墨西哥、伊朗、中国、巴西、塞尔维亚和斯里兰卡(Arya等人,2021年;Su等人,2021年;Iqbal等人,2023年;Abdipour等人,2025年;Xiao等人,2022年;Ochoa等人,2023年;Veskovic等人,2024b)。在印度,约90%的人口依赖地下水满足生活需求,有17个邦的饮用水中氟化物含量超标,相关健康风险包括安得拉邦、古吉拉特邦、泰米尔纳德邦、奥里萨邦和北方邦(Arya等人,2021年;Parveen等人,2025年;Adimalla和Qian,2023年;Patil等人,2024年)。在泰米尔纳德邦,有22个地区(Ariyalur、Erode、Dindigul、Virudhunagar、Coimbatore、Villupuram、Cuddalore、Tirunelveli、Vellore、Tiruppur、Tuticorin、Salem、Theni、Pudukkottai、Sivaganga、Ramanathapuram、Krishnagiri、Perambalur、Namakkal、Kanyakumari、Madurai、Karur)的地下水氟化物含量较高(CGWB,2022年)。
潘巴尔河流域的地下水质量存在显著变化,高浓度的氟化物对当地居民的健康构成风险。虽然我们之前的研究主要集中在硝酸盐污染及其相关健康风险上(Sridhar等人,2025b),但在Samalpatti-Sevathur碳酸盐岩地区进行的更局部研究则探讨了氟化物和硝酸盐的联合污染及其相关健康风险和灌溉适宜性(Sridhar等人,2026年)。相比之下,本研究特别强调利用基于ML的EGWQI分类方法研究氟化物的季节性变化。具体而言,本研究旨在:(1)通过地质水化学分析评估整个地下水质量(包括PRMS、NEMS、POMS和SWMS),(2)通过PCA和相关性分析识别污染源,计算EGWQI,并评估不同年龄组的氟化物相关健康风险,(3)开发和验证包括SVM、XGBoost、Random Forest和AdaBoost在内的ML模型,以确定预测地下水质量数据集的最有效方法。本研究的主要意义在于为减少氟化物含量和确保脆弱地区的安全饮用水提供指导。此外,这些发现还有助于决策者改进预测和监测技术,从而有效管理地下水质量。最终,这项工作有助于实现可持续发展目标(SDGs)3和6,改善印度南部潘巴尔河流域的饮用水质量和居民健康。