基于机器学习的印度南部潘巴尔河流域氟化物污染地下水及其健康风险评估

《Physics and Chemistry of the Earth, Parts A/B/C》:Machine Learning Based Evaluation of Fluoride Contaminated Groundwater and Health Risks in the Pambar River Basin, South India

【字体: 时间:2026年02月05日 来源:Physics and Chemistry of the Earth, Parts A/B/C 3.0

编辑推荐:

  本研究对印度潘巴河湾区地下水氟含量及健康风险进行评估,采集2024-2025年四个季节共100份样本,发现43%超标。通过熵权法、主成分分析和多种机器学习模型(SVM最优),揭示水文地质过程主导氟污染,并评估不同年龄段的健康风险,为可持续管理提供依据。

  
C.N. 斯里达尔 | T. 苏布拉马尼 | 雷纳托·索马 | T. 迪内什库马尔
印度安娜大学工程学院地质系,金迪(CEG),钦奈600025

摘要

地下水中过量的氟化物已成为全球多个地区严重的健康问题,然而整合季节性变化、人类健康影响和预测建模的综合性研究仍然有限。本研究利用机器学习技术,分析了印度南部潘巴尔河流域地下水中氟化物的含量及其对健康的不良影响,以评估其是否适合饮用。2024年东北季风期间、季风后以及2025年西南季风期间共收集了100个地下水样本。水化学分析显示,该地区的水主要为碱性,钠和碳酸氢盐是主要离子。从四个季节性数据集中计算出的平均氟化物浓度为1.38毫克/升,其中43%的样本超过了世界卫生组织规定的1.5毫克/升的安全标准。相关性分析表明,钙会通过钙-氟化物沉淀作用降低氟化物浓度。主成分分析解释了64.9%-68.3%的变异,表明地质化学过程是主要控制因素,农业径流和废物渗漏也起到次要影响。基于熵的水质评估结果显示,36.75%的样本适合饮用,而58.75%的样本需要处理。在机器学习模型中,支持向量机(SVM)的表现最佳,随机森林(Random Forest)和极端梯度提升(Extreme Gradient Boosting)在数据量有限的情况下也表现良好。对人类健康危害的评估表明,儿童(50%)、青少年(45%)、女性(44%)和男性(43%)面临潜在的氟化物相关风险。这些发现为未来的地下水管理提供了基础,并强调了实施可持续措施以减轻潘巴尔河流域氟化物污染的重要性。

引言

地下水对于维持生态系统、促进社会经济发展以及保障人类生存至关重要(Li等人,2025年)。由于其较高的纯度、稳定性和可用性,地下水通常被认为比地表水更具有重要意义,而且其提取和利用成本也更为经济(Berhanu等人,2024年)。然而,由于管理不善和保护不足,地下水越来越容易受到多种来源的污染。地下水质量受到自然地质过程和人类活动的综合影响,如地质构造、水文地质条件、矿物组成、水化学反应、蒸发作用和过度抽取(Meena等人,2025年;Devi等人,2021年)。
氟化物()是最轻的卤素元素,通常通过含氟矿物的溶解和分解进入地下水,这些矿物包括萤石、角闪石、白云母和黑云母,它们是岩石和含水层中的主要氟化物来源(Devi等人,2021年;Hao等人,2022年)。氟化物污染对饮用水安全和人类健康构成重大风险。长期饮用含氟地下水可能导致严重的健康问题,包括骨骼氟中毒、癌症和焦虑症。因此,评估地下水污染物的空间和季节性变化对于有效管理当地水资源、保护公共卫生以及实现可持续发展目标(SDG-6)至关重要(Qu等人,2023年;Giri等人,2021年;Zahra等人,2025年;Sridhar等人,2025a;Xie等人,2025年)。
在印度,氟中毒仍然是一个普遍存在的公共卫生问题,影响了大约6600万人,涉及21个邦(Mohammed等人,2024年;Prapanchan等人,2025年;Ambade等人,2024年)。评估地下水的物理化学特性对于判断其适用性至关重要(APHA,2005年;Nadjai等人,2024年;WHO,2022年)。此类评估还有助于了解地下水地球化学特性,并通过考虑季节性变化来识别主要控制因素(Li等人,2025年;Ambade等人,2024年)。
多变量和地质统计技术已被广泛用于检测地下水质量并识别潜在污染源(Iqbal等人,2025年;Rashid等人,2023年;Ruidas等人,2024年;Rondano等人,2020年;Mostafa等人,2024年;Zango等人,2025年;Faraji和Shahryari,2023年)。相关性分析、水质指数建模和主成分分析(PCA)等方法在确定污染源和评估水质适用性方面非常有效(Ali等人,2024年)。传统的水质指数方法在处理复杂的水文地质系统时存在局限性。为克服这些不足,研究人员开发了改进的指数,包括基于熵的加权方案,这些方案减少了参数重要性分配的主观性,并保留了关键的水质信息(Singh等人,2024a;Veskovic等人,2024a;Gao等人,2024年;Kumar和Augustine,2022年;Zhang等人,2024年)。
机器学习(ML)方法因能够快速准确地估计水质指数而受到越来越多的关注,尤其是在处理非线性关系、复杂交互作用和异构数据集时(Singh等人,2024b;Das,2025年)。尽管取得了这些进展,许多先前的研究仍然依赖于简单的训练-测试数据分割,并未充分考虑季节性变化或严格评估模型的泛化能力和过拟合问题(Tian等人,2025年;Rajeev等人,2025年;Sarker等人,2025年)。
基于此背景,本研究将基于熵的水质指数(EGWQI)与潘巴尔河流域四个不同水文地质时期的机器学习分类相结合,这四个时期分别是季风前(PRMS)、东北季风(NEMS)、西南季风(SWMS)和季风后(POMS)。模型性能通过独立保留测试和分层交叉验证进行评估,特别针对人工神经网络(ANN)和XGBoost等复杂模型,以明确评估其鲁棒性和过拟合情况(Das,2025年;Elmotawakkil等人,2025年)。这种综合框架相比大多数现有的区域研究,能够更透明和可靠地评估地下水质量动态。
为了评估暴露机制对公共健康的影响,已经建立了标准化的人类健康危害评估方法,美国环境保护署(USEPA,2014年)的框架是用于估计口服暴露途径相关潜在健康风险的最常用方法之一。全球范围内报告了地下水中氟化物水平升高的情况,特别是在巴基斯坦、韩国、印度、墨西哥、伊朗、中国、巴西、塞尔维亚和斯里兰卡(Arya等人,2021年;Su等人,2021年;Iqbal等人,2023年;Abdipour等人,2025年;Xiao等人,2022年;Ochoa等人,2023年;Veskovic等人,2024b)。在印度,约90%的人口依赖地下水满足生活需求,有17个邦的饮用水中氟化物含量超标,相关健康风险包括安得拉邦、古吉拉特邦、泰米尔纳德邦、奥里萨邦和北方邦(Arya等人,2021年;Parveen等人,2025年;Adimalla和Qian,2023年;Patil等人,2024年)。在泰米尔纳德邦,有22个地区(Ariyalur、Erode、Dindigul、Virudhunagar、Coimbatore、Villupuram、Cuddalore、Tirunelveli、Vellore、Tiruppur、Tuticorin、Salem、Theni、Pudukkottai、Sivaganga、Ramanathapuram、Krishnagiri、Perambalur、Namakkal、Kanyakumari、Madurai、Karur)的地下水氟化物含量较高(CGWB,2022年)。
潘巴尔河流域的地下水质量存在显著变化,高浓度的氟化物对当地居民的健康构成风险。虽然我们之前的研究主要集中在硝酸盐污染及其相关健康风险上(Sridhar等人,2025b),但在Samalpatti-Sevathur碳酸盐岩地区进行的更局部研究则探讨了氟化物和硝酸盐的联合污染及其相关健康风险和灌溉适宜性(Sridhar等人,2026年)。相比之下,本研究特别强调利用基于ML的EGWQI分类方法研究氟化物的季节性变化。具体而言,本研究旨在:(1)通过地质水化学分析评估整个地下水质量(包括PRMS、NEMS、POMS和SWMS),(2)通过PCA和相关性分析识别污染源,计算EGWQI,并评估不同年龄组的氟化物相关健康风险,(3)开发和验证包括SVM、XGBoost、Random Forest和AdaBoost在内的ML模型,以确定预测地下水质量数据集的最有效方法。本研究的主要意义在于为减少氟化物含量和确保脆弱地区的安全饮用水提供指导。此外,这些发现还有助于决策者改进预测和监测技术,从而有效管理地下水质量。最终,这项工作有助于实现可持续发展目标(SDGs)3和6,改善印度南部潘巴尔河流域的饮用水质量和居民健康。

研究区域

潘巴尔河流域面积约为1758平方公里,位于克里希纳吉里(Krishnagiri)和蒂鲁帕图尔(Tirupathur)地区的北部和东部,延伸至泰米尔纳德邦蒂鲁万纳马拉伊(Tiruvannamalai)西部的贾瓦杜山(Javadhu Hills),并涵盖安得拉邦(Andhra Pradesh)的库帕姆(Kuppam)地区。该地区包括耶拉吉里山(Yelagiri Hills)和贾瓦杜山的部分区域,这些地区被划为保护区(RF)。该地区具有热带季风气候。

采样与分析

2024年东北季风(NEMS)、2025年季风后(POMS)、2024年季风前(PRMS)和2025年西南季风(SWMS)期间,共收集了100个地下水样本,包括50个钻井样本和50个开放式井样本(图1)。在采样之前,制定了系统的计划以确保覆盖整个流域的代表性数据收集。根据区域地质情况,采用随机采样策略收集了42个岩石样本(Nadjai等人,2024年;Li等人,2024年;Chandra等人,2024年;Abadi等人,2024年)。

地下水饮用质量的评估

地下水的pH值影响其溶解度,从而影响系统的地球化学平衡。pH值表示地下水中氢离子(H+)的活性或浓度。由于氢离子体积极小,它们可以渗透并分解矿物晶格,将溶解成分释放到地下水中(Singh等人,2023年;Verma等人,2024年)。NEMS期间的pH值范围为6.55-8.7(平均值:7.49),POMS期间为6.87-8.72(平均值:7.66),PRMS期间为6.67-8.63。

结论

本研究旨在利用机器学习技术识别潘巴尔河流域地下水中氟化物污染的来源及其对人类健康的影响。这是首次在该流域水文地质背景下进行的相关研究,为可持续地下水管理和环境风险评估提供了科学依据。主要研究结果如下:
  • NEMS期间地下水中氟化物含量范围为0.299–4.65毫克/升,
  • CRediT作者贡献声明

    C. N. 斯里达尔:方法论、调查、数据分析、概念化。T. 苏布拉马尼:写作——审稿与编辑、可视化、验证、监督、项目管理、方法论、资金筹集。雷纳托·索马:写作——审稿与编辑。T. 迪内什库马尔:写作——审稿与编辑

    未引用的参考文献

    中央地下水委员会(Central Ground Water Board),2022年;Islam Molla Jamal等人,2024年;Luzia Da Silva等人,2011年;Ochoa-Rivero等人,2023年;Rondano Gómez等人,2020年;Veskovi?等人,2024a;Veskovi?等人,2024b;Xie等人,2025年。

    资金支持

    作者非常感谢DST-ANRF科学技术部 - Anusandhan 国家研究基金会,印度政府)提供的资金和支持,以便顺利完成这项工作(文件编号:CRG/2023/003456,日期:2024年2月20日)。

    利益冲突声明

    作者声明没有已知的财务利益或个人关系可能影响本文所述的工作。

    致谢

    本研究使用了安娜大学(Anna University)地质系和钦奈中央地下水委员会(CGWB)的仪器和实验室设施进行样本测试。
    相关新闻
    生物通微信公众号
    微信
    新浪微博
    • 搜索
    • 国际
    • 国内
    • 人物
    • 产业
    • 热点
    • 科普

    知名企业招聘

    热点排行

      今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

      版权所有 生物通

      Copyright© eBiotrade.com, All Rights Reserved

      联系信箱:

      粤ICP备09063491号