台湾后泾河沉积物中重金属相关生态风险的区域评估:一项利用指数和极端梯度提升模型的研究
《Regional Studies in Marine Science》:Regional assessment of heavy metal–related ecological risks in the Houjing river sediments in Taiwan: A study using indexes and Extreme Gradient Boosting model
【字体:
大
中
小
】
时间:2026年03月07日
来源:Regional Studies in Marine Science 2.4
编辑推荐:
本研究采集台湾南部工业活动影响的河流沉积物样本,结合Nemerow污染指数(PN)、潜在生态风险指数(RI)及危害商数(HQs)评估重金属污染水平,并与XGBoost机器学习模型预测结果对比。结果显示平均PN值24.1表明重度污染,铜(Cu)和锌(Zn)贡献显著,最高HQs为7.6,且存在强烈协同生态风险(RI=946.2)。研究表明XGBoost能有效预测重金属污染及生态风险,为环境管理提供新工具。
黄洪江|穆罕默德·哈迪|明凯·阮|林赤山|阮玉森海|裴哈曼|阮辉团|董思秋贤
越南同奈技术大学技术学院,同奈
摘要
本研究收集了受台湾南部工业活动影响的河流沉积物样本,通过基于指数的评估方法和机器学习技术来评估污染程度和生态风险。沉积物样本来自5个地点,采集时间为18个采样季节。使用Nemerow污染指数(PN)、潜在生态风险指数(RI)和危险商数(HQs)对污染和风险水平进行了量化,并将结果与极端梯度提升(XGBoost)算法的预测结果进行了比较。所有地点和采样季节的平均PN值为24.1,表明后井河沉积物受到严重污染,且由于重金属的积累,污染程度随时间逐渐增加。S2-Jingjian点的污染程度最高(PN = 30.1),而S5-Dehuei点的污染程度最低(PN = 18.5)。大多数金属(包括Cu、Zn、Ni、Cd和Pb)被归类为具有中等生态危害(1 ≤ HQs < 10)。2018年记录的Cu危险商数最高(HQs = 7.6),显示出Cu对近期生态的强烈影响。显著的协同生态风险(RI = 946.2)也表明这些金属之间存在强烈的综合效应。本研究中开发的XGBoost模型的预测性能表明,只要有足够的训练数据,该算法可以用来可靠地估计与重金属污染相关的多个生态风险指数。总体而言,本研究强调了利用机器学习预测重金属污染及其相关生态风险的优势。
引言
工业化和城市化对环境产生了负面影响,因为它们的活动向水体和沉积物中释放了大量污染物,包括重金属(Kahal等人,2020年;Nguyen等人,2022a年;Tran等人,2022a年)。石油精炼、冶炼和采矿等工业活动,以及含金属化合物(如聚合物/塑料、燃料、微电子产品)的使用是重金属污染的主要来源(He等人,2005年;Zhang等人,2021年;Tran等人,2022b年;?ncü等人,2025年;Tokatl?等人,2026年)。同时,岩石的化学和物理风化、地表侵蚀以及大气沉降过程也是重金属污染的自然来源(Qu等人,2018年;Nguyen等人,2022b年;?ncü等人,2025年;Tokatl?等人,2026年)。重金属对水生生物造成了负面影响,并可能对人类健康构成风险(Kalani等人,2021年;Al-Kahtany等人,2023年;Varol等人,2025年)。
由于其独特的性质,如不可生物降解性、生态毒性、在各种环境中的生物累积潜力以及对生物体的危害性,重金属已成为一个紧迫的全球性问题(Hoang等人,2021b年;Le等人,2023年)。这些微量金属可以迅速进入水生环境,在水生食物链中积累,干扰生长、繁殖、行为和代谢(Ali等人,2019年;Kahal等人,2020年)。值得注意的是,重金属在沉积物中的浓度会升高,从而造成多种生态影响(Kalani等人,2021年;Aydi等人,2022年)。更严重的是,金属与有机化合物的结合可能导致生态干扰,对水生生物产生不利影响,并通过多种暴露途径对人体健康造成危害(He等人,2019年)。重金属暴露会导致行为问题和多种健康风险,包括心血管和肾脏疾病、神经系统损伤、骨骼疾病、基因突变、营养缺乏、酶功能障碍和肾脏损伤(Joneidi等人,2019年;Mitra等人,2022年)。暴露于As、Cr、Cd、Cu、Hg、Ni、Pb和Zn等重金属会对弱势群体(尤其是儿童和孕妇)造成显著毒性影响(Erdo?an等人,2024年;Yazman等人,2025年)。由于儿童生理机能不成熟且吸收能力较强,他们更容易受到神经毒性的影响,并可能出现发育障碍;许多金属能够穿过胎盘屏障,直接影响胎儿。例如Pb、Hg和As主要导致神经发育障碍,而Cd则与肾脏毒性和胎儿生长受限有关。这些证据突显了基于脆弱人群进行健康风险评估的重要性。因此,了解重金属的发生、迁移/分布及其潜在生态风险对于有效管理环境中的重金属污染至关重要。
评估指标有两种类型:单一指标和协同指标。单一指标使用诸如地理累积(Igeo)、污染因子(CF)、富集因子(EF)和危险商数指数(HQs)等已知方法来确定特定重金属的污染程度和风险(Hoang等人,2021b年)。而协同指标则通过使用Nemerow污染指数(PN)、重金属污染指数(HPI)、改良污染程度指数(mCd)、污染程度(DC)和潜在生态风险指数(RI)等流行指标来评估所有重金属对环境的综合污染效应(Hoang等人,2021b年)。生态毒理学风险指数,包括风险商数、污染负荷指数和潜在生态风险指数,在台湾和国际上的先前研究中得到了广泛应用。在台湾河流和沉积物研究中,这些指数被用来识别高风险地点和污染物,而全球研究也使用类似的框架来评估农药、重金属和多化学物质暴露,证明了它们的稳健性和跨环境背景的可比性(Vu等人,2017年;Hoang等人,2020年;Yeh等人,2020年;Muhammad等人,2024年;Tokatl?等人,2025年)。结合单一指标和协同指标可以全面评估重金属污染及其生态风险。最近,机器学习(ML)方法作为预测环境变量的高效可靠工具而出现(Fan等人,2021年;Rahman等人,2022年;Gao等人,2023年)。ML模型有助于评估沉积物的生态风险(Ban等人,2022年)。例如,Tran等人(2023年)应用了三种ML模型(最小二乘支持向量机(LS-SVM)、随机森林(RF)和长短期记忆(LSTM)来预测泥炭地沉积物样本中的微塑料含量。这些结果表明,ML方法在研究重金属污染沉积物及其相关生态风险方面可以提供巨大支持。
台湾南部的后井河受到工业活动产生的多种污染物(包括重金属)的严重污染(Vu等人,2017年;Hoang等人,2020年;Yeh等人,2020年)。后井河作为一个高度工业化和城市化的流域,在区域和国际上都具有重要的环境意义。其沉积物和水体是人类污染(特别是重金属污染)的关键指标,使其成为了解全球类似河流系统生态风险的重要案例研究。监测和评估这条河流不仅对当地环境管理有重要意义,也为工业流域的污染缓解和生态风险评估提供了参考。关于后井河重金属污染及其生态风险已有许多研究(Vu等人,2017年;Yeh等人,2020年)。我们之前的研究也使用了后井河的相同数据集,但关注了不同的评估指标和解释框架。大多数先前研究侧重于使用金属指数(MI)、富集因子(EF)、污染因子(CF)、地理累积指数(Igeo)和改良污染程度指数(mCd)等指标来监测重金属污染(Hoang等人,2020年;Aydi等人,2022年;Aydi等人,2022年)。尚未探索将指数计算与机器学习相结合来估计和预测重金属污染和风险的方法。本研究通过应用一组替代的风险指标,并结合机器学习方法来探索预测能力和模式识别能力,扩展了这一领域的研究。因此,本研究旨在通过结合指数计算和机器学习来评估后井河沉积物中的重金属污染和生态风险。计算的指标包括Nemerow污染指数(PN)、潜在生态风险指数(RI)和危险商数指数(HQs)。极端梯度提升算法(XGBoost)被用来预测污染程度和生态风险,并将其性能与传统的评估指标进行了比较。应用XGBoost的目的是为了评估模型输出与基于指数的计算之间的一致性和潜在的可替代性,从而展示机器学习方法在预测污染和生态风险方面的能力。由于XGBoost在建模和处理复杂数据集方面的优势,预计它将成为一种有效的工具,减少对手动指数计算的依赖,同时提高环境评估的准确性。本研究展示了机器学习在预测重金属污染及其相关生态风险方面的优势。这些发现有望帮助生态管理者和利益相关者制定可持续的行动规划和开发框架,以保护水生生态系统和环境质量。
研究区域
后井河位于高雄市西北部,主干流长度约为13公里,流域面积约为77平方公里(Vu等人,2017年)。其源头位于仁武区和达社区,最终汇入高雄都会公园。值得注意的是,后井河被认为是污染最严重的河流之一,这主要是由于沿岸的工业活动严重污染了河流内的沉积物和水体(Vu等人,2017年)。
使用Nemerow污染指数(PN)评估沉积物中的重金属污染
后井河沉积物中的重金属污染程度基于PN指数进行评估。结果显示,5个采样地点5年的平均污染程度为“严重污染”(PN = 24.1)。这意味着后井河沉积物中积累了高浓度的重金属。这一结果与我们之前使用改良污染程度(mCd)指数评估后井河重金属协同污染的结果相似。
局限性
用于训练多输出XGBoost模型的数据集相对较小,限制了模型的复杂性,可能影响其泛化能力。为了解决数据稀缺问题,对相邻观测值进行了平均处理以增强数据,但这可能降低了某些地点(例如Jingjian)的PN和RI预测的准确性,反映了训练数据的局限性而非模型本身的性能。此外,生态风险指数(PN、RI、HQs)依赖于文献中的数据。
结论
本研究结合了传统的基于指数的方法(即Nemerow污染指数(PN)、潜在生态风险指数(RI)和危险商数(HQs)以及使用极端梯度提升(XGBoost)算法的机器学习,来评估和预测后井河沉积物中的重金属污染及相关生态风险。结果显示,整体重金属污染程度属于“严重污染”类别(PN = 24.1)。
CRediT作者贡献声明
明凯·阮:写作——审稿与编辑。穆罕默德·哈迪:写作——审稿与编辑、初稿撰写、软件开发。阮玉森海:软件开发、方法论。林赤山:监督、资源管理、数据整理。黄洪江:初稿撰写、可视化处理、资源管理、方法论。裴哈曼:审稿与编辑、初稿撰写。董思秋贤:审稿与编辑、初稿撰写。阮辉团:审稿与编辑、监督。
利益冲突声明
作者声明他们没有已知的财务利益或个人关系可能影响本文的研究结果。
致谢
作者感谢国立高雄科技大学环境分析服务中心(CEAS)在重金属分析方面提供的技术支持。本研究未获得公共部门、商业部门或非营利组织的任何特定资助。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号