《Environmental Research》:Construction of SnO
2/Bi
2O
2CO
3 Z-type heterojunction for photocatalytic degradation of humic acid under sunlight
编辑推荐:
可解释机器学习模型在水质预测中的可靠性评估与优化,提出统一一致性指数(CI)和数据驱动RFECV-XML流程,对比相关性筛选与递归特征消除方法,发现后者在减少69-85%输入特征的同时保持预测精度(RMSE=0.57-1.20),但CI值更低(0.00-0.65),表明核心驱动器一致性较高但整体排名稳定性不足。研究建立量化评估框架,增强环境决策的可信度。
赵晨(Chao-Chin Chang)、陈宇明(Yuming Chen)、陈春玉(Chun-Yu Chen)
台湾高雄国立科技大学安全、健康与环境工程系,高雄,824
摘要
可靠地预测和解释水质动态对于环境监测和基于风险的水资源管理至关重要。可解释机器学习(Explainable Machine Learning, XML)提供了解释复杂预测模型的方法;然而,常用的解释方法往往会导致特征属性的不一致性,而且特征选择通常依赖于主观的相关性阈值。本研究开发了一个统一的一致性指数(Consistency Index, CI)和一种数据驱动的递归特征消除(Recursive Feature Elimination with Cross-Validation, RFECV)工作流程,以定量评估和提高基于XML的解释的可靠性。使用一个30年的河流水数据集和九种机器学习算法,评估了两种XML框架(基于相关性的XML和基于RFECV的XML)。基于相关性的模型取得了良好的预测性能(均方根误差RMSE分别为0.77、0.64、1.07),而RFECV将输入维度减少了69-85%(从6个特征减少到12个特征),同时保持了相当的准确性(RMSE分别为0.75、0.57、1.20)。在基于相关性的工作流程中,CI值的范围分别为0.42至0.72、0.27至0.48以及约0.60,表明解释工具之间存在较强的等级一致性。基于RFECV的XML保持了预测准确性,但产生了较低的CI值(0.00至0.65),反映了较高的top-k一致性但较低的整体排名连贯性。这种模式代表了一种实际相关的可靠性形式,即在排名稳定性降低的情况下仍能保持对核心驱动因素的一致性。高且α稳定的CI值表明解释者之间的分歧是良性的,而低且α敏感的CI值则揭示了解释的不稳定性。通过提供对解释鲁棒性的定量诊断检查,本研究有助于确保基于XML的水质评估更加清晰、可信,并更适用于实际决策。
引言
在过去十年中,由于机器学习(ML)模型在捕捉长期监测数据中的线性或非线性关系方面表现优异,因此它们被越来越多地应用于水质预测(如表1所示)。然而,不仅准确的预测,而且对水质动态的可靠解释对于流域尺度的水资源管理也至关重要(Harken等人,2019年;Huang等人,2025年)。大多数现有的水质相关研究主要集中在使用各种ML算法提高预测准确性上,而对模型可解释性的关注有限(表1)。尽管这些以预测为导向的方法提高了预测性能,但它们对主要水质驱动因素的洞察力有限,从而限制了它们在流域尺度管理中的污染诊断和决策作用。此外,虽然一些水质相关研究开始采用可解释机器学习(XML),并整合了解释工具,如Shapley加性解释(Shapley Additive Explanations, SHAP)(Nourani等人,2025年)、排列重要性(Permutation Importance, PI)(Khan等人,2025年)和局部可解释模型不可知解释(Local Interpretable Model-Agnostic Explanations, LIME)(Infant等人,2025年),但这些研究通常依赖于单一的解释工具(主要是SHAP)。只有少数研究采用了两种解释工具,如SHAP和PI或SHAP和LIME(表1)。然而,这些研究都没有系统地评估多种XML解释工具之间的一致性。
然而,广泛使用的XML技术经常对同一水质目标产生不同的特征排名或甚至相互矛盾的解释。这些分歧使得识别主要的水质驱动因素变得复杂,并给决策带来了不确定性。尽管如此,考虑到每种方法都体现了不同的解释逻辑(全局加性效应、基于扰动的敏感性、局部实例行为),完全的一致性既不期望也不理论上可实现。因此,XML中的一个关键未解决的问题是确定解释分歧是有意义的还是仅仅是方法论上的噪声,而这一问题在之前的水质XML研究中尚未得到定量探讨。
据我们所知,现有的水质和环境领域的XML研究很少对多种解释方法进行系统比较。在其他应用领域(例如医疗保健)中,也有少量方法学研究开始描述性地比较各种解释工具的输出(Ahmed等人,2024年;Mitra等人,2025年);然而,这些努力仍然没有为评估跨方法的一致性或在水文不确定性下诊断解释的可靠性提供定量依据。为了填补这一空白,本研究引入了一致性指数(Consistency Index, CI),这是一种统一的定量指标,用于量化XML解释在跨模型和跨方法维度上的鲁棒性。通过引入权重因子α,CI表征了水质解释对方法选择的敏感性,从而将XML的可解释性与可靠性分析联系起来。
XML中的解释可靠性还强烈依赖于输入变量的选择方式。基于相关性的过滤在水质建模中被广泛使用(Abuzir和Abuzir,2022年;Bui等人,2020年;Wang等人,2017年),它影响了最终特征集的水文意义。然而,相关性阈值是主观的,可能会无意中保留冗余的水文信号或去除相关但相关性较弱的指标。这种变异性可能会增加预测和XML解释的不确定性。为了弥补这些局限性,我们进一步开发了一种递归特征消除与交叉验证(RFECV)-XML工作流程,该流程提供了一种数据驱动的策略,用于识别紧凑且物理上有意义的驱动因素集。通过在解释之前隔离关键的水文预测因子,RFECV使得水质过程的归因更加清晰,并有助于结构化地比较特征集组成如何影响解释的稳定性,这是可靠性分析的关键步骤。需要强调的是,在监督学习中,高预测准确性并不一定意味着对底层系统的机制性理解。因此,事后可解释性方法描述了模型如何利用相关输入进行预测,而不是揭示真实的物理或生物地球化学关联。
总之,本研究旨在(1)确立CI作为第一个统一的、定量的、有意义的指标,用于评估在方法论不确定性下XML解释的稳定性;(2)评估两种互补的工作流程(基于相关性的XML和RFECV–XML)如何影响长期河流流域数据集中的解释可靠性。通过明确将XML稳定性与可靠性分析和决策相关的不确定性联系起来,本研究为可持续的水质管理提供了一个透明且可复制的XML框架。
部分摘录
数据收集与清洗
数据集来自东港河流域(表S1),该流域包含五个从上游到下游分布的长期监测站(站点ID分别为1206、1207、1208、1209和1210)。记录时间跨度为30年(1994-2023年),为评估长期水质动态提供了具有水文意义的时间深度。每个监测参数都被视为一个独立的特征。核心水质指标包括生化需氧量(BOD)和化学需氧量
基于相关性的过滤下的目标选择和预测性能
为了确定适合解释分析的目标变量,构建了皮尔逊相关矩阵(图1),包括无过滤(|r| > 0)(图1A)、中等过滤(0.3 < |r| < 0.9)(图1B)和严格过滤(0.5 < |r| < 0.9)(图1C)。这些设置代表了从包含所有特征到高度相关的、聚焦的子集的逐步过渡。在所有参数中,NH4_1209、RPI_1208和BOD_1209在所有情况下都表现出一致的高相关性
结论
本研究并不声称能够识别“真实”的特征-目标关系。相反,我们的目标是评估不同方法和工作流程下XML得出的重要性排名的稳定性,这对于环境应用中的解释可重复性至关重要。我们通过将CI与RFECV–XML工作流程相结合,开发了一个统一的框架,用于评估河流水质建模中可解释机器学习分析的可靠性。CI量化了跨方法的一致性
CRediT作者贡献声明
赵晨(Chao-Chin Chang):撰写 – 审稿与编辑、撰写 – 原始草稿、验证、监督、软件、资源、项目管理、方法论、调查、正式分析、数据管理、概念化。陈宇明(Yuming Chen):撰写 – 审稿与编辑、软件、方法论、正式分析、数据管理。陈春玉(Chun-Yu Chen):软件、方法论、调查、正式分析、数据管理。
利益冲突声明
作者声明他们没有已知的竞争性财务利益或个人关系可能影响本文所述的工作。
致谢
该项目得到了台湾高雄国立科技大学的教师启动基金的支持。