《Toxicology Letters》:Mitigating Algorithmic Bias in AI-Powered Toxicology: Frameworks for Explainable and Equitable Predictions in Human Health and Environmental Safety
编辑推荐:
人工智能(AI)与机器学习(ML)在预测毒理学中的快速融合,已变革了针对药物、环境污染物及消费品的化学危害识别、毒性终点预测与风险评估范式。尽管此类工具有望提供更快速、更具伦理性的传统测试替代方案,但也引入了显著的算法偏见风险,其根源包括数据集不平衡、历史数据
人工智能(AI)与机器学习(ML)在预测毒理学中的快速融合,已变革了针对药物、环境污染物及消费品的化学危害识别、毒性终点预测与风险评估范式。尽管此类工具有望提供更快速、更具伦理性的传统测试替代方案,但也引入了显著的算法偏见风险,其根源包括数据集不平衡、历史数据局限性、代表性不足的化学品类别或人群,以及模型设计选择。此类偏见可能导致预测不准确、弱势群体(如人类健康结局的人口或地理差异)中出现比例失衡的错误,以及不可靠的环境安全性评估。本综述系统梳理了AI驱动毒理学模型中偏见的来源,涵盖数据选择、特征工程及黑箱不透明性;考察了检测方法(如公平性指标、差异审计)与缓解框架,包括以数据为中心的策略(多样化纳入、去偏技术、合成数据生成)、算法干预(对抗训练、正则化),以及与可信赖性、可复现性、可解释性、适用性和透明度等新兴原则相契合的整体策略。研究特别强调可解释人工智能(XAI)方法(如SHAP、LIME、注意力机制和Grad-CAM可视化)在增强可解释性、揭示机制性见解及促进毒性预测中偏见识别的作用。文中重点阐述了在人类健康(如减少药物不良反应预测中的不平等)和环境安全(如公平的化学品优先级排序与生态系统风险建模)中的应用,并讨论了监管机构接受具备偏见抵御能力和透明模型的考量因素。当前挑战仍存,包括数据异质性、验证缺口及伦理监督需求。未来方向呼吁建立标准化的偏见审计协议、跨学科协作及政策框架,以确保AI驱动的毒理学能够为更安全的公共与环境健康提供公平、可靠且具有人类相关性的成果。
本文围绕人工智能(AI)在预测毒理学中引发的算法偏见问题,系统构建了融合可解释性、公平性与监管合规的综合治理框架,全文主体内容按如下结构展开:
- 1.
引言
该部分指出AI与机器学习(ML)已彻底变革化学危害评估模式,通过整合ToxCast等高通量筛选数据、组学图谱及化学结构信息,实现了对肝毒性、遗传毒性及内分泌干扰效应等多种终点的高效预测,有力支撑了下一代风险评估(NGRA)框架的发展,契合全球减少动物实验的趋势。然而,这种依赖关系带来了算法偏见的严峻挑战,其源于不平衡的训练数据集、历史数据局限、特征选择偏差及模型架构缺陷,可能导致对弱势群体毒性风险的低估、化学品环境风险排序的扭曲,进而削弱模型可信度并阻碍监管采纳。为此,可解释人工智能(XAI)技术(如SHAP、LIME)被视为关键解决方案,能够揭示输入变量对预测结果的贡献机制,辅助偏见检测并与生物学通路相关联,结合数据去偏、对抗训练等策略,共同构建公平且可解释的模型体系。
- 2.
AI在预测毒理学中的应用
本部分详述了AI技术在多场景下的具体应用。在人类健康领域,深度学习架构(如图神经网络GNN)已广泛应用于药物诱导毒性(如药物性肝损伤DILI、心脏毒性)的早期识别,并在Tox21挑战赛中展现出超越传统定量构效关系(QSAR)方法的性能。FDA的AI4TOX计划开发的SafetAI、AnimalGAN等工具,进一步推动了监管科学的发展。在环境安全领域,AI模型被用于筛选全氟烷基物质(PFAS)、微塑料等新兴污染物,预测水生生物毒性及生态系统风险。此外,AI与新方法学(NAMs)的融合成为新趋势,特别是与器官芯片(OOC)系统的结合,能够桥接体外扰动与体内效应,提升慢性暴露与多器官相互作用的预测准确性。联邦学习(Federated Learning)作为一种隐私保护技术,也被引入以解决特定毒性领域的数据稀缺问题。XAI技术在此过程中被嵌入工作流程,通过归因分析将模型输出与不良结局通路(AOP)关联,例如揭示细胞色素P450(CYP)抑制信号在肝毒性预测中的间接作用机制。
- 3.
算法偏见的来源与类型
文章将AI毒理学中的偏见归纳为三大类。数据相关偏见是最主要来源,包括选择偏差(过度代表药物类化学品而忽视PFAS等新兴污染物)、类别不平衡(Tox21中阳性标签仅占5–10%)、历史表征偏差(数据偏向啮齿类模型或特定人群)以及标签噪声。特别值得注意的是,体外筛选数据常因“预期阳性结果”的选择偏好而导致结构性富集,造成模型高估毒性发生率。算法与模型偏见则源于特征工程(如分子指纹强调无关结构特征)和优化过程(梯度下降偏向多数模式),黑箱模型的内部运作机制使得偏见传播难以追溯。情境性与系统性偏见延伸至实际应用层面,如模型对人类遗传变异亚群的预测性能不足,或生态毒性模型忽视陆地生物与低剂量累积效应,导致边缘社区面临更高的环境不公风险。这些偏见往往相互交织、叠加放大,例如在化学空间覆盖不足的情况下,数据不平衡会加剧模型对少数类别化学品的毒性低估。
- 4.
偏见检测与测量方法
本部分介绍了多维度的检测手段。统计与公平性指标是基础,包括差异影响比(DIR)、人口统计学均等和机会均等,用于量化不同化学品类别或人群亚组间的错误率差异。性能分层分析能够揭示模型在制药类化合物上表现优异而在环境污染物上表现不佳的现象。XAI检测技术提供了深入洞察,SHAP值可全局展示脂溶性等特征的主导地位,LIME用于局部解释特定化合物的毒性判定依据,注意力机制和Grad-CAM则分别用于解析SMILES字符串中的关键片段及分子图像中的关键区域。审计与专门框架强调组合策略,通过子群分析和反事实测试(利用合成数据模拟未充分代表的化学品类别)来检验模型稳健性;利用分类回归树(CART)划分特征空间以识别偏见高发区;并通过Kolmogorov–Smirnov检验等统计方法监控数据分布漂移。检测过程贯穿全生命周期,从预训练数据审计到部署后持续监控,并需结合毒理学专业知识进行解读。
- 5.
算法偏见缓解框架
文章提出了分层级的缓解策略。以数据为中心的方法聚焦于源头治理,主张通过分层抽样扩充数据集,纳入多民族基因组数据和全球污染物信息,并利用生成对抗网络(GAN)或变分自编码器(VAE)生成化学合理的合成数据以增强代表性,同时强调对这些合成数据进行严格的生物学合理性验证。算法缓解技术直接在训练过程中嵌入公平性,对抗训练通过引入辅助网络来消除敏感属性(如化学品类别)的信息泄露;正则化与公平性约束通过将人口统计学均等等指标加入损失函数来惩罚不公平决策;集成与混合建模则通过聚合不同架构模型的预测来平滑极端偏差。整体与集成框架倡导全生命周期治理,遵循可信赖性、可复现性、可解释性、适用性和透明度(TREAT)原则,将XAI融入迭代优化闭环,利用SHAP分析结果指导特征重加权或样本重采样。监管对齐策略强调遵循FDA AI4TOX及EPA指南,实施透明报告和子组验证。此外,文章特别警示了自动化偏见的风险,即人类决策者可能过度依赖AI输出,建议通过批判性AI素养培训和结构化独立审查协议来应对。
- 6.
应用与案例示例
本部分展示了偏见缓解的实际成效。在人类健康应用中,通过合成数据增强和公平性约束,有效减少了不同遗传背景下的药物不良反应(ADR)预测差异。具体案例显示,针对氯氮平诱导粒细胞缺乏症这一罕见不良事件,采用SMOTE重采样的梯度提升模型结合SHAP分析,不仅实现了高召回率,还识别出血液系统疾病等关键预测因子,证明了可解释性与公平性结合的价值。在环境安全应用中,整体框架通过平衡生态毒性模型中的物种代表性,减少了对脆弱生态系统的风险遗漏。XAI框架本身被证实具有双重功效,既能增强模型透明度,又能通过暴露特征贡献中的不合理模式来辅助偏见纠正。路线图建议采用生命周期实施路径,从选择可解释基线模型开始,逐步应用事后解释方法,并将解释结果与AOP进行比对验证。
- 7.
挑战、局限性与未来方向
文章最后指出了当前的瓶颈与前景。主要挑战在于数据质量(覆盖不均、标签噪声)、模型黑箱性(XAI仅能提供相关性而非因果性解释)、验证与监管脱节(缺乏AI特异性标准)以及伦理责任归属不清。未来发展方向包括构建全球标准化数据共享生态,发展因果XAI和多模态整合(结合结构与组学数据),推进联邦学习与量子计算的应用。监管层面亟需建立适应性的、基于风险的框架,统一偏见审计标准和模型卡片报告制度。最终,通过毒理学家、数据科学家、伦理学家及社区的跨学科协作,确保AI驱动的毒理学在实现无动物实验愿景的同时,真正服务于公平、可靠的人类健康与环境保护目标。
- 8.
结论
结论部分重申,尽管AI在预测毒理学中取得了革命性进展,但算法偏见与黑箱问题仍是实现公平、可靠风险评估的主要障碍。通过系统化的偏见检测、基于XAI的缓解框架以及对TREAT原则的坚持,可以有效提升模型在人类健康和环境安全领域的公平性。未来的成功依赖于标准化审计协议的建立、全球数据的协调以及跨学科的持续合作。