CIRCUS:一种基于因果干预的框架,用于提升训练有素分类器的反事实公平性
《IEEE Transactions on Neural Networks and Learning Systems》:CIRCUS: A Causal Intervention-Based Framework for Enhancing Counterfactual Fairness in Trained Classifiers
【字体:
大
中
小
】
时间:2026年03月17日
来源:IEEE Transactions on Neural Networks and Learning Systems 8.9
编辑推荐:
模型公平性是AI社会接受的关键,反事实公平性通过因果推断确保个体在不同敏感特征下的预测一致性。本文提出CITGAN架构,利用端到端拓扑生成机制实现因果干预与反事实样本生成,严格保证结构因果模型(SCM)的函数依赖关系。基于CITGAN,构建CIRCUS框架,通过梯度引导和特征贡献分析生成反事实歧视样本(CDSs),并采用标签偏置校正预处理进行模型再训练。实验表明,在DNN和ResNet模型上,CIRCUS使MMD-L和MMD-K指标分别降低39.7%和40.4%,在提升反事实公平性的同时保持分类鲁棒性。
摘要:
确保模型的公平性,以防止基于任何敏感属性的潜在偏见,对于人工智能在关键应用中的社会接受度至关重要。在各种公平性概念中,反事实公平性因其基于因果推断而受到重视。这一概念要求个体在原始世界中的预测与在敏感特征值被修改的反事实世界中的预测保持一致。在本文中,我们旨在通过因果干预来减轻模型的反事实偏见。具体而言,我们首先通过提出因果推断表格生成对抗网络(CITGAN)架构来实现有效的因果干预和反事实生成。与基于变分自编码器(VAEs)的先前方法不同,后者由于同时生成而本质上缺乏结构因果模型(SCM)的保真度,CITGAN通过端到端的拓扑生成过程严格保证了因果一致性。通过将外生变量推断与顺序生成相结合,CITGAN确保了功能依赖性的结构保持。在CITGAN的基础上,我们提出了CIRCUS框架,这是一个基于因果干预的框架,旨在直观地提高训练有素分类器的反事实公平性。CIRCUS通过因果干预生成反事实歧视样本(CDSs),并利用梯度和特征贡献进行指导,随后对其标签应用偏见校正预处理以重新训练分类器。实验结果表明,CIRCUS在保持强大的分类性能的同时,有效地提高了反事实公平性。具体来说,对于深度神经网络(DNN)模型,和值分别平均降低了39.7%和40.4%,优于第二好的结果。对于残差网络(ResNet)模型,这些减少幅度为...
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号