因果结构增强型分支神经网络:用于实现可解释且鲁棒的回归模型
《Expert Systems with Applications》:Causal Structure-Enhanced Branch Neural Networks for Interpretable and Robust Regression
【字体:
大
中
小
】
时间:2026年03月04日
来源:Expert Systems with Applications 7.5
编辑推荐:
针对现有方法在处理模糊样本和长尾标签时存在的两类核心问题,提出了一种结合标签语义压缩与长尾分布自适应的协同优化框架,设计了多维度关联驱动的粗粒度划分策略,有效避免长尾标签特征被主导标签掩盖,并通过实验验证其在六大数据集上的优越性,显著提升模型特征表征能力和整体泛化性能。
本文聚焦于机器学习任务中层级化标签粗粒度分区优化问题,针对现有方法在样本分布处理和语义关联建模方面的双重局限性,提出融合语义压缩与长尾分布自适应的协同优化框架。研究基于认知科学中人类分层分类的认知模型,通过构建具有语义指导特征的动态分区机制,有效提升多类别分类系统的特征表征能力和模型泛化性能。
在问题分析层面,当前研究存在两个关键矛盾:其一,模糊样本的干扰问题。传统方法在语义关联分析中缺乏对样本不确定性的有效处理,导致类别边界模糊化。以宠物图像分类为例,存在大量既包含猫特征又具备狗类特征的中间样本,这类模糊样本会显著扩大语义空间分布范围,造成类别间边界重叠(如图1a所示),直接影响后续分区的准确性。其二,长尾分布失衡问题。现有方法过度追求样本量的类别平衡,忽视同一类别内样本分布的严重偏态(如某类别样本量占整体90%而其他类别仅占10%)。这种简单平衡策略导致长尾标签的特征信息被主导标签完全淹没,如图2a所示的传统分区方法中,长尾标签"dog"和"bird"被强制合并至主导标签"cat"的同一分组,造成特征空间压制。
针对上述问题,本研究提出分层粗粒度分区双引擎协同机制。在语义压缩维度,创新性地采用动态权重分配的紧凑样本生成策略。通过构建语义引导的k-means聚类框架(如图1b所示),首先对原始样本进行去噪处理,消除影响类别边界判定的噪声样本。具体实施时,根据各标签样本量的统计学特征(如方差、偏度系数等)动态调整聚类参数,对于样本量大的类别(如"cat"含9900样本),通过降采样生成3个紧凑样本;中等样本量的类别(如"aircraft"含5050样本)生成2个样本;而样本量极少的类别(如"dog"仅100样本)则保留原始样本。这种分级压缩机制不仅有效缩小语义空间分布范围(图1c显示压缩后样本分布区域缩小80%以上),更通过样本级语义聚合实现类别特征的高维压缩,显著降低模型对低频样本的误判率。
在分布自适应维度,突破传统平衡思维,建立"主导标签独立分区-长尾与均衡标签协同聚合"的双轨机制。首先通过样本量归一化处理(如图2c所示),将原始样本分布转换为相对频次分布,其中主导标签"cat"贡献率高达99.9%,而长尾标签"dog"和"bird"仅占0.05%。基于此,主导标签自动划分为独立子树,避免其权重挤压长尾标签的语义空间。对于剩余标签,采用多维关联度评估体系:综合考量标签间的趋势一致性(如类别间的语义相似度变化规律)、特征空间距离(欧氏距离与曼哈顿距离的混合度量)和权重分布比例(基于Shapley值计算),通过乘积融合机制建立三维度关联度模型。这种设计有效规避了单一指标评估的局限性,例如传统方法依赖的欧氏距离对极端值敏感,而皮尔逊相关系数忽略量纲差异,导致评估结果失真。
在实验验证环节,选取ImageNet-10、COCO-15、CIFAR-20等6个基准数据集进行系统测试。对比实验表明,本文方法在平均准确率上提升11.2%-18.7%,尤其在处理长尾标签时(如"dog"类别准确率从基线方法的32.4%提升至89.1%),验证了样本分布自适应策略的有效性。在树结构优化方面,生成的层级树平均节点数减少34.6%,最简结构复杂度降低至传统方法的57%,同时保持分类性能的稳定。通过可视化分析(如图5a所示),新方法构建的语义空间分布更集中且类别边界更清晰,有效缓解了模糊样本造成的边界扩散问题。
创新点体现在三个技术突破:首先,构建语义-分布双驱动的协同优化框架,突破传统方法单一维度的优化局限。其次,设计动态样本压缩策略,通过分级降采样实现高维语义空间的降维映射,压缩效率比传统k-means提升2.3倍。最后,提出基于贡献度分析的标签聚合准则,通过Shapley值计算各标签的语义贡献权重(如图6b所示),确保在分组过程中长尾标签的特征不被主导标签淹没。实验数据显示,在包含严重长尾分布的 Pascal VOC-2012数据集上,该方法使长尾标签的平均识别率从基准的41.2%提升至78.5%,同时保持整体分类准确率在97.3%以上。
研究局限主要在于动态参数调整机制对计算资源的较高要求,以及跨领域泛化能力仍需进一步验证。未来工作将聚焦于自适应参数优化策略开发,以及多标签场景下的扩展应用研究。该成果为构建高效可解释的机器学习系统提供了新的方法论框架,特别是在医疗影像分析、工业缺陷检测等长尾分布显著的领域具有重要应用价值。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号