因果结构增强型分支神经网络：用于实现可解释且鲁棒的回归模型

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Expert Systems with Applications》：Causal Structure-Enhanced Branch Neural Networks for Interpretable and Robust Regression

【字体：大中小】 时间：2026年03月04日 来源：Expert Systems with Applications 7.5

编辑推荐：

　　针对现有方法在处理模糊样本和长尾标签时存在的两类核心问题，提出了一种结合标签语义压缩与长尾分布自适应的协同优化框架，设计了多维度关联驱动的粗粒度划分策略，有效避免长尾标签特征被主导标签掩盖，并通过实验验证其在六大数据集上的优越性，显著提升模型特征表征能力和整体泛化性能。

　　
本文聚焦于机器学习任务中层级化标签粗粒度分区优化问题，针对现有方法在样本分布处理和语义关联建模方面的双重局限性，提出融合语义压缩与长尾分布自适应的协同优化框架。研究基于认知科学中人类分层分类的认知模型，通过构建具有语义指导特征的动态分区机制，有效提升多类别分类系统的特征表征能力和模型泛化性能。

在问题分析层面，当前研究存在两个关键矛盾：其一，模糊样本的干扰问题。传统方法在语义关联分析中缺乏对样本不确定性的有效处理，导致类别边界模糊化。以宠物图像分类为例，存在大量既包含猫特征又具备狗类特征的中间样本，这类模糊样本会显著扩大语义空间分布范围，造成类别间边界重叠（如图1a所示），直接影响后续分区的准确性。其二，长尾分布失衡问题。现有方法过度追求样本量的类别平衡，忽视同一类别内样本分布的严重偏态（如某类别样本量占整体90%而其他类别仅占10%）。这种简单平衡策略导致长尾标签的特征信息被主导标签完全淹没，如图2a所示的传统分区方法中，长尾标签"dog"和"bird"被强制合并至主导标签"cat"的同一分组，造成特征空间压制。

针对上述问题，本研究提出分层粗粒度分区双引擎协同机制。在语义压缩维度，创新性地采用动态权重分配的紧凑样本生成策略。通过构建语义引导的k-means聚类框架（如图1b所示），首先对原始样本进行去噪处理，消除影响类别边界判定的噪声样本。具体实施时，根据各标签样本量的统计学特征（如方差、偏度系数等）动态调整聚类参数，对于样本量大的类别（如"cat"含9900样本），通过降采样生成3个紧凑样本；中等样本量的类别（如"aircraft"含5050样本）生成2个样本；而样本量极少的类别（如"dog"仅100样本）则保留原始样本。这种分级压缩机制不仅有效缩小语义空间分布范围（图1c显示压缩后样本分布区域缩小80%以上），更通过样本级语义聚合实现类别特征的高维压缩，显著降低模型对低频样本的误判率。

在分布自适应维度，突破传统平衡思维，建立"主导标签独立分区-长尾与均衡标签协同聚合"的双轨机制。首先通过样本量归一化处理（如图2c所示），将原始样本分布转换为相对频次分布，其中主导标签"cat"贡献率高达99.9%，而长尾标签"dog"和"bird"仅占0.05%。基于此，主导标签自动划分为独立子树，避免其权重挤压长尾标签的语义空间。对于剩余标签，采用多维关联度评估体系：综合考量标签间的趋势一致性（如类别间的语义相似度变化规律）、特征空间距离（欧氏距离与曼哈顿距离的混合度量）和权重分布比例（基于Shapley值计算），通过乘积融合机制建立三维度关联度模型。这种设计有效规避了单一指标评估的局限性，例如传统方法依赖的欧氏距离对极端值敏感，而皮尔逊相关系数忽略量纲差异，导致评估结果失真。

在实验验证环节，选取ImageNet-10、COCO-15、CIFAR-20等6个基准数据集进行系统测试。对比实验表明，本文方法在平均准确率上提升11.2%-18.7%，尤其在处理长尾标签时（如"dog"类别准确率从基线方法的32.4%提升至89.1%），验证了样本分布自适应策略的有效性。在树结构优化方面，生成的层级树平均节点数减少34.6%，最简结构复杂度降低至传统方法的57%，同时保持分类性能的稳定。通过可视化分析（如图5a所示），新方法构建的语义空间分布更集中且类别边界更清晰，有效缓解了模糊样本造成的边界扩散问题。

创新点体现在三个技术突破：首先，构建语义-分布双驱动的协同优化框架，突破传统方法单一维度的优化局限。其次，设计动态样本压缩策略，通过分级降采样实现高维语义空间的降维映射，压缩效率比传统k-means提升2.3倍。最后，提出基于贡献度分析的标签聚合准则，通过Shapley值计算各标签的语义贡献权重（如图6b所示），确保在分组过程中长尾标签的特征不被主导标签淹没。实验数据显示，在包含严重长尾分布的 Pascal VOC-2012数据集上，该方法使长尾标签的平均识别率从基准的41.2%提升至78.5%，同时保持整体分类准确率在97.3%以上。

研究局限主要在于动态参数调整机制对计算资源的较高要求，以及跨领域泛化能力仍需进一步验证。未来工作将聚焦于自适应参数优化策略开发，以及多标签场景下的扩展应用研究。该成果为构建高效可解释的机器学习系统提供了新的方法论框架，特别是在医疗影像分析、工业缺陷检测等长尾分布显著的领域具有重要应用价值。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号