基于“心理意象”的新型层次分解方法：MID框架在提升多类分类性能中的创新应用

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2026年03月02日 来源：Neurocomputing 6.5

编辑推荐：

　　为解决传统层次分解方法难以依据数据内在属性优化分类结构的问题，研究人员提出了名为Mental Image Decomposition (MID) 的创新框架。该研究利用DRASiW模型的“心理意象”信息构建与数据对齐的优化层次树，在26个标准数据集上验证表明，MID在多种机器学习分类器上都显著提升了F1分数和准确率，尤其能有效提升AdaBoost等集成分类器性能。这项工作为复杂多类分类问题提供了高性能、可解释性强的新解决方案。

在人工智能领域，让计算机学会区分猫、狗、汽车、飞机等不同事物是一个基础而关键的任务，这被称为多类分类。然而，随着需要区分的类别数量增多，分类器的表现往往会大打折扣。这是因为类别越多，不同类别之间的特征边界就越模糊，模型学习的难度就越大。此外，现实世界的数据常常是“不平衡”的——比如猫的图片有1000张，而老虎的图片只有10张，模型就很容易偏向于预测“猫”。这些挑战，使得提升多类分类性能成为一个持续的研究热点。

为了应对这些挑战，研究人员探索了各种“分而治之”的策略，其中一类方法被称为层次分解方法。其核心思想是将一个复杂的多类问题，分解成一系列更简单的二分类子问题，并组织成一个树状结构（称为嵌套二分法）。分类时，样本从树根开始，经过一系列“是非”判断，最终到达代表某个具体类别的叶子节点。这种方法的关键在于如何构建这棵“决策树”——树的结构好坏，直接影响最终的分类效果。传统的构建方法，或依赖于随机划分，或基于类别中心点等简单度量，往往难以找到与数据内在结构最匹配的、最优的树形。

那么，有没有一种方法，能够洞察数据的“本质”，从而构建出更优的分类层次呢？近期，Antonio Sorgente和Massimo De Gregorio在《Neurocomputing》上发表的研究，给出了一种新颖而巧妙的答案。他们的灵感来源于一种特殊的神经网络——DRASiW模型所生成的“心理意象”。

研究人员开展这项研究，旨在解决现有层次分解方法缺乏基于数据内在属性优化分类结构的机制这一核心问题。他们提出，可以利用DRASiW模型内部形成的、代表各类别本质特征的“心理意象”，来衡量类别间的相似性与差异性，从而指导最优层次树的构建。他们的研究结果表明，这种基于心理意象的分解方法，能够显著提升多种机器学习模型的分类性能，并在与多种现有层次分解方法的对比中取得了领先的综合排名。这项工作不仅为多类分类问题提供了更强大的工具，也为机器学习模型的可解释性研究提供了新的视角。

为开展研究，研究人员主要应用了以下几项关键技术方法：首先，核心是基于权重神经网络的DRASiW模型及其产生的“心理意象”，该模型使用内存单元而非连接权重进行学习，并能生成可视化的类别原型。其次，提出了名为Mental Image Decomposition (MID) 的层次分解框架，该框架利用“心理意象”计算汉明距离和Jaccard指数，以评估和选择最优的类别二分方案。再者，研究在包含阿尔茨海默病数据在内的26个公开基准数据集上，使用5折和10折交叉验证进行了广泛的实验验证。最后，通过与12种不同的机器学习分类器以及7种成熟的层次分解方法进行性能对比，并采用F1分数、准确率、增益等指标及Wilcoxon符号秩检验、Friedman检验进行统计评估。

研究结果

•
实验1 – 基线rDAB_rvs rDAB_r+ MID

本实验验证了MID方法对其基础模型rDAB_r的有效性。结果表明，应用MID后，系统在F1分数和准确率上均获得一致且显著的提升。在5折交叉验证中，F1分数平均增益达15.07%，准确率平均增益为14.65%；在10折交叉验证中，增益分别为9.05%和8.58%。统计检验证实这些改进具有高度显著性。这表明MID的层次分解有效简化了rDAB_r的学习任务。
•
实验2 – 对MID增强的机器学习方法的评估

本实验将MID框架应用于包括AdaBoost、K最近邻、支持向量机等在内的12种不同机器学习分类器。结果显示，MID能够普遍提升多种分类器的性能，其中对AdaBoost和K最近邻的提升效果最为显著和稳定。统计分析表明，对于绝大多数方法，性能增益是统计显著的。这表明MID作为一种预处理步骤，对于广泛的算法族具有普遍的有效性，尤其适用于集成学习和基于距离的方法。
•
实验3 – MID与其他层次分解方法的对比

本实验将MID与七种已有的层次分解方法在四种有代表性的机器学习模型上进行对比。结果表明，MID是性能最优越的方法之一。在10折交叉验证的准确率指标上，MID在改善的数据集数量上排名第一。综合所有性能指标和稳定性度量，MID在全局排名中位列第一。这确立了MID在当前层次分解技术中的领先地位。
•
进一步有趣的结果

对三项实验结果的整合分析进一步巩固了MID的优越性。在平均增益、平均差值和排名等综合指标上，MID在5折和10折交叉验证协议下均获得了全局排名第一。这证明MID不仅能带来更大的性能提升，而且具有更优的稳定性。

研究结论与意义

该研究提出的心理意象分解框架，通过利用DRASiW模型“心理意象”所蕴含的类别本质信息，成功构建出与数据内在结构高度契合的优化层次树，为解决复杂多类分类问题提供了一种新颖高效的解决方案。

其重要意义主要体现在三个方面：首先，在性能上，MID被证明是当前最有效的层次分解方法之一，能够显著且稳定地提升包括其自身基础模型rDAB_r以及AdaBoost等多种主流分类器的性能。其次，在可解释性方面，基于“心理意象”的分解过程本身提供了对类别关系的直观洞察，增强了模型决策的透明度，与可解释人工智能的理念相契合。最后，在实际应用上，研究指明了MID方法的最佳应用场景，即它特别适用于与树状集成方法、近邻算法以及本身具有层次结构的数据，为研究者和从业者提供了清晰的选用指南。

总之，这项工作不仅证实了基于数据内部表示（心理意象）来指导层次分解的可行性，而且开发出了一个在实践中表现卓越的框架。rDAB_r+ MID组合在性能、可解释性和计算效率之间取得了良好的平衡，使其在需要高精度与高透明度的实际应用中具有重要价值。未来，该方法可向多叉分解或重叠分解扩展，以构建更浅或更鲁棒的决策结构，展现出进一步的发展潜力。

联系信箱：

粤ICP备09063491号

热点排行