通过质量感知表示学习实现的自适应深度多视图聚类

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Knowledge-Based Systems》：Adaptive Deep Multi-view Clustering via Quality-aware Representation Learning

【字体：大中小】 时间：2026年02月27日 来源：Knowledge-Based Systems 7.6

编辑推荐：

　　本文提出自适应动态多视图聚类框架AD-MVC，通过教师-学生不对称学习与变分信息瓶颈（VIB）结合，解决多视图数据中的噪声敏感性和学习目标不一致问题。方法包含质量感知表示学习、多模式融合策略及复合损失函数设计，有效提升信息融合与聚类性能。实验表明其在多个基准数据集上优于现有方法。

赵小杰|牛雪颖|曾贤华|张继福

太原科技大学计算机科学与技术学院，山西，030024，中国

摘要

深度多视图聚类旨在利用深度学习揭示多视图数据中嵌入的复杂非线性关联。然而，现有研究通常存在两个主要局限性：对低质量或噪声视图的敏感性，以及表示学习目标与聚类任务之间的不一致性。本文构建了一个自适应和动态的多视图聚类框架。该框架采用师生非对称学习范式来指导视图间的一致性，同时利用变分信息瓶颈（VIB）原理来规范学生视图并保留其关键的互补信息。具体而言，提出了一种基于质量的表示学习策略，该策略结合了师生跨视图指导和基于VIB的正则化，以提取互补特征并减少噪声和冗余。为了同时增强语义一致性、提取判别性特征信息并平衡聚类分配，进一步构建了一个复合损失函数——整合了跨视图对比、VIB和熵正则化项。此外，还开发了一种结合静态、动态和基于注意力模式的自适应融合策略。然后应用跨视图对比学习来提高视图间的样本分配一致性，从而得到一个自适应的深度多视图聚类算法。在多个基准数据集上的广泛实验表明，所提出的方法不仅增强了跨视图一致性和信息整合，还在多种多视图聚类场景中实现了卓越的性能和鲁棒性。

引言

深度多视图聚类（Deep MVC）已成为无监督学习中的一个重要研究方向。通过利用深度神经网络的强大非线性映射能力，Deep MVC可以从高维、异构的多视图数据（如计算机视觉和生物信息学领域的数据）中学习更具判别性和语义一致性的共享低维表示[1]，[2]。与传统的浅层方法[3]，[4]，[5]，[6]相比，Deep MVC能够更有效地应对复杂非线性数据结构带来的挑战，从而显著提高无监督聚类的性能。

利用深度神经网络的强大非线性特征表示能力，Deep MVC已成为一个重要的研究领域。现有工作广泛探索了基于图神经网络[7]，[8]，[9]和自编码器[10]的架构，分别用于挖掘数据的拓扑结构和学习高质量的特征表示。然而，现有的Deep MVC方法仍存在几个关键限制，这些限制阻碍了聚类性能的进一步提升[11]。首先，在信息融合方面，许多方法依赖于简单的特征连接或等权重预测平均[12]。这些策略未能考虑视图间信息质量和噪声水平的固有差异，使得它们容易受到低质量或冗余视图噪声的影响而降低性能。其次，在视图间指导机制方面，一些研究使用高质量视图作为“锚点”来指导其他视图的学习[13]。然而，它们的选择标准（例如，重建误差）主要是启发式的，缺乏与最终聚类目标的原则性联系，可能导致监督效果不佳和优化偏差。为了解决同时捕获共享一致性和保留多个视图间互补信息这一根本挑战，我们提出了一个自适应和动态的多视图聚类（AD-MVC）框架。该框架结合了师生非对称学习范式与VIB，实现了跨视图一致性的增强和信息保留的表示学习。本研究的主要贡献总结如下：

•
提出了一种基于质量的表示学习策略，结合了师生跨视图指导和基于VIB的正则化，以主动过滤特定于视图的噪声并提取关键互补信息。
•
提出了一种新颖的多视图融合策略，结合了静态（视图级别）、动态（样本级别）和基于注意力的（特征级别）机制，在不同的数据集上实现了鲁棒和自适应的信息融合。
•
提出了一个端到端的自适应深度多视图聚类框架，有效提取了共享一致性并保留了关键互补信息，从而实现了卓越的聚类性能。

多视图聚类作为处理多源异构数据的重要技术，其核心目标是将来自多个视图的信息融合起来，以更准确地表征数据的底层结构[14]。

多视图聚类的目标是融合多源信息以揭示数据的潜在结构。传统的MVC方法可以分为三种范式。第一种是共训练范式，其核心思想是迭代学习

方法论

对于给定的多视图数据集

X = {X^{(v)} \in R^{N \times d_{v}}}_{v = 1}^{V}

其中N, V和d_v分别代表v_th视图中的样本数量、视图数量和维度。现有方法往往难以处理噪声视图和不一致的学习目标。为了解决这些问题，我们提出了AD-MVC框架，如图1所示。该框架旨在学习跨视图的统一和具有判别性的潜在表示，整合所有视图的一致信息，并过滤掉

实验

实验是在配备Intel Core i9-14900HX CPU（16 GB RAM）和NVIDIA GeForce RTX 4060 GPU（8 GB）的系统上进行的。AD-MVC框架内的功能模块使用Python 3.11实现。

选择了十个经典和最新的多视图聚类算法进行比较：LMVSC（AAAI 20）[39]、EE-IMVC（TPAMI 21）[40]、DCP（TPAMI 22）[41]、DSMVC（CVPR 22）[42]、DealMVC（ACM MM 23）[33]、FastMICE（TKDE 23）[43]、HFMVC（ACM MM 24）[44]、SCM（IJCAI 24）[34]、DDMVC（PR 25）[45]

结论

在本文中，我们提出了AD-MVC，这是一种新颖的非对称深度多视图聚类框架。通过结合对比学习实现跨视图对齐和变分信息瓶颈来细化表示，AD-MVC有效学习了高度判别性的嵌入，同时抑制了噪声和冗余。广泛的实验表明，所提出的框架在多个基准数据集上实现了卓越的聚类性能，验证了其学习

CRediT作者贡献声明

赵小杰：撰写——原始草稿、验证、软件实现、形式分析。牛雪颖：撰写——审阅与编辑、验证。曾贤华：撰写——审阅与编辑、资金获取。张继福：监督、调查、资金获取、概念化。

利益冲突声明

作者声明他们没有已知的竞争性财务利益或个人关系可能影响本文报告的工作。

致谢

本工作得到了国家自然科学基金（项目编号62172293、62076044）和重庆市人才计划项目（项目编号cstc2022ycjh-bgzxm0160）的支持。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号

摘要

引言

相关工作

多视图聚类作为处理多源异构数据的重要技术，其核心目标是将来自多个视图的信息融合起来，以更准确地表征数据的底层结构[14]。

方法论

实验

结论

CRediT作者贡献声明

利益冲突声明

致谢

热点排行

新闻专题