朝向鲁棒的非线性子空间聚类:一种核学习方法

《IEEE Transactions on Artificial Intelligence》:Toward Robust Nonlinear Subspace Clustering: A Kernel Learning Approach

【字体: 时间:2026年02月03日 来源:IEEE Transactions on Artificial Intelligence CS6.4

编辑推荐:

  提出数据驱动的核学习模型DKLM,解决核子子空间聚类中预定义核、流形结构保持及谱方法依赖性问题,通过自适应加权与三角不等式约束提升聚类效果,理论验证与实验均显示其有效性。

  
影响声明:
基于核的子空间聚类对于分析非线性数据结构至关重要,然而现有方法在预定义核函数和保持流形结构方面存在挑战...显示更多

摘要:

基于核的子空间聚类是一种用于处理数据中非线性结构的研究领域。尽管取得了显著进展,但现有方法主要面临以下限制:1) 预定义核函数对模型性能的影响;2) 在非线性空间中保持原始流形结构的难度;3) 光谱类型策略依赖于亲和矩阵的理想块对角结构。为了解决这些限制,本文提出了一种数据驱动的核学习模型(DKLM),这是一种新的基于核的非线性子空间聚类方法。DKLM采用数据驱动的方式,直接从数据的自表示中学习核函数,确保了权重的自适应调整,并满足乘法三角不等式约束,从而增强了学习到的核函数的鲁棒性。通过利用这种学习到的核函数,DKLM能够在非线性空间中保持数据的局部流形结构,同时促进最优块对角亲和矩阵的形成。对DKLM的深入理论分析揭示了它与现有聚类方法之间的关系。在合成数据和真实世界数据集上的全面实验证明了该方法的有效性。

引言

高维数据聚类在数据挖掘和机器学习的各个领域中发挥着重要作用。通常,高维数据分布在多个低维子空间中。例如,在不同光照条件下的人脸图像往往可以用一个9维线性子空间来表示。已经建立了多种子空间聚类技术来识别这些子空间,包括统计分析[1]、代数运算[2]、迭代优化[3]和光谱方法[5]。子空间聚类过程涉及将数据点从线性子空间的并集中分割到各自的子空间中,已应用于多个领域,如运动分割[6]、生物信息学中的基因表达谱分析[7]、金融市场模式的识别[8]以及社交网络社区的检测[9]。

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号