《Neurocomputing》:Hypergraph based dual constraint propagation robust semi-supervised nonnegative matrix factorization for image clustering
编辑推荐:
本文提出一种创新的超图双约束传播鲁棒半监督非负矩阵分解(HDCP-RSNMF)算法,通过融合超图学习(hypergraph learning)、双约束传播(DCP)和柯西损失函数(Cauchy loss),有效解决了图像聚类中监督信息利用不足、高阶几何关系缺失和噪声敏感三大瓶颈。该模型在8个基准数据集上验证了其优越的聚类性能和鲁棒性。
亮点
本研究的核心创新包括:
• 提出HDCP-RSNMF算法,突破传统半监督非负矩阵分解(semi-supervised NMF)局限,实现更优聚类性能
• 开发新型超图双约束传播(HDCP)方法,同时捕获数据高阶几何关系并实现类别标签与约束信息双重传播
• 通过柯西损失函数(Cauchy loss)替代Frobenius范数,显著提升算法对噪声和异常值的鲁棒性
• 在8个真实图像数据集上系统验证算法收敛性、鲁棒性和监督信息利用效率
收敛性分析
我们现证明HDCP-RSNMF算法目标函数在以下四个更新规则下的收敛性:
定理1
[39]。当X≥0, U≥0, V≥0, B≥0, F≥0时,公式(23)中的目标函数在公式(32)、(35)、(38)和(41)的更新规则下呈非递增趋势。
为证明定理1,首先引入以下引理:
引理1
[39]。对于F(v),若存在辅助函数G(v,v′)满足G(v,v′)≥F(v)且G(v,v′)=F(v),则F的更新规则可推导为:
vt+1= argminvG(v,vt)
数据集、评估指标与对比方法
本研究采用8个标准图像数据集评估HDCP-RSNMF算法:耶鲁人脸库(Yale)、ORL人脸库、UMIST、CMU PIE、COIL20、COIL100、MNIST手写数字库和Optdigits。其中CMU PIE数据集包含68个对象的41,368张面部图像,为保持实验一致性,我们每个对象选取46张图像并统一归一化为1024维特征向量。详细数据集规格见表1。
实验采用6种广泛使用的评估指标进行图像聚类性能评估。
结论
本文提出新型HDCP-RSNMF算法,通过构建超图学习数据样本间的高阶几何关系,结合双约束传播(包括成对约束传播和标签传播)构建包含丰富监督信息的综合相似性矩阵。该方法进一步引入基于柯西分布的鲁棒损失函数,有效缓解了噪声和异常值的影响。