多视图半监督序数回归

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

多视图半监督序数回归

《Knowledge-Based Systems》：Multi-view semi-supervised ordinal regression

【字体：大中小】 时间：2026年05月10日 来源：Knowledge-Based Systems 7.6

编辑推荐：

　　 Xiao彦山 | 黄家石 | 刘波广东工业大学计算机科学系，广州，中国 **摘要** 序数回归（OR）处理的是训练集包含多个类别且这些类别有顺序排列的分类问题。目前，已有大量关于OR的研究。然而，大多数现有的OR方法是针对带有标签数据的单视图OR提出的，而针对

　　 Xiao彦山 | 黄家石 | 刘波
广东工业大学计算机科学系，广州，中国

**摘要**
序数回归（OR）处理的是训练集包含多个类别且这些类别有顺序排列的分类问题。目前，已有大量关于OR的研究。然而，大多数现有的OR方法是针对带有标签数据的单视图OR提出的，而针对半监督数据的多视图OR的研究较少。在本文中，我们提出了一种新颖的多视图半监督大 margin OR 方法（MSOR），该方法整合了多个视图和未标记数据的信息来改进OR分类器。首先，为了融合来自多个视图的信息，我们通过考虑所有视图中的最近邻信息为每个视图构建了一个相似性图。这样，一个视图的最近邻信息可以被视为另一个视图的补充信息，从而使不同的视图能够相互提供补充信息以丰富彼此。其次，为了整合未标记数据，我们采用了自适应流形项。与传统的流形项不同，传统的流形项中相似性权重是一个固定值，而在我们的自适应流形项中，相似性权重是一个未知变量，它将在训练过程中得到优化。最后，基于相似性图和自适应流形项，我们制定了MSOR的学习问题。在真实世界的OR数据集上的数值实验表明，MSOR的性能优于现有的OR方法。

**引言**
序数回归（OR）是一个多类分类问题，其中类别是有顺序排列的[1]。例如，在面部年龄估计中，一张面部图像可以被划分为四个等级之一：儿童、年轻人、中年人和老年人。根据不同的年龄，这些等级之间存在自然顺序。不同类别的误分类成本是不同的[2]。给定一张老年人的图像，将其归类为中年人类别的惩罚误差将比归类为儿童类别的误差小。在现实世界的应用中，OR问题可以被视为具有序数类别的多类分类问题。最近的研究[3]、[4]、[5]表明，OR方法在具有序数类别的数据集上可以取得比传统多类分类方法更好的性能。OR已被应用于各种实际问题，如信用评级[6]、偏好学习[7]、疾病诊断[8]等。

关于OR的研究有很多。例如，为了处理OR中的异常值，Weinberger等人[9]采用了一种带有截断策略的渐进式损失函数，使模型能够在学习过程中过滤掉异常值。Liu等人[10]提出了一个分布式鲁棒OR方法来处理标签噪声，该方法结合了支持向量OR和互信息来提高对错误标记数据的鲁棒性。Nachmani等人[11]强调，OR方法中的损失函数应满足单调性和平衡敏感性属性。基于此，他们提出了用于OR的软标签累积交叉熵损失。Barbero-Gómez等人[12]专注于OR的解释方法，他们设计了两种基于序数二进制分解和序数信息瓶颈分析的解释方法。Liu等人[13]观察到标签噪声会导致潜在变量值的显著偏差，基于这一观察，他们采用了互信息来处理OR问题，并将其扩展到分布式应用中。尽管在OR领域取得了许多进展，但大多数现有方法是针对带有标签数据的单视图OR提出的，而针对半监督数据的多视图OR的研究较少。从一方面来看，现实任务中的数据对象通常可以从不同的视图观察[14]。例如，在图像检索任务中，一张图像可以通过LBP特征或RGB特征来表示。LBP特征描述纹理信息，而RGB特征描绘颜色信息。不同的视图（特征集）反映了图像的不同视角，整合这些视图可以导致更全面的描述，这被称为多视图学习[15]、[16]。目前，关于多视图OR的研究非常少。Xiao等人[17]通过采用特征增强和特权信息学习来提高多视图OR的性能。Taser[18]将OR问题视为一系列二类分类问题，在每个视图中解决这些问题，并将多个视图的结果结合起来进行预测。Maeda等人[19]将高斯分布扩展到OR问题的解决中，并基于OR数据构建了高斯分布图。Xiao等人[20]假设数据包含不确定信息，并处理了多视图OR中的不确定数据。然而，这些多视图OR方法仅使用标记数据来构建分类器。在实际任务中，我们可能会得到一些未标记的数据，除了标记数据之外。尽管这些数据未经注释，但我们可以在训练阶段将其纳入以改进分类器。因此，当只有少量标记数据可用时，如何将未标记数据和多个视图的信息整合到构建OR分类器中仍然是一个关键问题。

在本文中，我们提出了一种新颖的多视图半监督OR分类器（MSOR），该方法整合了多个视图和未标记数据的信息来改进OR分类器。图1展示了所提出的MSOR方法的框架图。如图1所示，训练集包括标记数据和未标记数据，每个数据由多个视图（例如视图A、B和C）表示。首先，计算每个样本在各个视图中的k个最近邻居。其次，通过将一个视图的最近邻居视为其他视图的补充信息来实现最近邻互补性，从而使不同的视图能够相互提供补充信息以丰富彼此。第三，采用自适应流形项来整合未标记数据以改进分类器。在传统的流形项中，相似性权重是一个固定值，而在MSOR中，相似性权重是一个未知变量，它将在学习过程中得到优化。最后，基于相似性图和自适应流形项，通过最小化标记数据的分类损失并在所有视图间保持相似性一致性，共同学习多个视图的分类器。在真实世界的多视图OR数据集上的大量实验验证了MSOR的有效性。实验结果表明，MSOR的性能明显优于现有的OR方法。

**MSOR的贡献**
1. 首次提出了具有多视图数据的半监督OR问题。据我们所知，这是第一次尝试多视图半监督OR。
2.我们认为一个视图的最近邻信息是另一个视图的补充信息，从而使不同的视图能够相互提供最近邻信息以丰富彼此。
3. 与传统的流形项中相似性权重是固定值不同，MSOR中的相似性权重是一个未知变量，它与分类器一起在学习过程中得到优化。
4. 在真实世界的多视图OR数据集上的广泛实验表明，MSOR的性能明显优于现有的OR方法。

**本文的其余部分**
第2节回顾了相关的OR研究。第3节介绍了MSOR的目标函数并说明了优化过程。第4节给出了实验结果。第5节提出了结论和未来的工作方向。

**参考文献**
序数回归（OR）是在有序类别的数据上构建分类器的方法。目前，已经有大量的OR研究。例如，为了减少异常值的影响，Weinberger等人采用了带有截断策略的渐进式损失函数，使模型能够在训练过程中逐渐忽略异常值。为了处理标签噪声，Liu等人[10]提出了一个分布式鲁棒OR模型，通过结合支持向量OR和互信息来提高对错误标记数据的鲁棒性。

**初步假设**
假设半监督OR数据集D包含l个标记样本{(x1,y1),(x2,y2),…,(xl,yl)}和u个未标记样本{xl+1,xl+2,…,xl+u}。这里，xi是第i个标记样本；yi∈{1,2,…r}是xi的标签；r是类别数量。此外，在多视图设置中，每个样本可以从m个视图表示，然后转换为m个特征向量。因此，每个样本表示为xi={xi1,xi2,…,xim}，其中xiv是样本xi在视图v中的特征向量，m是视图的数量。

**实验**
我们进行了一系列实验来验证MSOR算法的有效性。所有实验都在配备2.10-GHz AMD处理器和16-GB RAM的计算机上完成。MSOR使用MATLAB 2023a实现（见图3）。

**结论和未来工作**
在本文中，我们提出了一种新颖的多视图半监督OR分类器（MSOR），它解决了带有标记数据和未标记数据的多视图OR问题。与现有的OR方法相比，MSOR能够整合来自多个视图和未标记数据的辅助信息，以改进OR模型的性能，当可用于训练的标记数据不足时。MSOR的性能已在MSRA-MM、SCUT-FBP、UTKFace和HCI数据集上得到验证。

**作者署名贡献声明**
Xiao彦山：撰写——原始草稿、方法论、概念化。
黄家石：撰写——原始草稿、验证、概念化。
刘波：撰写——审稿与编辑、监督。

**利益冲突声明**
作者声明以下可能被视为潜在利益冲突的财务利益/个人关系：Xiao彦山报告称获得了广东省自然科学基金的支持。如果有其他作者，他们声明没有已知的财务利益或个人关系可能影响本文所述的工作。

**致谢**
作者感谢审稿人的宝贵意见和建议。本工作得到了广东省自然科学基金（项目编号2023A1515012560）的支持。

联系信箱：

粤ICP备09063491号

热点排行