基于双空间一致性信息测量的在线多标签流式特征选择方法(适用于存在缺失特征的情况)

《IEEE Transactions on Artificial Intelligence》:Online Multilabel Streaming Feature Selection With Missing Features by Dual-Space Consistency Information Measurement

【字体: 时间:2026年02月03日 来源:IEEE Transactions on Artificial Intelligence CS6.4

编辑推荐:

  多标签流式特征选择中动态生成特征存在缺失问题,提出基于双空间一致性信息测量的DCM方法,结合模糊α-容差关系处理缺失特征,改进邻域相似性捕捉标签间关联,引入一致性增益指数优化特征选择,构建在线特征选择框架有效应对流式数据的高维稀疏性。

  
影响声明:
在复杂的多标签流式数据环境中,由于数据收集错误或传感器故障等问题,动态生成的特征可能会包含缺失值...显示更多

摘要:

多标签特征选择对于应对多标签学习中的高维度和计算复杂性挑战至关重要。然而,在某些实际应用中,一个更为复杂的挑战是特征的动态生成,即流式特征。尽管一些学者已经研究了多标签流式特征选择方法,但在多标签数据中动态特征生成过程中缺失特征的问题却很少被考虑。因此,我们提出了一种基于双空间一致性信息测量(DCM)的在线多标签流式特征选择方法,用于处理包含缺失特征的多标签数据。首先,我们构建了DCM,它可以有效地捕捉特征与标签之间的关系。具体来说,我们从实例关联的角度出发,提出了一种模糊的容忍度关系来直接处理缺失特征,并在标签空间中引入了一种改进的邻居相似性关系,以捕捉标签组合之间的实例相似性。其次,基于双空间一致性信息,我们进一步引入了一致性增益指数,以帮助在流式特征选择过程中识别出具有重要信息的特征。第三,通过结合在线显著性分析、在线相关性和在线冗余性分析,我们构建了一个新的流式特征选择框架,该框架可以全面评估新到达的特征在强一致性、弱一致性和无关性方面的表现,从而识别出在不断到来的特征流中最具代表性的特征。最后,在多个基准数据集上进行的一系列比较实验证明了我们提出方法的有效性和优越性。

引言

多标签学习是机器学习和数据挖掘中的一个重要问题[1]、[2]。与传统单标签学习相比,多标签学习中的单个实例可以同时属于多个类别。例如,一张包含海滩、日落和人物的照片可以被标记为风景、自然和人物。在实践中,多标签学习被广泛应用于文本分类、生物信息学和图像注释[3]、[4],这可以更准确地描述复杂对象的特征。然而,在处理这类复杂数据时,多标签学习面临几个挑战,如高计算复杂性[5]、高维度[6]和流式特征[7],这些都对模型的灵活性和效率提出了更高的要求。

相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号