基于加权分区的混合类型数据聚类方法,采用动态分类权重调整
《Knowledge-Based Systems》:Weighted partition-based clustering for mixed-type data with dynamic categorical weighting
【字体:
大
中
小
】
时间:2026年05月20日
来源:Knowledge-Based Systems 7.6
编辑推荐:
Ashish Dutt|Zeeshan Ali摘要在ClicoT算法针对混合类型数据聚类的概念层次结构方法的基础上,我们提出了WP-ClicoT(加权分区ClicoT),这是一种基于加权分区的新型算法。该算法能够动态地为分类数据类型分配权重并进行计算,同时建立连续属性和分类属性之
Ashish Dutt|Zeeshan Ali
摘要
在ClicoT算法针对混合类型数据聚类的概念层次结构方法的基础上,我们提出了WP-ClicoT(加权分区ClicoT),这是一种基于加权分区的新型算法。该算法能够动态地为分类数据类型分配权重并进行计算,同时建立连续属性和分类属性之间的可量化关联。这种渐进式的权重分配方式标志着从二元决策向连续相关性建模的根本转变,使得在各个簇中更细致地表示分类属性的重要性成为可能。与ClicoT仅区分元素是否特定于二元类别的不同,WP-ClicoT引入了一种连续的权重分配方案,能够捕捉分类属性的不同相关程度。我们的方法采用基于互信息的权重计算方法来处理分类特征,并引入了一种新的关联度量指标,以弥合异构数据类型之间的差距。通过基于分区的框架和自适应的权重优化机制,WP-ClicoT在保持可解释性的同时实现了更优的聚类性能。在合成数据和真实世界数据集上的广泛实验表明,WP-ClicoT的表现优于ClicoT及其他最先进的算法,在具有复杂分类结构的数据集上,其NMI(净信息增益)提升了高达18%。我们还提供了与基于深度学习的方法的全面比较,并证明了其相较于现有方法具有更强的竞争力和更高的可解释性。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号