今日动态 返回首页
会员注册 登录 生物通快讯免费订阅
  • 首页 今日动态 人才市场 新技术专栏 中国科学人 云展台
    BioHot
    • 定制我的BioHot
    • 进入我的BioHot
    • 进入我的集采
    • 肿瘤癌症研究
    • 免疫/基因/细胞疗法
    • 神经生物学
    • 健康与疾病
    • 衰老机制与长寿
    • 单细胞技术
    • 基因编辑-CRISPR
    • RNA研究
    • 肠道菌与人体微生态
    • 细胞代谢
    • AI生物信息学
    • COVID
    云讲堂直播 会展中心 特价专栏 技术快讯 免费试用

  • 生物通官微
    陪你抓住生命科技
    跳动的脉搏

生物通首页  >  今日动态  >  正文

一项关于结合多重插补技术的聚类集成算法在处理含有缺失数据的聚类问题上的比较模拟研究

《BMC Medical Research Methodology》:A comparative simulation study of cluster ensemble algorithms integrated with multiple imputation for clustering with missing data

【字体: 大 中 小 】 时间:2026年06月03日 来源:BMC Medical Research Methodology 3.4

编辑推荐:

  摘要由于聚类分析方法通常不能直接应用于包含缺失值的数据,因此人们研究了多种方法来解决这一问题。多重插补是处理缺失数据的标准方法之一。在聚类分析中,人们提出了将聚类集成方法与多重插补相结合的方法,以替代Rubin规则。然而,目前尚未明确哪种聚类集成算法在与多重插补结合使用时能够获得

  

摘要

由于聚类分析方法通常不能直接应用于包含缺失值的数据,因此人们研究了多种方法来解决这一问题。多重插补是处理缺失数据的标准方法之一。在聚类分析中,人们提出了将聚类集成方法与多重插补相结合的方法,以替代Rubin规则。然而,目前尚未明确哪种聚类集成算法在与多重插补结合使用时能够获得更好的性能。因此,我们对几种算法进行了数值比较,以整合k-means++聚类对多重插补数据集的处理结果,并将这些组合方法应用于两个真实数据集。我们的结果表明,非负矩阵分解算法可能适用于类别平衡的情况,而贪心聚类和凝聚聚类算法可能更适合类别不平衡的情况。在实际数据集应用之前,我们仍然建议在反映数据集特征和缺失值机制假设的模拟环境中进行实验。

由于聚类分析方法通常不能直接应用于包含缺失值的数据,因此人们研究了多种方法来解决这一问题。多重插补是处理缺失数据的标准方法之一。在聚类分析中,人们提出了将聚类集成方法与多重插补相结合的方法,以替代Rubin规则。然而,目前尚未明确哪种聚类集成算法在与多重插补结合使用时能够获得更好的性能。因此,我们对几种算法进行了数值比较,以整合k-means++聚类对多重插补数据集的处理结果,并将这些组合方法应用于两个真实数据集。我们的结果表明,非负矩阵分解算法可能适用于类别平衡的情况,而贪心聚类和凝聚聚类算法可能更适合类别不平衡的情况。在实际数据集应用之前,我们仍然建议在反映数据集特征和缺失值机制假设的模拟环境中进行实验。

相关新闻
生物通微信公众号
生物通新浪微博
微信
新浪微博
我要投稿
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热搜:聚类缺失值推荐算法集成优化非负矩阵分解真实验证实际模拟环境

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号