
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于联邦自编码器的临床决策框架,结合混合类别平衡技术
《Scientific Reports》:Federated autoencoder-based clinical decision framework with hybrid class balancing
【字体: 大 中 小 】 时间:2026年06月06日 来源:Scientific Reports 3.9
编辑推荐:
摘要尽管通过更多地依赖深度学习进行疾病分类,诊断的准确性已经得到了显著提高,但这引发了关于患者数据隐私、安全性和可扩展性的严重担忧。传统的集中式深度学习方法容易遭受数据泄露,并且由于依赖于敏感医疗记录的汇总,无法遵守GDPR和HIPAA等隐私法规。我们的工作提出了一种保护隐私的联
尽管通过更多地依赖深度学习进行疾病分类,诊断的准确性已经得到了显著提高,但这引发了关于患者数据隐私、安全性和可扩展性的严重担忧。传统的集中式深度学习方法容易遭受数据泄露,并且由于依赖于敏感医疗记录的汇总,无法遵守GDPR和HIPAA等隐私法规。我们的工作提出了一种保护隐私的联邦学习架构,能够在多个医疗机构之间进行协作模型训练,而无需暴露原始患者数据,从而解决了这些问题。该方法结合了自动编码器驱动的层次化特征提取技术,提高了分类性能并保证了较低的信息损失。此外,还应用了一种混合类别平衡机制,将生成增强技术与合成少数样本过采样技术(SMote)相结合,以消除不平衡疾病数据集中的偏见,从而提高对少数类场景的敏感性。实验评估表明,在联邦系统中保持计算效率的同时,所提出的模型实现了92.5%的准确率,优于传统的基于CNN的模型(87.2%)和基于LSTM的模型(89.1%)。自适应联邦平均机制还保证了即使在非独立同分布(non-IID)的分布式医疗数据情况下也能实现强收敛性。此外,该方法能够抵抗对抗性攻击,从而增强了实际应用场景中的安全性。这项工作通过为可扩展、分布式、安全的医疗智能系统提供基础,缩短了高精度疾病分类与保护隐私的人工智能之间的距离。研究结果证明了联邦医疗人工智能在改变医疗诊断方面的能力,同时保持了合规性和数据安全。在本研究中,采用了合成少数样本过采样技术(SMOTE)来解决分布式医疗数据集中的类别不平衡问题。SMOTE通过在现有少数类样本之间进行插值来生成新的合成样本,从而防止模型对多数类的偏见,并提高联邦客户端之间的分类鲁棒性。通过在联邦聚合之前增强少数类的表示,SMOTE确保了全局模型学习到更具区分性和平衡性的特征模式。