《ARCHIVES OF COMPUTATIONAL METHODS IN ENGINEERING》:Federated Learning in Multimodal Healthcare Diagnostics: Privacy-Preserving AI for Biomedical Imaging, Electronic Health Records, Wearables, and Clinical Decision Support
编辑推荐:
化学与生物医学成像技术(涵盖磁共振成像 MRI、计算机断层扫描 CT、超声及组织病理学)以及生物传感器与可穿戴设备输出的快速发展,为早期诊断、精准监测与个性化医疗带来了前所未有的机遇。传统人工智能(AI)流程依赖敏感临床数据的集中化处理,而隐私法规、机构政策及
化学与生物医学成像技术(涵盖磁共振成像 MRI、计算机断层扫描 CT、超声及组织病理学)以及生物传感器与可穿戴设备输出的快速发展,为早期诊断、精准监测与个性化医疗带来了前所未有的机遇。传统人工智能(AI)流程依赖敏感临床数据的集中化处理,而隐私法规、机构政策及成像系统硬件差异通常使其难以实现。联邦学习(Federated Learning, FL)通过在无需传输原始影像或患者记录的前提下实现多机构 AI 训练,突破了上述限制:本地模型基于各站点特定的影像与生理数据进行训练,仅共享模型更新参数,从而降低原始患者数据直接暴露风险并提升监管合规性;但需注意,FL 本身并不自动保障机密性,仍需额外防护以应对梯度泄漏、模型反演及成员推理攻击等风险。本综述系统梳理了 FL 在医疗领域的文献,覆盖生物医学成像、电子健康记录(Electronic Health Records, EHR)、生理/化学信号、慢性病管理、老年护理及临床决策支持(Clinical Decision Support Systems, CDSS)等多个研究方向的实际应用。除总结现有成果外,本文还明确了 FL 落地的主要障碍,包括系统异构性、数据不平衡、通信瓶颈及公平性问题。结合研究与临床实践,本文为监管机构、技术开发方及医疗系统提供了可操作的建议,以推动构建安全、公平、跨区域医疗 FL 体系。
本文主体采用系统性范围综述方法,围绕联邦学习(FL)在医疗多模态诊断中的应用展开,从基础原理、应用场景、挑战对策到未来展望进行了结构化论述。
引言
医疗领域正成为人工智能与机器学习(AI/ML)发展最快的行业之一,每日产生海量健康信息,包括电子健康记录(EHR)、计算机断层扫描(CT)与磁共振成像(MRI)等诊断影像,以及可穿戴传感器与远程监测数据。这些数据可辅助医生快速、精准制定个体化治疗方案,但健康数据的敏感性与隐私属性带来了所有权、安全共享及合规难题。美国《健康保险可携性与责任法案》(HIPAA)与欧盟《通用数据保护条例》(GDPR)等法规严格限制数据集中存储与传统 ML 训练。FL 通过将模型下发至各医院、设备或诊所进行本地训练,仅回传模型权重或参数更新至中央系统(或对等网络)聚合为全局模型,原始数据始终不出本地,从而在满足隐私合规的同时实现跨机构数据价值挖掘。目前 FL 已应用于多中心肿瘤识别、EHR 脓毒症与心力衰竭风险预测、可穿戴设备心律失常实时检测及临床决策支持系统(CDSS)早期感染预警等场景。此外,FL 与边缘计算、可解释人工智能(Explainable AI, XAI)、区块链及可信执行环境(Trusted Execution Environments, TEEs)的融合,进一步提升了医疗 AI 的安全性与可信度。针对化学成像(如高光谱成像、拉曼与红外显微镜、荧光分子探针及纳米对比剂)产生的高维光谱数据,FL 可在不交换原始化学图像的前提下实现分子对比增强、光谱重建与响应量化,推动化学传感与成像分子信息的融合诊断。当前 TensorFlow Federated、PySyft、Flower 等工具链已支持多网络结构与加密技术集成,但系统异构性、数据分布异质性(非独立同分布,non?IID)、通信开销及公平性仍是主要落地障碍。
方法
本研究遵循范围综述框架,检索 2018 年 1 月至 2024 年 11 月 PubMed、Scopus、IEEE Xplore 与 Web of Science 中英文文献,检索词组合涵盖“联邦学习”“去中心化学习”“分布式训练”与“医疗”“医学”“临床”“医学成像”“EHR”“可穿戴设备”“生物传感器”等,并补充“MRI”“CT”“超声”“ECG”“EEG”“CDSS”“慢性病”“医疗物联网(IoMT)”等模态术语,辅以引文追踪。筛选经去重、标题摘要初筛、全文复筛三阶段,纳入标准为:在医疗场景中实现或评估 FL 技术、使用真实或模拟生物医学数据、提供定量结果;排除纯概念讨论、无临床任务的区块链或网络基础设施研究、无实证结果的摘要或灰色文献。数据提取涵盖应用领域、数据集特征、FL 范式(横向、纵向、跨设备、跨孤岛、基于迁移学习)、聚合优化策略、模型架构、客户端特性、异构性处理、隐私增强技术及评估指标,最终通过叙事综合按临床主题分组比较方法创新与非 IID 数据处理策略。
联邦学习基础
FL 工作流由本地训练、参数聚合与全局模型更新三步构成。与传统集中式 ML 需将所有数据汇聚清洗不同,FL 将预定义共享模型分发至各参与方(医院、诊所或医疗设备),利用本地私有数据并行训练。例如,医院可基于患者可穿戴设备采集的 ECG 数据本地训练心律失常检测模型,原始信号不出院区,仅回传更新后的模型参数至聚合服务器。服务器对各参与方参数取加权平均生成新版全局模型并重新分发,循环迭代以提升模型对不同患者群体的泛化能力。该机制在保障 HIPAA 与 GDPR 合规的同时,实现了城乡医院、消费级健康产品的协同建模,增强了数据安全与模型公平性。
医疗领域的联邦学习应用
不同医学成像模态:医学影像因数据量大、敏感性高及跨机构异质性成为 FL 典型应用场景。在 MRI 中,FL 通过多中心协作提升模型对扫描仪、协议与人群的域不变特征学习能力,支持缺失对比度合成与类别不平衡处理,在脑肿瘤分类、脊柱椎体分割、功能 MRI 自闭症检测及妇科恶性肿瘤淋巴结转移预测中达到与集中式训练相当的性能(如脑肿瘤分类准确率约 98%),且通过个性化适配降低单中心数据偏差影响。CT 影像方面,FL 在多中心胃癌术后复发预测、肾上腺病变鉴别及 COVID?19 检测中实现 97.4%–98.8% 准确率,结合差分隐私、区块链审计与 IoMT/Spark 架构,兼顾隐私保护与跨设备泛化性。超声成像中,FL 有效缓解操作者依赖性导致的图像质量差异,在肝脂肪变性检测(AUC 0.93)、甲状腺结节分割(Dice 分数 0.908–0.912)及乳腺肿瘤分类(AUC?ROC 最高 0.911)中表现出优于单中心模型的鲁棒性。
生理信号与时间序列监测:FL 在脑电图(EEG)癫痫预测中采用三层架构与 Spiking?GCNN?ANFIS 融合模型,达到 96% 灵敏度与特异度;FedProx 聚合器在 EEG 癫痫诊断中实现 99.95% 精确度与 99.96% 特异度。针对重症监护,FedSepsis 框架整合 ClinicalBERT、LSTM 与 GAN 插补,在低功耗设备(树莓派、Jetson Nano)上实现脓毒症早预警(提前约 4.6 小时);心房颤动预测中,FL 结合 CNN?LSTM 与心率变异性特征,在保证隐私前提下提升分类性能。
慢性病与老年护理:FL 通过联邦强化学习控制器(PRIMO?FRL)优化 1 型糖尿病胰岛素剂量,最大化血糖达标时间并减少高低血糖事件;聚类联邦深度学习按碳水化合物摄入模式分组患者,提升个性化管理稳定性;基于光体积描记法(PPG)的非侵入式血糖监测 FL 模型达到 19.1 mg/dL 均方根误差(RMSE)。在呼吸疾病中,联邦自适应 Transformer 集成模型(FATE)对慢性阻塞性肺疾病(COPD)检测准确率达 98.5%;老年护理场景则通过智能手机活动识别与轻量 CNN 跌倒检测(准确率 99.3%)实现实时隐私保护监测。
可穿戴设备:FL 支持智能手表、健身手环与生物传感器的时序数据本地训练,实现个性化心律失常与压力水平预测。Fog?IoT 平台结合私有区块链保障可穿戴数据完整性;FedHealth 联邦迁移学习框架解决数据孤岛与个性化矛盾,在帕金森病诊断与活动识别中表现优异;FEEL 系统融合少样本学习、知识图谱与情境感知模型,在老年护理跌倒检测中 F1 分数达 0.86–0.94;FL?PMI 框架结合 BiLSTM 与深度强化学习,实现 99.67% 移动识别准确率并减少 36.73% 数据传输量。
电子健康记录(EHR):FL 在不共享原始 EHR 的前提下,通过分散式支持向量机(sSVM)预测心脏病因住院,AUC 与集中式模型相当;FedEHR 框架结合软间隔 SVM 与原对偶分裂算法,优化 IoT 与 EHR 融合的心疾病预测;自适应 FL 分离稳定特征、域特定特征与无关特征,提升多中心脓毒症与急性肾损伤(AKI)风险预测的可解释性。
临床决策支持系统(CDSS):FL?CDSS 利用分布式神经影像与传感器数据,将阿尔茨海默病预测延迟与违约率降低 50%;基于 PPG 的非侵入式血糖监测 FL 模型临床可接受率达 99.31%,适用于资源受限可穿戴设备。此类系统需符合软件即医疗设备(SaMD)监管要求,建立模型更新验证、漂移监测与人工审核闭环。
跨研究综合对比:综合分析显示,FL 在医学成像中性能接近或超过集中式训练,但在超声中仍受设备与标注质量影响;生理信号领域结合个性化与多模态融合可显著提升敏感度与早预警能力;EHR 预测因编码系统与结局定义差异导致结果波动。总体而言,FL 在隐私敏感、多机构且本地数据有限场景下优势明确。
挑战与可行对策
系统异构性:计算能力、内存、带宽与电量差异导致掉线与偏倚,可通过客户端智能选择、异步 FL、模型压缩(量化、剪枝、蒸馏)、个性化 FL 与资源感知调度缓解,并需监管机构制定技术标准、开发者提供轻量自适应 FL 栈、医疗机构部署区域边缘枢纽。
数据异构性(non?IID):采用 FedProx、FedAvgM、聚类相似客户端及元学习等方法提升聚合鲁棒性,同时推进编码标准化与公平性监测。
通信瓶颈:通过模型压缩、客户端采样、异步更新、分层 FL 降低带宽需求,并建立带宽利用率与掉线率报告制度。
公平性与伦理:采用客户端更新重加权、公平性约束训练与 XAI 纠偏,确保模型对不同年龄、种族与疾病亚群的均衡表现。
实际转化障碍:需统一成像协议、开发站点级质控与统计/深度学习协调方法,并推进前瞻性临床工作流嵌入与持续性能监测。
隐私局限与泄露风险:FL 无法完全杜绝梯度反演、模型反演与成员推理攻击,需叠加安全聚合、差分隐私、同态加密、安全多方计算与 TEEs 等多层防护。
结论与未来展望
FL 正成为医疗 AI 的核心范式,在保障隐私与合规的同时释放多源数据价值。未来将与大型语言模型(LLM)及多模态数据深度融合,构建认知更完整的医疗 AI;可解释 FL 将增强临床信任;标准化监管框架与自适应 FL 系统将推动全球规模化部署。FL 代表了连接技术创新与医疗伦理的范式转变,为构建强大、精准、可信且普惠的智能医疗体系提供了可行路径。