基于联邦学习的毒理学数据资源融合：推动化学安全评估新方法（NAM）发展

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Computational Toxicology》：Federation of toxicological data resources for in silico new approach methodologies (NAMs)

【字体：大中小】 时间：2026年01月30日 来源：Computational Toxicology 2.9

编辑推荐：

　　本研究针对化学安全评估中数据孤岛、异构性及监管接受度等挑战，创新性地引入联邦学习（FL）技术，通过模拟皮肤渗透性分析、致突变性预测和皮肤致敏性识别三个应用场景，验证了联邦学习在保护数据隐私的前提下，能够实现与集中式模型相媲美的预测性能。该研究为化妆品等行业提供了安全协作建模的新范式，有望加速体外新方法（NAM）在下一代风险评估（NGRA）中的监管应用。

在化妆品、药品和工业化学品的安全性评估领域，传统动物试验正逐渐被下一代风险评估（NGRA）框架所倡导的动物替代方法所取代。其中，计算毒理学工具，尤其是定量构效关系（QSAR）模型，作为重要的新方法（NAM），在填补数据空白、识别危害和确定优先级方面展现出巨大潜力。然而，这些模型的广泛应用仍面临多重瓶颈：一方面，高质量毒理学数据往往分散在不同机构中，因商业机密、隐私法规或竞争关系而无法共享，形成“数据孤岛”；另一方面，公共数据集通常存在化学空间覆盖不均、历史测试偏差等问题，限制了模型的适用域和预测稳健性。此外，监管机构对模型透明度、可解释性以及数据来源可靠性的高要求，也使得单一机构开发的模型难以获得广泛认可。

为破解这一困境，一项发表于《Computational Toxicology》的研究提出了一种创新解决方案——联邦学习（Federated Learning, FL）。这是一种去中心化的机器学习范式，允许多个参与方在无需直接共享原始数据的前提下，协同训练模型。各方仅在本地训练模型，然后上传模型参数（如权重、梯度）至中央服务器进行聚合更新，从而在保护数据隐私和商业秘密的同时，整合分散的知识。本研究通过三个精心设计的用例，系统评估了联邦学习在化学安全评估关键终点中的应用可行性。

研究人员采用开源的Flower联邦学习框架，模拟了三种典型的协作场景。在皮肤渗透性分析中，他们运用联邦分析（Federated Analytics）对来自HuskinDB、SkinPiX和Stevens等三个独立数据库的透皮系数（log K_p）数据进行聚合分布分析，并引入差分隐私技术添加噪声，以评估隐私与效用之间的平衡。在致突变性预测中，构建了一个垂直联邦学习场景，两个模拟机构分别持有不同分布（一个80%为致突变物，另一个80%为非致突变物）的化合物数据，使用基于SMILES字符串的卷积神经网络（CNN）进行协同训练。在皮肤致敏性危害识别中，则采用水平联邦学习，将AI4Cosmetics和Skin Doctor CP两个私有数据集的分子指纹和描述符用于训练联邦XGBoost（eXtreme Gradient Boosting）模型，并与集中式学习（Centralised Learning, CL）和局部学习（Local Learning, LL）基准进行性能比较。

3.1. 联邦分析捕捉局部数据变异性

联邦分析成功聚合了三个数据源的皮肤渗透系数分布，揭示了表皮和真层渗透性的整体景观。结果显示，不同数据集之间存在明显的非独立同分布（non-IID）特性，例如HuskinDB的数据范围最广（log K_p从-11.36至-4.42），而Stevens等人的数据相对集中（-6.94至-2.52）。通过添加高斯噪声（ε=1）的差分隐私处理，虽然略微拓宽了分布范围（-12.1至-1.89），但仍在可接受的精度损失内有效保护了个体数据点的敏感性。这种方法使研究人员能够在不可见原始数据的情况下，评估数据质量、比较不同皮肤层的渗透特性，并识别潜在的异常值或混淆因素，为后续模型构建和数据标准化提供了重要依据。

3.2. 联邦学习克服数据集特异性偏差

在致突变性预测的垂直联邦学习场景中，联邦模型展现出了优于单个局部模型的均衡性能。在数据集A（约80%为致突变物）上训练的模型倾向于高召回率（尽可能找出阳性物），但假阳性也高；而在数据集B（约80%为非致突变物）上训练的模型则精密度高但漏检严重（高假阴性率）。联邦模型通过整合两个数据集的互补信息，在准确率、F1分数、AUC等多项指标上取得了平衡且稳健的表现，证明其能够克服单个数据集的分布偏差，从更广阔的化学空间中学习，从而做出更可靠的预测。

3.3. 联邦学习性能与中心及局部模型相当

对于皮肤致敏性的水平联邦学习，研究结果表明，联邦学习（FL）模型的预测性能非常接近集中式学习（CL）模型，且在多数指标上无统计学显著差异，而两者均显著优于仅在自有数据上训练的局部学习（LL）模型。Tukey HSD检验显示，FL模型在召回率和假阴性率（FNR）等关键指标上与CL模型表现相当。这表明，联邦学习能够在避免数据集中化所带来的隐私和安全风险的同时，达到近乎中心化数据池训练的模型效果，实现了隐私保护与模型效能之间的良好平衡。

3.4. 开放挑战与未来方向

尽管前景广阔，联邦学习在化学安全评估中的应用仍面临诸多挑战。数据质量与异质性首当其冲，各机构本地数据的预处理标准、实验元数据（如试验菌株、溶剂、实验方案）的完整性直接影响联邦模型的可靠性和可解释性。模型的可适用域（Applicability Domain）在分布式环境下更难界定。此外，跨组织的模型治理机制，包括数据与模型的FAIR（可发现、可访问、可互操作、可重用）原则、知识产权分配、参与激励以及监管接受度框架（如遵循OECD QSAR评估框架）等，都需要建立新的标准与合作范式。未来研究应探索联邦迁移学习、联邦检索增强生成等技术，并加强模型验证、反工程信息泄露防护以及可接受性各方面的研究。

本研究通过三个具体的应用案例，实证了联邦学习作为一种隐私保护型协作计算框架，在整合分散毒理学数据资源、提升in silico NAMs预测能力方面的巨大潜力。它为解决化学安全评估中的数据孤岛和隐私矛盾提供了可行路径，有望促进跨组织合作，增强评估证据的权重，从而推动NGRA在监管科学中的实际应用和下一代风险评估范式的成熟。通过联邦学习，在不移动原始数据的前提下，能够释放沉睡在各方数据库中的知识价值，为最终实现动物替代的安全评估愿景奠定了坚实的技术基础。

联系信箱：

粤ICP备09063491号

3.1. 联邦分析捕捉局部数据变异性

3.2. 联邦学习克服数据集特异性偏差

3.3. 联邦学习性能与中心及局部模型相当

3.4. 开放挑战与未来方向

热点排行