基于联邦学习的毒理学数据资源融合:推动化学安全评估新方法(NAM)发展

《Computational Toxicology》:Federation of toxicological data resources for in silico new approach methodologies (NAMs)

【字体: 时间:2026年01月30日 来源:Computational Toxicology 2.9

编辑推荐:

  本研究针对化学安全评估中数据孤岛、异构性及监管接受度等挑战,创新性地引入联邦学习(FL)技术,通过模拟皮肤渗透性分析、致突变性预测和皮肤致敏性识别三个应用场景,验证了联邦学习在保护数据隐私的前提下,能够实现与集中式模型相媲美的预测性能。该研究为化妆品等行业提供了安全协作建模的新范式,有望加速体外新方法(NAM)在下一代风险评估(NGRA)中的监管应用。

  
在化妆品、药品和工业化学品的安全性评估领域,传统动物试验正逐渐被下一代风险评估(NGRA)框架所倡导的动物替代方法所取代。其中,计算毒理学工具,尤其是定量构效关系(QSAR)模型,作为重要的新方法(NAM),在填补数据空白、识别危害和确定优先级方面展现出巨大潜力。然而,这些模型的广泛应用仍面临多重瓶颈:一方面,高质量毒理学数据往往分散在不同机构中,因商业机密、隐私法规或竞争关系而无法共享,形成“数据孤岛”;另一方面,公共数据集通常存在化学空间覆盖不均、历史测试偏差等问题,限制了模型的适用域和预测稳健性。此外,监管机构对模型透明度、可解释性以及数据来源可靠性的高要求,也使得单一机构开发的模型难以获得广泛认可。
为破解这一困境,一项发表于《Computational Toxicology》的研究提出了一种创新解决方案——联邦学习(Federated Learning, FL)。这是一种去中心化的机器学习范式,允许多个参与方在无需直接共享原始数据的前提下,协同训练模型。各方仅在本地训练模型,然后上传模型参数(如权重、梯度)至中央服务器进行聚合更新,从而在保护数据隐私和商业秘密的同时,整合分散的知识。本研究通过三个精心设计的用例,系统评估了联邦学习在化学安全评估关键终点中的应用可行性。
研究人员采用开源的Flower联邦学习框架,模拟了三种典型的协作场景。在皮肤渗透性分析中,他们运用联邦分析(Federated Analytics)对来自HuskinDB、SkinPiX和Stevens等三个独立数据库的透皮系数(log Kp)数据进行聚合分布分析,并引入差分隐私技术添加噪声,以评估隐私与效用之间的平衡。在致突变性预测中,构建了一个垂直联邦学习场景,两个模拟机构分别持有不同分布(一个80%为致突变物,另一个80%为非致突变物)的化合物数据,使用基于SMILES字符串的卷积神经网络(CNN)进行协同训练。在皮肤致敏性危害识别中,则采用水平联邦学习,将AI4Cosmetics和Skin Doctor CP两个私有数据集的分子指纹和描述符用于训练联邦XGBoost(eXtreme Gradient Boosting)模型,并与集中式学习(Centralised Learning, CL)和局部学习(Local Learning, LL)基准进行性能比较。

3.1. 联邦分析捕捉局部数据变异性

联邦分析成功聚合了三个数据源的皮肤渗透系数分布,揭示了表皮和真层渗透性的整体景观。结果显示,不同数据集之间存在明显的非独立同分布(non-IID)特性,例如HuskinDB的数据范围最广(log Kp从-11.36至-4.42),而Stevens等人的数据相对集中(-6.94至-2.52)。通过添加高斯噪声(ε=1)的差分隐私处理,虽然略微拓宽了分布范围(-12.1至-1.89),但仍在可接受的精度损失内有效保护了个体数据点的敏感性。这种方法使研究人员能够在不可见原始数据的情况下,评估数据质量、比较不同皮肤层的渗透特性,并识别潜在的异常值或混淆因素,为后续模型构建和数据标准化提供了重要依据。

3.2. 联邦学习克服数据集特异性偏差

在致突变性预测的垂直联邦学习场景中,联邦模型展现出了优于单个局部模型的均衡性能。在数据集A(约80%为致突变物)上训练的模型倾向于高召回率(尽可能找出阳性物),但假阳性也高;而在数据集B(约80%为非致突变物)上训练的模型则精密度高但漏检严重(高假阴性率)。联邦模型通过整合两个数据集的互补信息,在准确率、F1分数、AUC等多项指标上取得了平衡且稳健的表现,证明其能够克服单个数据集的分布偏差,从更广阔的化学空间中学习,从而做出更可靠的预测。

3.3. 联邦学习性能与中心及局部模型相当

对于皮肤致敏性的水平联邦学习,研究结果表明,联邦学习(FL)模型的预测性能非常接近集中式学习(CL)模型,且在多数指标上无统计学显著差异,而两者均显著优于仅在自有数据上训练的局部学习(LL)模型。Tukey HSD检验显示,FL模型在召回率和假阴性率(FNR)等关键指标上与CL模型表现相当。这表明,联邦学习能够在避免数据集中化所带来的隐私和安全风险的同时,达到近乎中心化数据池训练的模型效果,实现了隐私保护与模型效能之间的良好平衡。

3.4. 开放挑战与未来方向

尽管前景广阔,联邦学习在化学安全评估中的应用仍面临诸多挑战。数据质量与异质性首当其冲,各机构本地数据的预处理标准、实验元数据(如试验菌株、溶剂、实验方案)的完整性直接影响联邦模型的可靠性和可解释性。模型的可适用域(Applicability Domain)在分布式环境下更难界定。此外,跨组织的模型治理机制,包括数据与模型的FAIR(可发现、可访问、可互操作、可重用)原则、知识产权分配、参与激励以及监管接受度框架(如遵循OECD QSAR评估框架)等,都需要建立新的标准与合作范式。未来研究应探索联邦迁移学习、联邦检索增强生成等技术,并加强模型验证、反工程信息泄露防护以及可接受性各方面的研究。
本研究通过三个具体的应用案例,实证了联邦学习作为一种隐私保护型协作计算框架,在整合分散毒理学数据资源、提升in silico NAMs预测能力方面的巨大潜力。它为解决化学安全评估中的数据孤岛和隐私矛盾提供了可行路径,有望促进跨组织合作,增强评估证据的权重,从而推动NGRA在监管科学中的实际应用和下一代风险评估范式的成熟。通过联邦学习,在不移动原始数据的前提下,能够释放沉睡在各方数据库中的知识价值,为最终实现动物替代的安全评估愿景奠定了坚实的技术基础。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号