
-
生物通官微
陪你抓住生命科技
跳动的脉搏
Adaptmol:在有限监督下实现分子图像识别的域适应方法
《Journal of Cheminformatics》:Adaptmol: domain adaptation for molecular image recognition with limited supervision
【字体: 大 中 小 】 时间:2026年05月04日 来源:Journal of Cheminformatics 5.7
编辑推荐:
摘要光化学结构识别(OCSR)旨在将二维分子图像转换为机器可读的格式,如SMILES字符串。深度学习显著提升了OCSR的性能,但大多数方法仍依赖于合成训练数据,并且难以泛化到现实世界的输入数据,尤其是手绘图表,因为不同人的笔画宽度、几何形状和绘图规范差异很大。在这项工作中,我们提
光化学结构识别(OCSR)旨在将二维分子图像转换为机器可读的格式,如SMILES字符串。深度学习显著提升了OCSR的性能,但大多数方法仍依赖于合成训练数据,并且难以泛化到现实世界的输入数据,尤其是手绘图表,因为不同人的笔画宽度、几何形状和绘图规范差异很大。在这项工作中,我们提出了一种图像到图的模型AdaptMol,它能够在无需目标领域手动图注解的情况下,实现从合成数据到真实世界数据的有效迁移。AdaptMol是一个集成流程,首先在合成数据上训练基础模型,然后通过无监督的领域适应和自我训练来优化模型表示。我们的关键发现是,键特征在本质上是领域不变的;它们编码了原子之间的结构关系,这些关系不受不同领域视觉变化的影响。因此,在领域适应过程中,我们利用类条件最大均值差异(MMD)来对齐键级特征分布,以强制实现跨领域的一致性。我们还设计了一种全面的数据增强策略,以提高基础模型的鲁棒性,从而能够在未标记的目标样本上进行稳定的自我训练。在手绘分子图像上,我们的模型准确率达到82.6%,比最佳现有方法高出10.7个百分点,并且在包含科学文献和专利文档中的分子图像的四个基准测试中保持了竞争力。
科学贡献
我们提出了AdaptMol,这是一种图像到图的模型,它将分子结构预测为原子和键的图,能够在无需目标领域图注解的情况下,实现从合成数据到手绘分子图像的有效迁移。我们结合了类条件最大均值差异来对齐不同领域的键特征,并通过全面的数据增强来增加训练数据的多样性,从而充分提高基础模型的准确性,使其能够进行自我训练,并解决了以往方法因初始准确性不足而导致的根本性问题。此外,我们还引入了一种双重位置表示方法,通过离散坐标标记和连续空间热图来同时监督原子位置,以减少原子定位的误报。
光化学结构识别(OCSR)旨在将二维分子图像转换为机器可读的格式,如SMILES字符串。深度学习显著提升了OCSR的性能,但大多数方法仍依赖于合成训练数据,并且难以泛化到现实世界的输入数据,尤其是手绘图表,因为不同人的笔画宽度、几何形状和绘图规范差异很大。在这项工作中,我们提出了一种图像到图的模型AdaptMol,它能够在无需目标领域手动图注解的情况下,实现从合成数据到真实世界数据的有效迁移。AdaptMol是一个集成流程,首先在合成数据上训练基础模型,然后通过无监督的领域适应和自我训练来优化模型表示。我们的关键发现是,键特征在本质上是领域不变的;它们编码了原子之间的结构关系,这些关系不受不同领域视觉变化的影响。因此,在领域适应过程中,我们利用类条件最大均值差异(MMD)来对齐键级特征分布,以强制实现跨领域的一致性。我们还设计了一种全面的数据增强策略,以提高基础模型的鲁棒性,从而能够在未标记的目标样本上进行稳定的自我训练。在手绘分子图像上,我们的模型准确率达到82.6%,比最佳现有方法高出10.7个百分点,并且在包含科学文献和专利文档中的分子图像的四个基准测试中保持了竞争力。
科学贡献
我们提出了AdaptMol,这是一种图像到图的模型,它将分子结构预测为原子和键的图,能够在无需目标领域图注解的情况下,实现从合成数据到手绘分子图像的有效迁移。我们结合了类条件最大均值差异来对齐不同领域的键特征,并通过全面的数据增强来增加训练数据的多样性,从而充分提高基础模型的准确性,使其能够进行自我训练,并解决了以往方法因初始准确性不足而导致的根本性问题。此外,我们还引入了一种双重位置表示方法,通过离散坐标标记和连续空间热图来同时监督原子位置,以减少原子定位的误报。