静息态功能磁共振成像(rs-fMRI)作为一种非侵入性技术,用于测量非结构化认知状态下的内在低频神经振荡,能够识别功能性脑网络之间的异常连接模式(Buckner, Krienen, Yeo, 2013; Chen, Yan, Jiang, Zhang, Zhao, Zhao, Zheng, Yao, Zhang, Kendrick, Jiang, 2022)。这些模式在计算检测神经精神疾病(包括自闭症谱系障碍(ASD)、重度抑郁症(MDD)和神经退行性疾病)方面显示出潜力(Dichter, 2022; Li, Chen, Kong, Li, Hu, 2022)。人工智能的最新进展推动了多种计算方法的发展,以发现用于临床前疾病识别的预测性神经影像特征(Guan, Liu, 2023; Li, Dvornek, Zhuang, Ventola, Duncan, 2018)。深度神经架构通过其从原始影像数据中自主提取诊断相关模式的能力展示了特别潜力(Fang, Wang, Potter, Liu, 2023; Li, Zhou, Dvornek, Zhang, Gao, Zhuang, Scheinost, Staib, Ventola, Duncan, 2021; Ramzan, Khan, Rehmat, Iqbal, Saba, Rehman, Mehmood, 2020)。
深度学习模型的参数密集型特性需要大量的训练数据集才能实现稳健的预测性能,而多中心神经影像研究的日益重视使得这一需求变得更加复杂(Khan, Sohail, Zahoora, Qureshi, 2020; Neyshabur, Bhojanapalli, McAllester, Srebro, 2017; Turner, Paul, Miller, Barbey, 2018; Yu, Linn, Cook, Phillips, McInnis, Fava, Trivedi, Weissman, Shinohara, Sheline, 2018)。尽管这样的合作努力扩大了数据可用性,但专家注释的资源密集型过程造成了显著的瓶颈。当前的神经影像分析框架经常因注释数据集有限而受到限制,从而影响了它们在现实世界临床环境中的应用。
对比自监督作为一种有前景的框架,已被提出用于解决多个领域的数据稀缺问题(Chen, He, 2021; He, Fan, Wu, Xie, Girshick, 2020; Misra, van der, 2020)。通过利用数据之间的内在关系而不是手动标签,这种范式在视觉模式识别、语言建模和医疗分析中显示出有效性(Chaitanya, Erdil, Karani, Konukoglu, 2020; Krishnan, Rajpurkar, Topol, 2022)。尽管取得了这些成功,但在当前的研究文献中,将对比学习策略应用于功能性神经影像数据以增强神经系统疾病诊断的应用仍然很少。
在本文中,我们提出了一个基于GIN-Transformer的成对图对比学习框架(GITrans-PairCL),用于使用rs-fMRI数据进行脑疾病诊断。如图1所示,所提出的框架包括两个关键组件:图同构网络(GIN)和Transformer的对比学习(Vaswani等人,2017)通过时间图对(DCL模型):一个用于无监督学习的预训练模型。该架构采用级联网络,结合了使用大规模数据预训练的GIN和Transformer。具体来说,未标记的rs-fMRI数据通过滑动窗口方法对血氧水平依赖(BOLD)信号进行时间增强。增强后的图随后被输入到并行的GIN和Transformer编码器中进行特征提取,然后进行无监督的跨视图对比学习。任务驱动的微调模型(TDF模型):一个下游任务适配模块,用于微调预训练模型以进行脑疾病诊断。这一阶段涉及对模型参数的监督优化,以符合特定的诊断目标。
实验评估包括在两个不同的脑疾病数据集上进行单站点和跨站点验证。结果表明,我们的框架在两种疾病类别中的诊断性能均优于最先进的方法,特别是在跨领域泛化能力方面具有显著优势。
本文的主要贡献如下:
1.我们提出了GITrans-PairCL,一个通过无监督跨视图对比预训练和保持知识的迁移策略显著减少对标记数据依赖的框架。
2.我们设计了一个双模型局部-全局协作架构,DCL模型。它结合了基于GIN的空间脑区连接性分析和基于Transformer的全局时间动态建模,实现了多尺度脑网络表示。
3.我们在单站点、跨站点和跨数据集设置下对所提出的模型进行了评估,证明了其鲁棒性和泛化能力。