《Frontiers in Neuroscience》:LLM-based feature selection and counterfactual explanations applied to functional connectivity analysis in schizophrenia
编辑推荐:
本文提出了一种创新框架,将大语言模型(LLM)的先验知识引导与反事实解释技术相结合,用于精神分裂症(SZ)的功能连接(FC)分析。该方法通过LLM-Lasso进行特征选择,有效筛选出兼具统计学显著性与生物学合理性的关键FC特征,并利用反事实解释生成直观的干预建议,为理解SZ的神经病理机制提供了新的可解释性分析工具。
引言
精神分裂症(SZ)是一种复杂的神经精神疾病,其神经机制尚不明确。功能连接(FC)为理解其病理机制提供了独特视角,但高维特性对特征选择和模型解释提出了挑战。传统特征选择方法缺乏神经科学先验知识的整合,导致临床相关性有限。
材料与方法
本研究使用五个公共SZ数据集(COBRE、华西、诺丁汉、台湾、湘雅),包含773名受试者。静息态功能磁共振成像(rs-fMRI)数据经过预处理后,根据AAL模板定义90个脑区,计算节点时间序列的相似性作为功能连接矩阵。每个受试者的FC特征表示为1×4005维向量。
基于LLM-Lasso的特征选择
为解决高维小样本问题,本研究提出LLM-Lasso特征选择方法。通过将LLM嵌入的脑疾病知识转化为连接特异性惩罚权重,对Lasso的?1惩罚项进行加权。目标函数为:
β? = minβ{1/2∑i=1n(yi-β0-xi?β)2+ λ∑j=1pωj|βj|}
其中ωj为LLM生成的惩罚因子。通过交叉验证选择最优变换函数u*∈U,确保模型性能不低于传统Lasso。
反事实解释
采用反事实解释模型生成多组反事实样本,通过优化包含铰链损失、距离函数和多样性度量的目标函数:
X(mi) = γ1/L∑l=1Ldist(xil,mi) - γ2diversity(xi1,...,xiL) + argminxi1,...,xiL1/L∑l=1Llosshinge(f(xil),?)
最终通过LLM将反事实示例转化为自然语言解释,为临床提供直观指导。
结果与讨论
在五个SZ数据集上的实验表明,该方法不仅提高了分类准确率(ACC最高达91.67%),还筛选出与SZ病理机制相关的关键FC特征。统计分析发现异常FC主要集中在默认模式网络(DMN)、感觉运动网络和边缘系统等关键脑区。跨数据集验证显示该方法具有良好的泛化能力,准确率保持在83%以上。
结论
本研究提出的LLM引导特征选择与反事实解释框架,为SZ的FC分析提供了新的研究方法。通过结合LLM的先验知识和反事实解释技术,该方法在提高分类性能的同时增强了模型的可解释性,有望为SZ的早期诊断和个性化治疗提供重要支持。