《Journal of Affective Disorders》:Differentiating bipolar disorder and schizophrenia using sleep EEG power and coherence features: A machine learning approach based on polysomnography
编辑推荐:
双相情感障碍(BD)与精神分裂症(SZ)的鉴别诊断存在临床挑战,本研究利用多导睡眠图(PSG)结合机器学习模型,通过分析睡眠EEG的功率谱和脑电同步性特征,发现随机森林分类器在71.88%的准确率下显著优于传统统计方法,关键鉴别指标包括F3_Theta_Pow、总清醒时间、C3_Theta_Pow和睡眠效率。本研究证实夜间睡眠神经生理学特征可作为区分BD与SZ的有效生物标志物。
作者:钟毅、徐楚杰、高亚军、马慧英、刘寅凯、严伟、马玉清、刘向龙、李新荣
北京大学第六医院、北京大学心理健康研究所、国家心理健康重点实验室(北京大学)、国家精神疾病临床研究中心(北京大学第六医院),中国北京
摘要
由于双相情感障碍(BD)和精神分裂症(SZ)的临床症状有重叠,并且存在共同的遗传风险,因此区分这两种疾病具有挑战性,这导致了频繁的误诊和无效的治疗。本研究探讨了通过夜间多导睡眠图(PSG),特别是基于EEG的功率谱和相干性特征,是否能够可靠地区分BD和SZ。我们收集了196名BD患者和154名SZ患者的PSG数据,并为每组选择了137名患者组成的匹配队列(N = 274),以获取全面的睡眠参数、EEG功率谱和相干性指标。集成这些特征的随机森林分类器在所有测试模型中实现了最高的分类准确性(71.88%)、F1分数(0.709)和ROC-AUC(0.770),显著优于逻辑回归和梯度提升决策树。值得注意的是,F3_Theta_Pow、总清醒时间和C3_Theta_Pow、睡眠效率被证明是最具区分性的特征。我们的发现强调了睡眠期间不同的神经生理学特征可以有效区分BD和SZ,突显了PSG作为实用且客观生物标志物的临床价值。这种方法不仅解决了诊断难题,还为理解区分这两种疾病的潜在神经生物学机制提供了见解,可能有助于指导更精确的临床干预。
引言
在临床精神病学中,准确区分双相情感障碍(BD)和精神分裂症(SZ)一直是一个长期存在的挑战。这两种严重的精神疾病可能存在重叠的临床表现(Cardno和Owen,2014;Hwang等人,2025)。两种疾病都可能出现精神病性症状,这常常导致误诊和适当治疗的延迟(Nasrallah,2015;Goes,2023)。这种诊断不准确会通过延长无效的治疗时间而恶化患者的预后(Dacquino等人,2015;Dickerson等人,2017)。因此,开发早期和可靠区分BD和SZ的客观工具具有重要的临床意义。研究人员一直在寻找生物标志物以提高诊断精度,在探索的各种方法中,脑电图(EEG)因其出色的时间分辨率、经济性和对神经活动的直接测量而脱颖而出(Hwang等人,2025)。基于EEG的测量可以提供关于BD和SZ不同神经生理功能障碍的窗口,帮助在仅凭临床症状难以做出诊断时进行鉴别(Kam等人,2013)。从神经生理学角度来看,BD和SZ都表现出大脑振荡活动的异常,反映了更广泛的电路功能障碍(Kam等人,2013)。然而,EEG在临床实践中也存在一些局限性。例如,短暂的静息EEG可能会受到短暂警觉性或药物镇静的影响,而且大多数基于EEG的比较研究都集中在清醒时的静息状态记录上(Ferrarelli和Phillips,2021;Díez等人,2024)。与此同时,睡眠生理学为区分精神疾病提供了另一个未被充分利用的途径。
在严重的精神疾病中,睡眠通常会受到严重影响,这些影响在多导睡眠图(PSG)上可以测量到(de Gans等人,2024)。尽管目前对此研究尚不充分,但SZ在睡眠期间可能表现出与BD不同的相干性模式。通过检查睡眠EEG的功率谱和相干性,可以捕捉到大脑功能障碍的互补方面(Kam等人,2013;Gan等人,2022;Yan等人,2023a)。捕捉这些多维度的睡眠神经生理学特征可能是必要的,因为如前所述,个体的睡眠特征并非特定于某种疾病(Baglioni等人,2016)。因此,一种整合多种PSG特征的多变量方法可能会揭示出一个比任何单一指标更准确的BD和SZ的复合“指纹”。
为了分析这种高维和复杂的数据,现代机器学习技术变得不可或缺(Hosseini等人,2021)。精神病学研究领域在利用机器学习算法挖掘神经生理数据以发现诊断模式方面取得了显著进展(Lee和Laureys,2024)。与一次只检查一个特征的传统统计分析不同,机器学习可以同时考虑大量的EEG/PSG特征,并辨别出区分患者组的微妙的多变量模式(Rafiei等人,2024;Cao等人,2023)。这对于EEG和PSG数据尤其相关,因为这些数据可能包含数十到数百个潜在变量,从多个电极的多个频率带的功率到众多区域对的相干性值,再到常规的睡眠指数(Hosseini等人,2021)。在各种算法中,集成方法如随机森林因其在生物医学数据中的鲁棒性和可解释性而受到青睐(Rasheed等人,2021)。实际上,随机森林和其他机器学习模型已在相关领域得到成功应用(Rahul等人,2024;Huang等人,2025;Zou等人,2024)。通过使用机器学习整合多个EEG功率和相干性标志物,我们可以超越简单的比较,朝着一个更全面的诊断分类器迈进,充分利用PSG数据的所有信息内容。
BD和SZ在睡眠结构和睡眠期间大脑电活动的动态方面存在潜在的神经生理学差异。基于这一背景,本研究探讨了从PSG提取的EEG特征在区分BD和SZ方面的诊断效用。特别是,我们关注从夜间睡眠记录中提取的功率谱特征(量化头皮上不同频率带的强度)和相干性特征(量化EEG通道之间的同步性)。我们的方法是应用机器学习分类器来学习一个模型,该模型可以根据个体的PSG特征预测BD与SZ的诊断。通过捕捉从宏观层面的睡眠指数到微观层面的EEG振荡指标的广泛标志物,我们旨在揭示一个能够可靠区分这两种疾病的多特征模式。
参与者与数据收集
使用便携式Somté多导睡眠图(PSG)(Compumedics,澳大利亚维多利亚州墨尔本)从196名BD患者和154名SZ患者那里收集了PSG数据信号。PSG数据收集时间大约在21:00–06:00之间。PSG数据收集遵循国际10–20系统,包括EEG(C3/C4、O1/O2、F3/F4、M1/M2)、EOG(E1/E2)、EMG(下巴、膈肌和胫前肌(左侧和右侧))、鼾声、气流(热敏电阻)和呼吸努力(腹部等)。
精神分裂症和双相情感障碍患者的人口统计特征
表1展示了患者的人口统计数据。两组患者在性别、年龄、身高或体重方面没有显著差异。两组中的性别比例(男性/女性)分别为:55/82(SZ),61/76(BD)。两组中的女性人数都多于男性,但差异不显著。两组患者的年龄、身高和体重以平均值±标准差表示。SZ组的平均年龄(35.07±17.57岁)略高。
讨论
据我们所知,这是首批利用夜间PSG数据和机器学习进行BD与SZ直接分类的研究之一,将之前的EEG生物标志物研究扩展到了睡眠领域(Narayanan等人,2014;Ferrarelli等人,2007)。本研究证明,夜间PSG特征可以可靠地区分BD和SZ。仅利用睡眠衍生的指标,随机森林分类器就达到了高准确性,表明神经生理学特征在区分这两种疾病方面起着重要作用。
结论
据我们所知,这是首批利用夜间PSG EEG数据和机器学习进行BD与SZ直接分类的研究之一,将之前的EEG生物标志物研究扩展到了睡眠领域。随机森林的使用不仅提供了一个分类模型,还使我们能够识别出哪些特征(例如特定频率带的功率或区域间的特定相干性)对于区分这两种疾病最为显著。这样的知识可能有助于阐明……
作者贡献声明
钟毅:撰写——审稿与编辑,撰写——初稿。徐楚杰:撰写——审稿与编辑,撰写——初稿,数据管理。高亚军:撰写——审稿与编辑,撰写——初稿,数据管理。马慧英:撰写——审稿与编辑,撰写——初稿。刘寅凯:撰写——审稿与编辑。严伟:监督。马玉清:撰写——审稿与编辑,监督,概念化。刘向龙:撰写——审稿与编辑,监督。
资助
本工作得到了中国国家重点研发计划(2023YFC2506800、2024YFC2707804)、中国国家重点科技项目(2021ZD0200600、2021ZD0200701)、STI2030重大项目(2021ZD0203400)、国家自然科学基金(82471557、82171534、82171477)、山西省地方科技发展指导基金(YDZJSX2022A063)以及科技创新团队专项基金的支持。
利益冲突声明
作者声明他们没有已知的财务利益或个人关系可能影响本文报告的工作。