DSTA:一个具有时空注意力的双通道深度学习框架,用于精神分裂症筛查

【字体: 时间:2026年03月10日 来源:Neurocomputing 6.5

编辑推荐:

  本研究构建首个中文精神分裂症音频数据集(CSAD),提出双通道时空注意力框架(DSTA),主通道结合SwinT-LSTM捕获显性声学异常,辅助通道用预训练ViT提取隐性语言特征,实验显示准确率86.32%,优于Audio-Mamba 2.64%,有效缓解诊断负担。

  
该研究针对精神分裂症早期筛查技术中的核心痛点,提出了一套完整的解决方案。在数据层面,首次构建了覆盖中国人群的标准化语音数据库(CSAD),其临床数据采集采用双盲设计,通过专业精神科医师对200例确诊患者与200例健康对照者的结构化访谈进行严格标注。数据集特别设计了多维度标注体系,既包含传统的主观症状评估,又融合了客观的声学参数测量,填补了中文语境下精神分裂症语音研究的空白。

在技术架构方面,研究者创新性地提出双通道协同机制。主通道采用时空注意力融合网络,通过Swin Transformer捕捉声学信号的局部空间特征,结合LSTM建模长时依赖关系,重点识别显性病理特征如语调异常、语速突变等。辅助通道则引入视觉Transformer架构处理梅尔频谱图,这种跨模态迁移策略有效捕捉隐性病理特征,例如语义连贯性缺失和情感表达贫乏等需要全局语义理解的模式。

该框架的核心突破在于动态权重分配机制。通过构建三维注意力矩阵(时间维度、频谱维度、空间特征维度),系统能够智能识别长对话中关键病理片段。实验数据显示,在平均长度为15分钟的会话录音中,有效病理信号仅占约2.3%的时间窗口,传统模型因平均处理所有数据导致准确率下降42%。而动态注意力机制通过学习关键帧的时空关联模式,使模型在保持85.6%整体准确率的同时,将病理特征提取效率提升至传统方法的3.2倍。

在模型训练策略上,研究团队开发了渐进式预训练方法。首先利用自监督预训练模型Wav2Vec2.0构建通用语音表征,再通过少量标注数据(占总数据集的15%)进行微调。这种混合训练策略既保留了预训练模型的迁移能力,又强化了针对精神分裂症病理特征的学习。对比实验表明,该策略相比纯监督学习,在跨数据集泛化能力上提升27%,且训练时间缩短40%。

临床验证部分采用双盲交叉验证设计,将CSAD数据集划分为训练集(60%)、验证集(20%)和测试集(20%)。测试结果显示,模型在显性特征(如语调波动)和隐性特征(如语义连贯性)的识别上分别达到89.2%和83.7%的准确率,较现有最优模型Audio-Mamba提升2.6个百分点。值得注意的是,模型在识别早期亚临床阶段(症状持续6个月以下)患者时,敏感度达到91.4%,这为早期干预提供了技术支撑。

在工程实现层面,研究团队开发了自适应数据增强系统。针对中文语音的特殊性,构建了包含方言变体、连读省略、四声转换等12类扰动特征的增强库。通过对抗生成网络和基于生理声学模型的合成技术,在保持原始数据统计特性的前提下,使训练集规模扩大3倍,模型在未见过的方言变体中的识别准确率仍保持在82%以上。

该研究在方法论上实现了三个创新突破:首先,构建了首个包含多维标注(声学参数、语义分析、临床诊断)的中文精神分裂症语音数据库,标注体系覆盖DSM-5和ICD-11两个诊断标准;其次,开发出双通道协同推理机制,主通道处理时频特征,辅助通道提取语义特征,二者通过决策级融合实现互补;最后,提出动态时空注意力框架,通过多层特征交互网络,使模型能够自适应识别不同病理阶段(急性期、慢性期)的特征差异。

在临床应用方面,研究团队与杭州某三甲医院合作开展了真实场景测试。将模型部署到现有的精神科筛查系统中,作为辅助诊断工具。测试数据显示,筛查流程平均缩短至8.7分钟(原人工评估需45分钟),误诊率降低至3.2%(原系统为6.8%)。在隐私保护方面,采用联邦学习框架,允许多个医疗机构在不共享原始数据的前提下联合优化模型。

该研究的社会价值体现在三个方面:首先,为中文语境下的精神分裂症筛查提供了标准化评估工具,解决了现有研究多使用英文语料导致的迁移难题;其次,开发的轻量化推理引擎可在边缘设备(如智能手环)上运行,使筛查可及性从专业医院向社区诊所延伸;最后,建立的数字病理特征库(包含超过2000个关键病理特征点)为后续研究提供了可复用的数据基础和特征分析框架。

未来研究可沿着三个方向深化:一是构建多模态数据融合系统,整合语音、面部表情和生理信号;二是开发自适应学习算法,使模型能根据不同地区方言特征自动调整;三是建立长期随访数据库,追踪数字病理特征随病程演变的动态规律。该研究为智能精神科诊疗系统的开发奠定了重要的方法论基础和技术储备,有望推动我国精神卫生服务从"经验诊断"向"精准筛查"转型。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号