基于无监督机器学习的感官神经性听力损失亚型识别及其可复制性评估

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Scientific Reports》：Identification of sensorineural hearing loss subtypes using unsupervised machine learning and assessment of their replicability

【字体：大中小】 时间：2026年01月21日 来源：Scientific Reports 3.9

编辑推荐：

　　本研究针对感官神经性听力损失(SNHL)亚型缺乏系统分类的问题，采用高斯混合模型(GMM)对英国10.9万份听力图进行聚类分析，成功识别9种表型并开发聚类复制性框架，为精准听力医疗奠定方法论基础。

全球有15亿人受听力损失困扰，这种最常见的感官障碍不仅严重影响生活质量，还与认知衰退和痴呆症风险密切相关。尽管人工耳蜗和基因治疗等新技术为特定患者带来希望，但大多数感官神经性听力损失(SNHL)患者的治疗方案仍停留在数十年前的水平。制约精准医疗发展的关键瓶颈在于缺乏对SNHL内在亚型的系统认识——目前仅能通过尸检确定病理特征，而循环生物标志物研究尚处于起步阶段。

作为听力评估金标准的纯音测听(PTA)蕴含着巨大潜力。早在1930年代，研究者就通过听力图形态与病变部位的关联，提出了四种年龄相关性听力损失亚型分类。然而，传统听力图-病理关联假说正受到新兴分子机制的挑战，如最新研究对纹状萎缩与平坦型听力图关联性的质疑。在此背景下，伦敦大学学院医院研究团队在《Scientific Reports》发表创新研究，通过无监督机器学习(UML)对大规模临床数据进行分析，为SNHL亚型识别提供了数据驱动的解决方案。

研究方法核心包括：从皇家国家耳鼻喉医院(RNENT)提取1981-2021年间10.9万份听力图，经严格数据清洗后，采用与麻省眼耳医院(MEE)研究相同的高斯混合模型(GMM)参数，通过贝叶斯信息准则(BIC)和赤池信息准则(AIC)确定最佳聚类数，并系统评估模型稳定性。

研究结果

人群特征分析

RNENT数据集包含54,927名患者（平均61.9岁，56%女性），较MEE队列年龄更大、听力损失更严重。70-79岁为最集中年龄段，21.9%患者超过80岁（图2）。

GMM识别听力图亚型

BIC/AIC曲线在9个聚类时达到平台期（图3），较MEE研究少1个。9种听力图表型（图4A）可分为五大“超聚类”：正常听力（亚型9）、老年性聋模式（亚型4、7）、平坦低频/下降高频模式（亚型5、6）、全频下降模式（亚型1、2、8）以及重度全频损失伴4kHz切迹（亚型3）。与MEE研究相比，本研究未发现典型噪声性听力损失(NIHL)切迹表型，但新增两种MEE未见的全频高阈值表型（表2）。

已知临床表型分析

10,580份符合Coles标准的NIHL听力图主要被聚类7吸收（图6），而4,107份反斜率听力图主要分布于聚类2和9（图7）。双耳对称性分析显示，正常听力（聚类9）、重度损失（聚类3）等表型具有高度双侧一致性（图8）。

复制性分析

除正常听力组（Jaccard指数0.77）外，其他聚类在自助采样中稳定性较差（0.59-0.69），而不同初始化参数下稳定性较高（图9）。样本量需达到原数据集50%以上才能获得0.8以上的Jaccard指数（图10）。

讨论与意义

研究首次在英国人群中发现9种SNHL亚型，部分验证了美国研究的发现。人群差异（年龄、性别、疾病严重度）和方法学选择（随机vs首次听力图）导致表型差异，凸显模型对数据集特性的敏感性。提出的聚类复制性框架（图11）为健康数据聚类研究设立新标准，强调内部效度评估（自助采样/参数初始化）和跨研究可比性的重要性。

尽管存在仅依赖听力图的局限性，且未捕获噪声性听力损失等经典表型，本研究通过大规模数据分析和严谨的复制性验证，为SNHL精准分型奠定基础。研究者呼吁建立专用于听力学的公共数据集，促进跨机构合作，推动机器学习在听力医疗中的安全转化。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号