基于机器学习模型整合全面临床特征预测原发性醛固酮增多症亚型

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Scientific Reports》：Machine learning-based prediction of primary aldosteronism subtype using comprehensive clinical features

【字体：大中小】 时间：2026年02月22日 来源：Scientific Reports 3.9

编辑推荐：

　　为解决原发性醛固酮增多症(PA)单侧与双侧亚型精准分型诊断的难题，研究人员开展了基于多类别临床特征的机器学习预测模型研究。研究表明，随机森林模型预测效能最佳，负荷试验相关特征贡献最大，为PA的临床精准分型提供了高效工具。

在医学领域，原发性醛固酮增多症（Primary aldosteronism, PA）是导致继发性高血压最常见的内分泌原因。它并非一种单一疾病，主要分为两种亚型：由单侧肾上腺病变（如腺瘤或增生）引起的单侧PA（uPA），以及由双侧肾上腺病变引起的双侧PA（bPA）。这两种亚型的治疗策略截然不同：单侧PA患者通常可以通过手术切除患侧肾上腺获得治愈或显著改善，而双侧PA患者则首选终身药物治疗。因此，对PA患者进行准确的亚型分型，是决定治疗方案、改善患者预后的关键第一步。

目前，肾上腺静脉采血（Adrenal venous sampling, AVS）被认为是区分PA亚型的“金标准”。然而，AVS是一种侵入性操作，技术要求高，并非所有医疗中心都能常规开展，且患者需要承担一定的风险和不适。于是，临床上一直在寻找能够替代或辅助AVS的无创或微创诊断方法。尽管此前已有一些基于生化指标的诊断模型被提出，但它们多依赖于有限的指标，预测性能参差不齐，且对于何种机器学习算法与哪些临床特征的组合能达成最优预测效果，仍缺乏明确的共识。这好比医生手中有一堆零散的“拼图”（各种检查结果），却不知道哪几块拼图组合在一起，以及如何组合，才能最清晰地拼出疾病亚型的“全貌”。为了解决这一临床痛点，明确最优的预测模型与核心特征组合，一个研究团队展开了深入的探索。

研究人员为回答上述问题，开展了一项回顾性研究，并最终将成果发表在《Scientific Reports》上。该研究纳入了来自单一医疗中心的274名成功接受AVS确诊的PA患者。他们系统地收集了多达196项内分泌相关特征，并将其科学地划分为四大类别：A类（PA相关特征，如血钾、基础醛固酮水平等）、B类（各种动态负荷试验结果，如卡托普利抑制试验后的指标）、C类（一般生化指标）和D类（尿类固醇代谢谱）。研究团队运用了包括随机森林（Random Forest, RF）、支持向量机、逻辑回归等在内的五种主流机器学习算法，构建预测模型，旨在评估不同模型的预测性能，并深入剖析各类别、各单项特征对模型预测的贡献度。

本研究运用的几个主要关键技术方法包括：首先，研究构建了一个包含274例经肾上腺静脉采血确诊的原发性醛固酮增多症患者的回顾性队列。其次，全面收集并系统分类了196项临床与生化特征。第三，应用了包括随机森林在内的五种机器学习算法进行模型构建与性能比较。最后，采用了特征重要性分析等方法，评估了不同特征类别及单项特征对模型预测的贡献。

研究结果

机器学习模型的预测性能比较

研究团队应用五种不同的机器学习算法构建了PA亚型预测模型。结果显示，随机森林模型在所有模型中表现最为出色，其预测准确率达到了91.3%，展现了卓越的区分单侧与双侧PA的能力。其他模型的性能则相对逊色，这突显了随机森林算法在处理此类复杂、高维临床数据时的优势。

特征及特征类别的预测贡献分析

为了揭示哪些信息对判断亚型最为关键，研究人员对最优模型——随机森林模型进行了深入的贡献度分析。

1.
最具预测力的单项特征：在所有196项特征中，贡献度最高的单项特征是卡托普利挑战试验后90分钟的血浆醛固酮浓度（CCT90-PAC）。这一发现强调了动态功能试验（特别是药物抑制后醛固酮的反应性）在亚型鉴别中的核心价值。
2.
特征类别的整体贡献：研究进一步评估了四大特征类别（A: PA相关特征；B: 挑战试验；C: 一般生化；D: 尿类固醇谱）对模型的整体贡献。结果显示，B类（挑战试验） 的贡献度最大，远超其他类别。这表明反映肾上腺皮质醛固酮分泌自主性和功能状态的动态试验指标，是区分亚型的最有力信息集。贡献度排序依次为B类 > A类 > D类 > C类。
3.
特征组合的效能提升：研究发现，虽然B类特征贡献最大，但联合使用A类（PA核心特征）和B类（挑战试验）特征，能够进一步提升模型的预测性能，达到最佳的预测效果。这说明结合静态基线指标与动态功能反应指标，能提供更全面、更可靠的鉴别依据。

结论与讨论

本研究通过系统性地整合多维度临床数据并应用先进的机器学习算法，成功构建了高效的原发性醛固酮增多症亚型预测模型。核心结论指出，随机森林模型是实现高精度预测的最佳算法。更重要的是，研究明确了不同临床信息的价值层级：各种挑战试验（特别是卡托普利抑制试验）相关的特征是预测亚型的最关键因素，其贡献度显著高于传统的基线生化指标或尿类固醇谱。

这项研究的意义重大。首先，它为临床提供了一种潜在的、基于机器学习的辅助诊断工具。在AVS不可及或存在风险时，该模型能够利用常规可获得的临床检查数据，为医生提供高可信度的亚型预测参考，有助于更精准地制定治疗决策（手术或药物），避免不必要的侵入性检查或误治。其次，研究通过特征重要性分析，揭示了“挑战试验”在病理生理鉴别中的核心地位，这深化了医学界对两种PA亚型内在差异的理解，将研究焦点引向了最能体现醛固酮分泌自主性的功能学指标。最后，研究展示了整合多类别特征与合适机器学习算法的策略有效性，为其他内分泌疾病的精准分型研究提供了可借鉴的方法学框架。总之，该研究朝着实现PA无创精准分型的目标迈出了坚实的一步，具有明确的临床转化前景和科学价值。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号