基于混合课程学习与YOLOv11实现数据高效肺部结节检测

《Diagnostics》:Hybrid Curriculum Learning for Data-Efficient Lung Nodule Detection with YOLOv11 Yi Luo, Yike Guo, Hamed Hooshangnejad, Xue Feng, Quan Chen, Zongwei Zhou, Yaxi Chen, Yipeng Hu, Rui Zhang and Kai Ding

【字体: 时间:2026年05月11日 来源:Diagnostics 3.3

编辑推荐:

  摘要 背景/目标:衰弱在拉丁美洲与加勒比地区很常见,但基于常规临床数据的已验证低成本筛查工具仍然有限。研究人员开发了用于老年人衰弱筛查的基准可解释机器学习模型,并评估了SARC-F问卷在基本血流动力学和人体测量指标之外的增量价值。方法:在这项横断面试点诊断建模

  
摘要 背景/目标:衰弱在拉丁美洲与加勒比地区很常见,但基于常规临床数据的已验证低成本筛查工具仍然有限。研究人员开发了用于老年人衰弱筛查的基准可解释机器学习模型,并评估了SARC-F问卷在基本血流动力学和人体测量指标之外的增量价值。方法:在这项横断面试点诊断建模研究中,100名来自三级医疗中心的老年人(平均年龄69.8 ± 6.8岁;73%女性)通过FRAIL量表进行分类。主要终点是衰弱与非衰弱。通过分层5折交叉验证评估了三个逻辑回归模型:模型A(年龄、性别、身体质量指数(BMI)、营养状况、收缩压和舒张压)、模型B(平均动脉压和脉压)和模型C(模型A加上SARC-F)。决策树和随机森林作为次要比较器。结果:SARC-F是唯一与衰弱类别显著相关的变量(p< 0.001)。模型A和模型B显示出接近随机的区分能力(两者曲线下面积(AUC) = 0.546),而模型C的AUC达到0.921(95%置信区间(CI): 0.864–0.966),灵敏度为0.812,特异度为0.846,F1分数为0.821。单独使用SARC-F的AUC为0.942。在模型C中,SARC-F是主要预测因子(标准化优势比(OR) 12.52,95% CI: 8.90–23.91)。结论:单独的常规血流动力学和人体测量变量不足以区分衰弱。SARC-F捕获了大部分区分信号,支持其在资源有限的老年医学环境中用于衰弱筛查。虽然逻辑回归流程是透明且计算成本低的,但仍需进行外部的、前瞻性的验证。
一、 研究背景、问题与目的
衰弱(Frailty)是一种动态的、多维度的老年综合征,表现为多器官系统生理缺陷的渐进性累积,导致储备能力下降,对内、外部压力源的脆弱性增加。在拉丁美洲与加勒比地区,其流行病学负担尤为严重,但该地区系统性衰弱筛查项目仍不完善。目前,大多数经过验证的风险分层工具(如握力计、步行测试、综合老年评估)在资源有限的环境下难以获取。尽管FRAIL量表和SARC-F问卷是实用的替代工具,但基于常规临床数据(如血流动力学、人体测量指标)的可解释机器学习模型在该地区的研究和应用仍存在空白。现有机器学习研究存在三方面局限:缺乏针对中美洲人群的基准研究;未量化已验证的简短功能问卷(如SARC-F)相对于常规临床数据的增量预测价值;对模型可解释性的关注不足,而这对于临床采纳至关重要。
本研究旨在解决这些不足,通过在洪都拉斯一家三级医院的老年门诊患者中开发并对比可解释机器学习模型,用于二元衰弱筛查。研究的主要目标是量化SARC-F在基本血流动力学和人体测量数据之外的增量预测贡献。次要目标是识别增强临床模型中衰弱结果的主要预测因素,并探索三类有序分层作为探索性终点。
本研究论文发表于《Diagnostics》期刊。
二、 关键技术方法概述
本研究是一项横断面试点诊断建模研究。研究对象为洪都拉斯圣费利佩总医院老年门诊连续就诊的100名≥60岁老年人,排除了存在认知障碍、急性住院等情况的个体。主要结局变量是基于FRAIL量表的衰弱状态(Frail vs. Non-frail)。预测变量包括人口学特征、人体测量学指标、血流动力学指标(收缩压、舒张压、平均动脉压、脉压)、营养状况以及SARC-F问卷得分。研究预先构建了三个相互排除的逻辑回归模型特征集:模型A(常规临床变量,不含SARC-F)、模型B(血流动力学指数,不含SARC-F)、模型C(模型A加SARC-F),并以单变量SARC-F模型作为基准比较。模型评估通过分层5折交叉验证进行,使用包括曲线下面积、灵敏度、特异度、F1分数在内的多种性能指标。研究还采用了决策树和随机森林作为次要比较器。为增强模型解释性,研究人员计算了模型C中各特征的标准化逻辑回归系数和优势比。整个分析流程使用了Python 3.12及相关数据科学库。
三、 研究结果
3.1. 队列特征与衰弱分布
在排除一名BMI缺失的参与者后,分析样本为99人。队列平均年龄为69.8 ± 6.8岁,女性占73%。衰弱分类结果为衰弱48人,衰弱前期35人,非衰弱17人。在二元分析中,非衰弱(含衰弱前期)与衰弱分别有52人和48人。
3.2. 按衰弱状态分组的比较
SARC-F是唯一在不同衰弱组间(非衰弱、衰弱前期、衰弱)存在显著差异的连续变量。营养状况也达到统计学显著性,但其区分效用因该变量(93%为不足)的近零方差而受到严重限制。年龄、BMI、血压指标、性别分布在组间均无统计学显著差异。如图所示,SARC-F分数中位数在不同组间呈明显分层,其中衰弱组显著高于非衰弱组。
3.3. 预测模型性能
交叉验证结果显示,模型A和模型B的AUC均为0.546,接近随机水平,表明仅靠常规临床变量无法有效区分衰弱。模型C(临床变量+SARC-F)的AUC为0.921,显著优于前两者。单独使用SARC-F的AUC更是高达0.942。这表明SARC-F是衰弱分类的关键预测因子。决策树和随机森林在增强特征集下的性能与逻辑回归模型相近,表明模型性能差异主要由特征驱动,而非特定分类器。敏感性分析排除了极端血压值的影响,证实了上述结果的稳健性。在探索性的三分类(非衰弱/衰弱前期/衰弱)分析中,模型C的宏平均AUC为0.782,远低于其二元分类性能,表明在现有特征和样本量下,对衰弱前期状态的区分更具挑战性。
3.4. 特征重要性与优势比分析
在模型C中,SARC-F是最具影响力的预测因子,其标准化优势比为12.52(95% CI: 8.90–23.91)。所有其他预测因子(年龄、性别、BMI、营养状况、收缩压、舒张压)的优势比置信区间均横跨1,表明在模型中纳入SARC-F后,这些变量对衰弱结局没有显著的独立贡献。
四、 讨论与结论总结
研究发现,单独依赖常规血流动力学和人体测量变量无法有效区分衰弱,而加入SARC-F后,模型性能显著提升,达到临床可用水平。这表明自我报告的功能障碍捕捉了常规生命体征或体型测量无法充分代表的脆弱性领域。SARC-F在模型中作为占主导地位的预测因素,证实了其在资源有限的老年实践中作为一线筛查工具的实用性。
模型性能的差异具有生物学合理性,因为衰弱与生理储备的功能性和肌肉骨骼指标更相关,而非血压或BMI。将血流动力学指数替换为原始血压值并未带来额外预测收益。SARC-F单独模型的优异表现表明,在资源极其有限的环境中,单用SARC-F进行筛查是可行的。而模型C在SARC-F不可用、需要结合患者生理背景,或需要透明系数进行决策支持时,具有补充价值。从方法学角度看,逻辑回归、决策树和随机森林在相同特征集上性能相近,支持将可解释性强的逻辑回归作为临床部署的首选算法。
从实施角度来看,研究结果支持在洪都拉斯等资源有限环境中建立一个务实的两步筛查路径:第一步,使用SARC-F进行零成本、无需设备的初筛;第二步,对筛查阳性者进行全面的FRAIL量表评估和营养评估。逻辑回归模型可简化为纸质的评分规则,适应缺乏电子健康记录的环境。
研究也指出了其多项局限性,包括样本量小、单中心横断面设计、女性比例过高、营养状况变量变异度低、SARC-F与FRAIL量表在内容上有概念重叠(可能导致性能高估)、缺乏外部验证等。未来研究需要在更大规模的社区代表性样本中进行,纳入更多功能生物标志物,在拉丁美洲和加勒比地区进行多中心外部验证,并探索联邦学习等隐私保护技术。
研究结论
基于常规血流动力学和人体测量变量的可解释机器学习模型无法充分区分本临床环境中的老年衰弱。SARC-F表现为主要的筛查信号:将其纳入逻辑回归模型,可将近于随机的区分能力(AUC ≈ 0.55;95% CI: 0.43–0.66)转变为具有临床意义的性能(AUC = 0.921;95% CI: 0.864–0.966),而单独使用SARC-F作为预测因子则达到AUC = 0.941。一旦模型中纳入SARC-F,所有其他常规临床变量均未提供具有统计学意义的独立信息。这些发现支持在拉丁美洲和加勒比地区资源有限的老年医学环境中,将SARC-F与常规临床测量相结合,作为一种低成本、可解释的筛查方法。本文描述的可解释逻辑回归流程具有透明、可重复、计算成本低的特点,代表了一种透明、可重复且计算成本低廉的分析框架。在独立且地理多样化的队列(包括社区和初级保健环境)中进行严格的前瞻性外部验证之后,并考虑到样本量小、单中心、缺乏纵向结局数据等关键局限性,该框架可能成为资源匮乏地区老年人衰弱风险分层可扩展应用的可靠基础。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号