
-
生物通官微
陪你抓住生命科技
跳动的脉搏
致编辑的信,关于文章《针对儿童急性阑尾炎的新预测性临床生物学评分的开发》
《BMC Surgery》:Letter to the editor regarding the article “Development of a new predictive clinico-biological score for acute appendicitis in the pediatric population”
【字体: 大 中 小 】 时间:2026年06月02日 来源:BMC Surgery 1.8
编辑推荐:
摘要最近发布的儿童阑尾炎评分方法表现出良好的区分性能。然而,一些关键的方法学问题——包括预测因子的处理方式、可能的预测因子冗余或多共线性、缺乏校准分析、内部验证以及事后阈值选择——限制了该评分的可解释性和临床应用性。在本文中,对这些方法学问题进行了批判性和建设性的探讨,以促进更清
最近发布的儿童阑尾炎评分方法表现出良好的区分性能。然而,一些关键的方法学问题——包括预测因子的处理方式、可能的预测因子冗余或多共线性、缺乏校准分析、内部验证以及事后阈值选择——限制了该评分的可解释性和临床应用性。在本文中,对这些方法学问题进行了批判性和建设性的探讨,以促进更清晰的解释并提高方法学的透明度。
最近发布的儿童阑尾炎评分方法表现出良好的区分性能。然而,一些关键的方法学问题——包括预测因子的处理方式、可能的预测因子冗余或多共线性、缺乏校准分析、内部验证以及事后阈值选择——限制了该评分的可解释性和临床应用性。在本文中,对这些方法学问题进行了批判性和建设性的探讨,以促进更清晰的解释并提高方法学的透明度。
Youssef等人最近发表的研究[1]描述了一种用于儿童急性阑尾炎的临床生物学评分系统的开发,我们对此表示极大的兴趣。该研究致力于前瞻性地开发一种用于儿童急症的诊断工具,这一点值得肯定。然而,仍有一些方法学问题需要进一步研究。
首先,模型中包含的几个临床检查指标(如压痛、保护性反应、Rovsing征、Blumberg征和单腿跳跃试验)实际上反映了腹膜刺激的相似表现。在这种情况下,共线性可能会影响系数估计及其解释。提供关于如何评估预测因子之间关系的信息(例如,使用相关矩阵或方差膨胀因子)将有助于提高可解释性,并使读者更好地理解各个变量在模型中的作用。
其次,几个连续型预测因子(包括中性粒细胞百分比、白细胞计数、CRP和年龄)被二分类处理。尽管这种方法可能简化了临床操作,但可能会导致信息丢失和风险估计的失真[2),尤其是在阈值没有明确预先指定的情况下。如果能在连续尺度上对预测因子进行建模并考虑非线性效应,将有助于保留诊断信息并可能改善校准效果。
第三,模型构建的策略仅部分描述。只有p值小于0.2或被认为具有临床意义的变量被纳入多变量模型;然而,具体的变量选择过程、稀疏预测因子的处理方式以及保留或排除某些候选变量的原因并未详细说明。值得注意的是,许多广泛使用的阑尾炎评分方法最初都是使用传统的逻辑回归方法开发的,没有采用正式的惩罚措施或内部验证,这反映了当时可用的方法学标准。此外,似乎也没有应用任何形式的惩罚或收缩技术[3]。由于性能指标是基于用于模型构建的同一数据集计算的,因此不能排除乐观偏差的可能性。这些讨论并非旨在贬低这些研究的价值,而是为了将结果置于当前的方法学标准背景下进行评估,并支持对其结果的正确解读。
第四,模型性能评估主要关注区分能力和基于阈值的分类指标(如AUC、敏感性、特异性、预测值和比值比)。然而,对于评估预测风险与实际风险之间一致性的校准过程并未进行报告。校准斜率、校准截距或图形校准评估将有助于更全面地评估模型[4。
最后,阈值和提出的管理方案是在同一队列中得出的。事后阈值优化可能会导致对模型临床性能的高估[5]。此外,由于提出了一个临床决策算法,因此通过决策曲线分析等正式方法评估其临床实用性将提供更有力的证据[6]。同时,原研究也恰当地认识到了自身的局限性,并明确指出在临床应用前需要进一步验证。
尽管观察到了良好的区分性能,但在能够自信地将其应用于临床之前,仍需要进一步的方法学澄清和验证。