每日序贯器官衰竭评分(SOFA)-2对30天病死率的预测效度研究

《Critical Care》：Predictive validity of daily sequential organ failure assessment (SOFA)-2 score for 30-day mortality

【字体：大中小】 时间：2026年06月02日 来源：Critical Care 9.3

编辑推荐：

　　目的：序贯器官衰竭评分（sequential organ failure assessment, SOFA）近期被更新以更好地反映当代重症监护现状。本研究比较更新版SOFA-2与既往SOFA-1对入ICU首周每日30天病死率的预测效度，并按不同年龄及合并症特征

目的：序贯器官衰竭评分（sequential organ failure assessment, SOFA）近期被更新以更好地反映当代重症监护现状。本研究比较更新版SOFA-2与既往SOFA-1对入ICU首周每日30天病死率的预测效度，并按不同年龄及合并症特征亚组进行分析。方法：研究人员对2010至2021年瑞典四所ICU成人患者开展回顾性观察研究，采用受试者工作特征曲线下面积（area under the receiver operating characteristic curve, AUROC）评估入ICU第1–7天SOFA-1与SOFA-2对30天病死率的预测效度。结果：共纳入29,820例入院（平均年龄60岁，64.8%为男性，查尔森合并症指数[Charlson Comorbidity Index, CCI]中位数1）。第1–7天SOFA-1与SOFA-2再分类率为75–79%。第1天，SOFA-2预测30天病死率的AUROC为0.81（95% CI 0.80–0.81），SOFA-1为0.80（95% CI 0.79–0.81）（p＜0.001）。第2天起两评分AUROC均下降且大致相似。创伤患者（平均年龄50岁；CCI中位数0）第1天SOFA-2的AUROC为0.81（95% CI 0.79–0.83），脓毒症(sepsis)患者（平均年龄61岁；CCI中位数3）为0.72（95% CI 0.70–0.74），SOFA-1表现与之相当。结论：相比SOFA-1，SOFA-2在ICU第1天对30天病死率判别力略有提升。两评分预测效度在后续天数均降低，且在不同年龄及合并症分布亚组中表现各异，强调器官功能障碍评分具有情境依赖性。试验注册：https://doi.org/10.5281/zenodo.17651826，注册日期2025年11月19日。

论文解读：每日序贯器官衰竭评分(SOFA)-2对30天病死率(case fatality rate, 30-day mortality)的预测效度外部验证研究

一、研究背景与概述

序贯器官衰竭评分（sequential organ failure assessment, SOFA；又称sepsis-related organ failure assessment score）二十余年来被广泛用于评估危重症患者的器官功能障碍及疾病严重程度。原始SOFA-1评分源自1990年代数据，未反映当代器官支持治疗的重大进展。近期提出的SOFA-2评分基于逾三百万例当代ICU入院数据重新校准，虽在ICU病死率上与原版判别力相近，但最初验证以ICU死亡为终点——该指标受出院政策和资源限制影响，且无法捕捉ICU出院后死亡，与临床试验常采用的28天或30天全因病死率可比性差。此外，原研究未评估时间依赖校准及条件病死率，亦未探讨SOFA框架能否区分慢性与急性器官功能障碍。为此，研究人员开展这项独立外部验证研究，以30天全因病死率为主要终点，比较瑞典大型ICU队列中SOFA-2与SOFA-1在入ICU首周的每日预测表现，并分析再分类行为、评分轨迹及不同亚组（创伤、脓毒症(sepsis)、高SOFA评分）的差异。论文发表于《Critical Care》。

二、主要关键技术方法

研究人员开展回顾性队列研究，纳入2010–2021年瑞典斯德哥尔摩Karolinska大学医院四所ICU成年（≥18岁）首次入院患者，排除无有效身份证号及外院ICU转入者。从重症监护信息管理系统（Centricity Critical Care）提取生理、实验室数据计算SOFA-1与SOFA-2逐日评分，从电子病历系统（Take Care）获取ICD-10编码合并症及死亡信息。脓毒症(sepsis)按Sepsis-3标准判定。主要终点为入ICU后30天全因病死率，次要为ICU病死率。第1天缺失的器官域按正常值插补，第2–7天用末次观测向前填补（last observation carried forward, LOCF）。采用单因素logistic回归计算AUROC评估判别力，DeLong法比较AUROC及计算95% CI，Brier评分及校准斜率截距评估校准，连续净重分类改善指数（net reclassification improvement, NRI）和综合判别改善指数（integrated discrimination improvement, IDI）评估增量价值，混合效应模型评估亚评分与总分预后信息。预设亚组分析包括脓毒症患者、创伤患者及入ICU首日SOFA-1≥10的危重患者，敏感性分析采用链式方程多重插补（multiple imputation by chained equations, MICE）及完全病例分析。

三、研究结果

研究人群（Study population）

最终纳入29,820例ICU入院，平均年龄60岁（SD 16），男性64.8%，CCI中位数1（IQR 0–3），心血管病44.1%、恶性肿瘤20.6%，脓毒症(sepsis)入院占17.5%、创伤入院占10.0%。ICU病死率8.9%，30天病死率14.3%。

SOFA评分分布与再分类特征（SOFA score distributions and reclassification characteristics）

第1天SOFA-2中位数5（IQR 3–8），SOFA-1中位数6（IQR 4–9），SOFA-2整体低于SOFA-1。SOFA-2在评分≤15时对30天病死率呈更平滑单调上升趋势。第1天SOFA-1与SOFA-2完全一致占24.5%，SOFA-2＞SOFA-1占15.3%（对应30天病死率20.3%），SOFA-2＜SOFA-1占60.2%（对应12.8%）；第1–7天再分类率为75–79%。Logistic回归显示，相对评分相同者，第1天SOFA-2＞SOFA-1者30天死亡风险升高（OR 1.52，95% CI 1.33–1.73），SOFA-2＜SOFA-1者风险略降（OR 0.88，95% CI 0.77–0.99）；第2–5天SOFA-2＞SOFA-1仍关联升高死亡风险，SOFA-2＜SOFA-1不再具显著关联。

每日SOFA评分的预测效度（Predictive validity of daily SOFA scores）

第1天SOFA-2预测30天病死率AUROC=0.81（95% CI 0.80–0.81），SOFA-1=0.80（95% CI 0.79–0.81），差异具统计学意义（p＜0.001）；乐观校正Brier评分分别为0.102和0.101，校准截距≈0、斜率≈1，NRI=0.09（95% CI 0.06–0.12），IDI无显著差异。ICU病死率第1天AUROC：SOFA-2=0.84，SOFA-1=0.83（p＜0.001）。第2–7天两评分AUROC逐渐下降，Brier评分略升，判别力与校准均无统计学差异。平均SOFA-2（住院期间每日SOFA均值）预测30天病死率AUROC=0.83，高于最大SOFA-2的0.81及当日评分。第1天每升高1分SOFA-2，30天病死率OR=1.35（95% CI 1.34–1.36），ICU病死率OR=1.38（95% CI 1.36–1.39）。

SOFA-2亚评分的预测效度（Predictive validity of SOFA-2 subscores）

第1天脑（Glasgow昏迷量表, Glasgow Coma Scale, GCS）亚评分AUROC最高（0.73，95% CI 0.72–0.74），每升1分OR=1.60（95% CI 1.57–1.64）；肝脏与凝血/止血域预测效度最低。混合效应模型显示含各亚评分的模型拟合最优（AIC最低），脑亚评分为最强院内预测因子（条件OR 1.32，95% CI 1.18–1.47）。

ΔSOFA的预测效度（Predictive validity of delta SOFA）

无论以第1天为参照或以前一日为参照计算ΔSOFA，SOFA-2与SOFA-1的ΔSOFA对30天病死率AUROC均＜0.60，对ICU病死率AUROC为0.56–0.62，动态变化分值单独预测价值有限。

亚组分析（Subgroup analyses）

脓毒症(sepsis)亚组（n≈17.5%）第1–4天SOFA-2与SOFA-1预测30天病死率AUROC均较总体低（约0.72，95% CI 0.70–0.74），两版无显著差异。创伤亚组（n≈10%）AUROC较高（SOFA-2第1天0.81，95% CI 0.79–0.83），Brier评分更低。入ICU首日SOFA-1≥10亚组（n=3635，30天病死率44.7%）SOFA-2第1天AUROC=0.62（0.60–0.64），SOFA-1=0.64（0.62–0.66）（p=0.023），两版判别力均偏低。

缺失数据与器官衰竭一致性（Missing data / Organ failure agreement）

第1天肝脏域缺失率最高（27.7%），呼吸与肾脏域＞99%完整。LOCF插补以评分0为主（SOFA-1 53.7%，SOFA-2 52.7%），多重插补结果劣于主分析法但主要趋势一致。第1天SOFA-2与SOFA-1对亚评分≥2定义器官衰竭的一致率：凝血/止血＞99.9%、心血管99.4%、脑98.8%，呼吸域最低（78.4%，反映PaO₂/FiO₂阈值不同）。

四、讨论与结论翻译

关键发现：在近30,000例ICU入院观察性研究中，以30天病死率为终点，SOFA-2在ICU第1天对30天病死率的判别力较SOFA-1有微小但统计学显著的提升，但未转化为Brier评分所衡量的临床有意义的总体预测精度改善。两评分体系在入ICU后续天数预测效度均下降且彼此相似。整个ICU住院期间平均SOFA-2是30天病死率最强的单一预测因子。亚组显示SOFA-2在年轻、少合并症的创伤患者中预测准确性较高，在年龄偏大、合并症多的脓毒症患者中较低；SOFA-1≥10的重患亚组中SOFA-2 AUROC略低于SOFA-1但两版判别力均低。各器官域中亚评分以脑评分与30天病死率关联最强。

结论（原文翻译）：在本队列中，与SOFA-1相比，SOFA-2在ICU治疗初期对30天病死率提供了轻微但可测量的判别力改善。此优势在第1天后未持续，因为两评分在首周其余时间预测效度均下降且大体相似。在不同年龄及合并症模式的临床亚组中表现存在差异，表明任一评分系统的实用性取决于潜在病例组合（case mix）。

热点排行