综述：非使用呼吸机的医院获得性肺炎诊断流程——一项系统评价

《International Journal of Infectious Diseases》：Non-ventilator hospital-acquired pneumonia diagnostic procedures – A systematic review

【字体：大中小】 时间：2026年05月10日 来源：International Journal of Infectious Diseases 4.3

编辑推荐：

　　乔恩·安德斯·费特 | 拉尔斯·赫格尔伦德 | 卡尔·埃里克·穆勒挪威卑尔根大学医学院临床科学系，卑尔根综合诊断管理集群 **摘要** **目标** 非 ventilator 相关的医院获得性肺炎（NV-HAP）是一种重要的医院获得性感染，具有较高的发病率和死

　　乔恩·安德斯·费特 | 拉尔斯·赫格尔伦德 | 卡尔·埃里克·穆勒
挪威卑尔根大学医学院临床科学系，卑尔根综合诊断管理集群

**摘要**
**目标**
非 ventilator 相关的医院获得性肺炎（NV-HAP）是一种重要的医院获得性感染，具有较高的发病率和死亡率。本综述旨在评估当前用于诊断 NV-HAP 的方法的有效性、可接受性和准确性。

**方法**
该综述的注册号为 CRD42023375750，在国际系统性回顾注册库（International Prospective Register of Systematic Reviews）中发布。研究人员使用与 NV-HAP 诊断相关的术语，对 PubMed、Cochrane Library、CINAHL、EMBASE、Web of Science 和灰色文献进行了全面搜索。符合纳入标准的研究通过修改后的 Critical Appraisal Skills Programme 检查表进行评估。

**结果**
在筛选的 26,780 篇记录中，有 317 篇进行了全文审查，其中 8 篇符合纳入标准。两项研究评估了血液中的生物标志物，并根据受试者工作特征分析确定了降钙素原（procalcitonin）的临界值。四项研究评估了采样方法，结果显示支气管肺泡灌洗（bronchoalveolar lavage, BAL）相比咳出痰液和气管插管抽吸（endotracheal aspirates）具有更好的性能。两项研究评估了分子诊断方法，发现其检测率更高，且与传统培养方法结果一致性强。但由于研究间的异质性较大，无法进行定量综合分析。

**结论**
NV-HAP 的研究仍不够充分，现有的诊断证据有限且不一致。迫切需要标准化、经过验证的诊断标准，以加强未来的研究，提高研究间的可比性，并提高临床实践中的诊断可靠性。

**背景**
医院获得性肺炎（HAP）通常分为非 ventilator 相关的医院获得性肺炎（NV-HAP）和 ventilator 相关的肺炎（VAP）。VAP 发生在需要接受侵袭性机械通气的患者中，而 NV-HAP 发生在未接受机械通气的患者中，这些患者住院时间至少为 48 小时。尽管两者有相似之处，但它们被视为不同的诊断实体，具有不同的发病率和治疗/预防建议 [1]。
HAP 对患者和医疗系统都带来了重大负担。它是导致住院时间延长的常见原因 [2,3]，也是医院获得性感染（HAIs）中主要的死亡原因之一 [4, [5], [6], [7], [8], [9]]。据估计，NV-HAP 占医院获得性肺炎的 60-80% [10]。然而，由于诊断标准和程序不明确，NV-HAP 在研究和监测中受到的关注较少 [11]。与其他呼吸道感染一样，NV-HAP 的临床表现多种多样，常与其他疾病重叠，从而难以准确诊断。诊断 NV-HAP 需依赖临床症状和影像学表现。最常见的临床标准是美国胸科学会（American Thoracic Society）和美国传染病学会（Infectious Diseases Society of America, ATS/IDSA）2016 年指南中的标准 [1]。
值得注意的是，专门针对 NV-HAP 的研究非常少，已发表的研究中经常将 NV-HAP 和 VAP 组合进行分析 [12,13]。缺乏专门针对 NV-HAP 的研究导致其在流行病学、诊断方法和结果方面的不确定性。
NV-HAP 的诊断存在不确定性，因为没有单一的金标准检测方法：临床症状不具特异性，而影像学确认受限于床边胸部 X 光片的敏感性较低 [14]。不同机构和研究之间的监测定义和病例发现方法也各不相同，这影响了发病率估计的准确性，并阻碍了组间比较 [15]。由于诊断成像、微生物学和临床特征经常不一致，临床医生通常依赖实用但不完善的诊断算法，这可能导致 NV-HAP 的漏诊或过度诊断。
NV-HAP 的病因难以确定：咳出痰液和血液中的培养结果阳性率较低，且在非 ventilated 患者中很少进行下呼吸道采样，因此致病菌谱不完全清楚。许多情况下甚至不进行呼吸道采样 [14]。这种病因学上的不确定性导致广泛使用经验性抗生素，从而增加了管理难度。
鉴于 NV-HAP 的高发病率、高死亡率和对医疗系统的巨大负担，系统评估其诊断方法至关重要，以发现证据缺口，指导临床实践，并确定未来研究的重点。

**方法**
本综述的注册号为 CRD42023375750，在 PROSPERO（国际系统性回顾注册库）中发布。由于研究间的异质性较大，综述采用叙述性综合方式撰写。评审过程遵循 2020 年系统回顾和荟萃分析优先报告项目（PRISMA）指南 [16]。PRISMA 流程图和检查表见补充材料（补充图 1 和补充文件 2）。

**搜索策略**
文献搜索涵盖 2025 年 2 月 18 日之前的所有文章，这些文章索引于 PubMed、Cochrane Library、CINAHL、EMBASE 和 Web of Science 数据库。灰色文献的搜索范围也是截至 2025 年 2 月 18 日。非英语文献进行了翻译和评估。搜索策略的详细信息见补充文件 1。

**综述策略**
所有记录导入澳大利亚墨尔本的 Covidence 评审管理工具，由主要作者（JAF）和最后作者（KEM）独立审核。如有分歧，通过共识解决。首先进行标题和摘要审核，随后根据纳入/排除标准进行全文审核。纳入的研究需满足以下条件：（1）成年患者（年龄≥18 岁）住院时间至少 48 小时；（2）疑似 NV-HAP，符合主要研究的定义；（3）将某种 NV-HAP 诊断工具与其他诊断工具或方法（如体格检查、生物标志物、影像学检查、微生物培养等）进行比较。病例报告、会议论文、指南和综述未被纳入。对于包含合并数据的文献，或数据是否专门针对 NV-HAP 不明确的文献，通过电子邮件联系相应作者。

**质量评估和数据提取**
两名 reviewers 独立对所有论文的质量和数据提取进行评估，如有分歧通过共识解决。最初计划使用 QUADAS-2（诊断准确性研究的质量评估工具）进行方法学质量评估，但由于纳入研究数量有限且研究设计、人群、指标检测和参考标准存在较大异质性，无法进行定量荟萃分析，因此采用叙述性综合方法。为此，我们使用了改编自 CASP（Critical Appraisal Skills Programme）的检查表来评估研究质量和相关性。CASP 检查表是一种公认的质量或偏倚风险评估工具 [18,19]。我们的评估检查表包含了 CASP 检查表中的 8 个问题，但 C 部分的问题（涉及结果对当地临床实践的实用性）不在我们的评估范围内。研究若符合质量标准，则每题得 1 分，最高分为 8 分。

作者根据 PROSPERO 协议制定了标准化的数据提取表格，记录了参与者数量、年龄和性别、样本类型、指标检测、参考检测、检测临界值及结果。此外，还记录了研究的目的、结果和结论。

**结果**
去除重复项后，共识别出 26,780 篇文献。非英语文献由熟练的翻译人员或 Google 翻译成英语。根据标题和摘要筛查，排除了 26,463 篇文献；进一步通过全文评估排除了 309 篇文献：90 篇缺乏新数据，5 篇研究环境不符，32 篇结果不准确，1 篇未经过同行评审，47 篇研究设计不合理，48 篇为会议摘要，65 篇涉及错误的患者人群，21 篇为 VAP 和 NV-HAP 混合队列，无法获取 NV-HAP 相关数据。最终有 8 篇文献符合质量评估要求（见补充图 1），被纳入综述。
其中 6 篇为前瞻性队列研究 [23], [24], [25], [26], [27], [28]，2 篇为病例对照研究 [29,30]，没有随机对照试验。大多数研究在欧洲开展（29, [30]），德国 2 篇 [29,30]，西班牙 2 篇 [25,26]，法国 1 篇 [27]，丹麦 1 篇 [24]；另有 2 篇分别在埃及 [23] 和中国 [28] 进行。样本量中位数为 104 例，范围从 76 到 322 例。
两项研究仅纳入术后患者 [23,27]，1 项研究仅在重症监护病房进行 [26]，其余 5 项研究涵盖整个医院人群 [24,29,25,30,28]。
我们联系了 21 项包含合并数据的文献的作者，请求提供 NV-HAP 相关数据，但回复不多，且部分作者无法提供所需数据。

**质量评估**
质量评估由两名 reviewers 独立完成，如有分歧通过共识解决。最初计划使用 QUADAS-2 进行质量评估，但由于研究设计和参考标准的异质性较大，无法进行定量荟萃分析，因此采用 CASP 检查表进行评估。CASP 检查表包含 8 个问题，C 部分的问题不在评估范围内。研究若满足评估标准，则每题得 1 分，最高分为 8 分。

**结论**
目前尚无 NV-HAP 的“金标准”检测方法，因此所有论文对指标检测的准确性估计存在偏差，这是比较性诊断准确性研究的常见问题 [31]。质量评估显示，5 篇论文的检测结果可能受到参考标准的影响（无证据表明检测过程具有随机性或独立性）。
所有研究中均明确了 NV-HAP 的定义，所有患者均接受了指标检测和参考标准，因此不存在验证偏差。不过部分论文的结果可靠性较低（29,26）。Dalhoff 等人 [29] 报告了敏感性数据，但未提供特异性数据。Ranzani 等人 [26] 仅比较了不同气道采样的阳性率，且各技术的阳性样本数量较少，未报告阴性一致性数据。
可纳入的研究数量较少，无法进行定量分析。定量分析不可行的原因见补充表 2。

**血液生物标志物研究**
两项研究评估了血液中的生物标志物：一项研究在术后腹部手术患者中检测 PCT 和 CRP [23]，发现它们是预测术后 HAP 的可靠指标；另一项研究在多种肺部疾病和健康对照组中检测 PCT [30]，发现 HAP 与健康对照组存在显著差异，并确定了区分 HAP 和其他肺部疾病的临界值。检测方法和结果详见表 1A，目的、结果和结论见表 2A。两项研究均获得高分（见补充表 1），但其中一项研究未明确指标检测是否在知晓参考标准结果的情况下进行，存在解释偏差风险 [23]。

**结论**
总体而言，所有论文在指标检测的准确性估计上存在偏差。研究间的异质性较大，无法进行定量分析。作者没有明确说明在进行指数测试时是否不知道参考标准。特定人群（术后腹部手术患者）。

- 敏感性 = 84%
- 特异性 = 72%
- 切断值 1.4 ng/mL
- CRP 术后第2天
- AUC 0.716（CI 0.658-0.874）
- 敏感性 = 70%
- 特异性 = 60%
- 切断值 155 mg/L
- Polzin等人 [30] 2003年德国 129 未披露未披露

**血液**
- 血清PCT
(1) 入院时间 > 48小时，(2) 症状和临床体征（例如体温 > 38.0°C 或 < 36.1°C，听诊时有啰音和脓性痰液），(3) 典型的胸部X光片发现，(4) 白细胞计数 > 10×10^9 cells/L 或白细胞计数 < 4×10^9 cells/L
- 预先确定的：HAP的PCT值
- CASP检查表得分：8/8
- 临界值 0.5 ng/mL
- 中位数（CI）0.27-0.62
- 总体方法学良好。患者特征报告有限（仅年龄、性别和APACHE-II评分）。

**最优：**
- HAP与健康对照组之间存在显著差异（p<0.01）
- 通过AUC-ROC确定
- 区分肺炎与其他感染性和非感染性肺病的临界值：0.245 ng/mL
- 敏感性 = 58%
- 特异性 = 91%

**B - 采样技术**
- Dalhoff等人 [29] 1990年德国 103
- IC：57.7（20-79） IC：60%
- 气道分泌物
(1) 肺炎的临床表现，(2) 体温 > 38°C，(3) 白细胞计数升高和/或CRP > 6 mg/L，(4) X光片呈浸润灶
- 半定量生长 10^2 CFU/mL 或更高
- 支气管肺泡灌洗（敏感性）：
CASP检查表得分：5/8
- ICM：44.9（29-65） ICM：60.9%
- 免疫功能正常组 = 77.5%
- 不清楚在进行指数测试时是否不知道参考标准。结果报告不完全（仅敏感性）。阳性BAL/PSB的阈值较低（>102 CFU/mL）。

- C：51.3（19-78） C：67.5%
- 免疫功能低下组 = 85%
- 平均值（范围）
- 保护样本刷（敏感性）：
免疫功能正常组 = 32% 免疫功能低下组 = 24%

**Dorca等人 [25] 1995年西班牙 97**
- 平均值 ± 标准差（范围）66%
- 注射生理盐水并从肺部抽取
(1) 入院时间 > 72小时，(2) 新出现的肺部X光片阴影，(3) 至少符合以下两项：体温 > 38.5°C，白细胞计数 > 10,000/mm3，以及脓性分泌物
- 未报告
- 敏感性 = 60.9%（CI 46-76）
- CASP检查表得分：7/8
- 特异性 = 100%（CI 100-100）
- 总体方法学良好。不清楚在进行指数测试时是否不知道参考标准。操作依赖于操作者。

**PPV = 100%（CI 100-100） NPV = 34.1%（18-47）**

**Ranzani等人 [26] 2019年西班牙 200**
- 平均值 ± 标准差 69%
- 气道分泌物
- BAL
(1) 新出现或进展中的肺部浸润灶，(2) 符合以下至少两项：体温 > 38°C 或 < 36°C，白细胞计数 > 12,000/mm3 或白细胞计数 < 4,000/mm3，或脓性呼吸道分泌物，(3) HAP定义为住院48小时后未接受侵入性机械通气（iMV）的患者
- 其他气道样本的阳性一致性
- CASP检查表得分：5/8
- 仅ICU患者。结果报告不完全（仅阳性百分比一致性，可计算敏感性）。不清楚在进行指数测试时是否不知道参考标准。

**FBAS**
- 痰 = 85%
- BAL：>10^4 cfu/mL 或任何计数（如果患者正在接受新的全身抗生素治疗）
- 气管内抽吸 = 80%
- FBAS = 81%
- 支气管肺泡灌洗 = 91%
- 敏感性
痰 = 34%（CI 15-54）气管内抽吸 = 43%（CI 24-62）FBAS = 50%（CI 36-64）支气管肺泡灌洗 = 31%（9-52）

**Stephan等人 [27] 2016年法国 105**
- NV-ICUAP：65±16（平均值 ± 标准差）72%
- 气道分泌物
- FOB-EA
(1) 新出现或进展中的肺部浸润灶，(2) 符合以下至少两项：体温 > 38°C 或 < 36°C，白细胞计数 > 12,000/mm3 或白细胞计数 < 4,000/mm3，或脓性呼吸道分泌物，(3) HAP定义为住院48小时后未接受侵入性机械通气（iMV）的患者
- FOB-EA的细菌培养：
CASP检查表得分：8/8
- 敏感性 = 82%（CI 69-91）
- 总体方法学良好。特定人群（ICU中的术后心胸外科手术患者）。
- 修改后的CPIS评分
- FOB-EA：≥10^5 cfu/mL
- 特异性 = 100%（CI 89-100）
- 无肺炎：63±17（平均值 ± 标准差）
- PPV = 100%（CI 89-100）
- 痰：≥10^7 cfu/mL
- NPV = 82%（CI 69-91）
- 修改后的CPIS >6
- 敏感性 = 82%（CI 56-95）特异性 = 94%（68-100）PPV 93%（CI 66-100）NPV 83%（CI 58-95）
- 修改后的CPISS

**C - 分子诊断**
- Andrews等人 [24] 2022年丹麦 322
- 明确肺炎：
(1) 新出现的肺部浸润灶，(2) 临床证据表明浸润灶具有感染性，包括新发发热、脓性痰液、白细胞计数升高和氧气饱和度下降。“明确肺炎”根据上述标准分类，“可能肺炎”定义为没有肺部浸润灶但符合肺炎其他标准的患者。两者一起被归类为“肺炎”。
- mPCR：>10^4 copies/mL
- 分析性能
- CASP检查表得分：7/8
- 培养
- mPCR：0.96 pathogens/sample
- 总体方法学良好。不清楚在进行指数测试时是否不知道参考标准。

**表2. 目的、结果和结论**此外，由于感染可能会损害患者的认知能力，因此获得知情同意可能会很困难。方法学上的局限性也阻碍了研究的进展，特别是缺乏标准化的参考定义、诊断阈值和性能指标的报告。这反过来又复杂化了研究设计、降低了研究之间的可比性，并抑制了大规模多中心研究的发展。这些因素共同导致了针对NV-HAP（呼吸机相关肺炎）的诊断准确性研究极为匮乏。

**研究特征**
纳入的研究在设计、患者群体和临床环境方面存在显著差异，大多数为单中心研究。样本量范围广泛，研究对象来自不同的环境，包括重症监护病房、术后病房和普通医院病房。这些发现不仅反映了NV-HAP发生的多样化的临床背景，也限制了众多研究的普遍适用性。

**证据质量**
整体研究质量参差不齐。尽管有三项研究获得了最高分，但有两项研究的得分明显较低，这反映了报告和方法学严谨性的不足（见补充表1）。由于缺乏诊断NV-HAP的金标准，所有诊断准确性的估计都存在偏差，也影响了测试性能的解释。在五项研究中，由于作者未报告指数测试是否独立于参考标准进行解释，因此可能存在偏见风险。相比之下，所有参与者同时接受了指数测试和参考标准，从而避免了验证偏差。

**临床标准**
纳入研究中用于诊断肺炎的标准相对相似，包括必须进行的放射学检查以及临床标准（如发热、白细胞计数、脓性呼吸道分泌物和氧合降低）。由于大多数肺部放射学检查使用的是常规X光片，这可能导致部分患者被排除在外，因为与胸部CT相比，X光片在诊断肺炎方面的敏感性较低[32,33]。缺乏诊断的金标准是研究呼吸道感染诊断方法时普遍存在的问题。令我们惊讶的是，没有找到评估放射学方法的研究。

**生物标志物**
有两项研究探讨了PCT（Procalcitonin）和CRP（C-reactive protein）的实用性。一项来自埃及的研究指出，在术后第二天监测PCT和CRP可能有助于诊断NV-HAP [23]。PCT的敏感性为84%，特异性为72%，但临界值非常高（1.4 ng/mL），且仅适用于特定的患者群体（术后腹部手术患者）。这一结果可能无法推广到其他患者群体。在德国的一项研究中，PCT也显示出一定的潜力作为NV-HAP的生物标志物，其水平显著高于对照组，但在ROC分析后建议将临界值降至0.245 ng/mL，此时该标志物的敏感性为58%，特异性为91%，可用于区分肺炎与其他感染性和非感染性肺部疾病[30]。具有高特异性但低敏感性的生物标志物在临床应用中具有独特性：阳性结果可靠地指示真正的疾病，有助于减少过度治疗和不必要的抗生素使用；然而，低敏感性降低了其筛查或早期诊断的价值。因此，这类标志物最好与其他诊断方法结合使用。目前指南强烈建议不要将降钙素作为诊断HAP（Hospital-acquired pneumonia）、VAP（Ventricular-acquired pneumonia）或CAP（Community-acquired pneumonia）的辅助手段[1,33]。此外，降钙素检测的成本比白细胞计数或CRP等传统生物标志物更高，在资源有限或小型医疗机构中可能无法实施。

**气道采样**
有四项研究关注采样技术。三项研究探讨了通过支气管镜进行下呼吸道采样。支气管肺泡灌洗（BAL）、支气管镜引导下的ETA（Endotracheal aspiration）和PSB（Pleural secretions aspiration）属于此类方法。总体上，BAL的敏感性高于其他采样方法，但各研究间的可比性受样本量小和微生物结果解释差异的影响较大。两项研究未报告细菌培养的临界值[24,29]。在那些报告临界值的研究中，支气管肺泡灌洗的临界值各不相同（>10? cfu/mL、>10? cfu/mL或新抗生素治疗后的任何生长、>102 cfu/mL [29,26,27]），这可能影响对诊断性能的评估。支气管镜检查是一种有并发症风险的侵入性操作，需要专业医务人员操作。只有一项研究报道了相关并发症，发现36.5%的患者出现呼吸系统并发症，其中13.5%需要持续低氧治疗，14.4%需要非侵入性通气，7.7%需要侵入性机械通气。

**分子诊断**
共发现了两项涉及分子诊断的研究。其中一项研究使用综合征多重PCR面板，根据制造商的规格，报告的临界值为>10^4拷贝/mL [24]；另一项研究使用qLAMP检测方法，报告的临界值为任意检测到的拷贝数/[单位未提及] [28]。两项研究均显示出较高的病原体检测率，并且与传统培养方法具有高度一致性。综合征多重PCR面板的优势在于能检测出常规培养方法遗漏的病原体[24,34,35]，从而提高诊断信心、指导针对性治疗并减少对广谱经验性治疗的依赖。虽然这些方法可以提高诊断信心，但必须权衡其成本和可用性挑战。目前，综合征多重PCR系统较为昂贵，需要专门的设备和耗材，在资源有限的医疗机构中难以推广。

**对临床实践和未来研究的启示**
研究中存在的诸多方法学差异（包括患者选择、参考标准、诊断阈值和报告实践）限制了对NV-HAP诊断方法准确性的准确结论的得出。对于临床医生而言，这强调了在解释个别研究结果并将其应用于不同患者群体时需要谨慎的态度。对于研究人员而言，这些挑战凸显了制定标准化协议的紧迫性，包括统一的参考标准、统一的临界值和全面的诊断性能指标报告。更多方法学上的一致性不仅有助于元分析，也能提高指导临床决策的证据可靠性。为克服这些方法学限制并促进可靠的证据整合，我们建议未来研究应优先采用统一的NV-HAP诊断标准，努力就生物标志物、微生物采样技术和分子检测方法的临界值达成共识。同时，应遵循既定的报告指南，提供关于敏感性、特异性、预测值和一致性的完整数据。此外，应鼓励多中心研究和针对异质人群的研究，以提高研究的普遍适用性并减少单中心研究的偏见。新兴技术应在标准化框架内进行评估，以便与传统方法进行比较。最后，应鼓励开放的数据共享和协作研究，以加速证据积累。

**结论**
尽管纳入标准广泛，但本研究发现的NV-HAP相关研究数量有限，样本量也较小，表明该领域仍亟需进一步研究。诊断标准的不一致性进一步强调了标准化诊断方法的必要性。未来研究应努力建立一致的诊断标准，改进报告规范，并在多种患者群体中评估诊断工具的效果。

**伦理声明**
本系统评价未经机构伦理委员会审批，因为它是基于已有公开、去标识化数据的次要研究。研究过程中不存在利益冲突。评审方案已注册在PROSPERO平台，并遵循了最小化偏见的预定计划。所有数据来源均得到了适当引用，整个评审过程保持了学术诚信。

**数据与材料的可获得性**
本研究生成和/或分析的数据可根据请求向通讯作者索取。

**作者利益声明**
所有作者均声明无利益冲突。JAF来自Vestre Viken医院信托和Helse Vest医院信托的博士资助；KEM来自Vestre Viken医院信托的博士后资助；LH来自卑尔根大学的教授职位资助。

热点排行