综述：胃癌中的个性化PET成像：基于荟萃分析的综述，以指导放射性药物的选择和临床应用

《International Journal of Biomedical Imaging》：Personalized PET Imaging in Gastric Cancer: An Umbrella Review of Meta-Analyses to Guide Radiopharmaceutical Selection and Clinical Indication

【字体：大中小】 时间：2026年05月02日 来源：International Journal of Biomedical Imaging 1.3

编辑推荐：

　　摘要背景胃癌仍然是全球癌症相关发病率和死亡率的主要原因之一，准确的影像学检查对于诊断、分期、复发检测和预后评估至关重要。正电子发射断层扫描（PET）传统上使用18F-氟脱氧葡萄糖（FDG）进行，但在胃癌中的表现参差不齐，尤其是在淋巴结和腹膜疾病方面。最近，68Ga标记的成纤

　　摘要

背景
胃癌仍然是全球癌症相关发病率和死亡率的主要原因之一，准确的影像学检查对于诊断、分期、复发检测和预后评估至关重要。正电子发射断层扫描（PET）传统上使用18F-氟脱氧葡萄糖（FDG）进行，但在胃癌中的表现参差不齐，尤其是在淋巴结和腹膜疾病方面。最近，68Ga标记的成纤维细胞激活蛋白抑制剂（FAPI）PET作为一种有前景的替代方案出现，这促使了多项系统评价和荟萃分析的开展，但这些研究的结果存在差异。

目的
我们的目标是综合并评估关于胃癌PET成像的荟萃分析证据，重点关注不同临床指征下放射性药物的特异性表现以及证据的确定性，以指导个性化示踪剂的选择。

方法
本研究遵循PRISMA 2020标准进行了伞形回顾。该方案在开放科学框架（OSF）中进行了前瞻性注册。从研究开始到2025年12月，我们在PubMed、Scopus和Web of Science中搜索了评估胃癌PET成像的系统评价和荟萃分析。评估指标包括诊断准确性、分期和再分期性能、复发检测、预后关联、方法学质量（AMSTAR-2）以及证据的确定性（GRADE）。

结果
共纳入了2011年至2025年间发表的11项荟萃分析。FDG PET/CT在总体诊断性能上表现中等，对淋巴结和腹膜转移的敏感性较低，但在基于标准化摄取值（SUV）的预后评估指标上具有中等确定性。相比之下，68Ga-FAPI PET在主要肿瘤检测、淋巴结疾病、腹膜转移和复发检测方面的汇总敏感性通常高于FDG，尽管证据的确定性从低到中等不等，且一些发现来自混合人群的研究。

结论
现有的荟萃分析证据表明，在胃癌PET成像中应采取基于指征的个性化方法。FDG PET仍适用于预后分层和某些复发情况的检测，而FAPI PET似乎在分期和再分期方面具有更高的诊断敏感性，特别是在腹膜疾病方面。然而，由于证据的异质性、间接性以及缺乏更新的汇总分析，整体证据的确定性仍然有限。

1. 引言
尽管在预防、早期检测和多模式治疗方面取得了进展，胃癌仍然是全球主要的健康负担，继续导致大量的癌症相关发病率和死亡率[1]。当前的临床实践指南强调准确的分期和风险评估，以指导治疗选择和随访，其中横断面影像学检查是评估的基础，并在特定临床情况下选择功能性影像学检查[2]。正电子发射断层扫描（PET）最常用的是18F-氟脱氧葡萄糖（FDG）PET/CT，它可以提供全身代谢评估，并有助于检测远处转移和评估疑似复发[3]。NCCN胃癌指南（版本2.2025）和患者指南承认FDG-PET/CT在识别淋巴结和远处疾病中的作用，但并未将其视为强制性检查，这反映了实际应用中的局限性和表现差异[4]。重要的是，胃癌中的FDG摄取是异质性的，在弥漫性和黏液/印戒细胞组织中FDG摄取可能会降低，这导致某些分期情况下的敏感性受限，从而需要更个性化的示踪剂选择策略[4]。与此同时，针对非肿瘤细胞成分的PET放射性药物在临床上得到了迅速发展[5]。成纤维细胞激活蛋白抑制剂（FAPI）示踪剂——通常是68Ga标记的FAPI——靶向肿瘤微环境中的癌相关成纤维细胞，尤其是在基质丰富的肿瘤中，通常会产生较高的肿瘤与背景比率[6]。最近在胃癌和更广泛的胃肠道恶性肿瘤中的证据综合研究表明，68Ga-FAPI PET在某些关键指标上可能优于FDG-PET/CT，特别是在检测原发疾病、淋巴结受累和腹膜扩散方面，并可能在某些情况下改善复发评估[7]。然而，快速增长的文献产生了多项系统评价和荟萃分析，这些研究的范围（胃癌特异性 vs. 混合癌症）、结果和方法学严谨性各不相同，使得临床医生和指南制定者难以将这些证据转化为明确的基于指征的建议。为了填补这一空白，进行一项伞形荟萃分析以整合和比较不同放射性药物的特定证据，并确定哪些证据足够可靠以指导临床选择，哪些证据仍存在不确定性，是非常及时的。根据现代透明报告证据综合的标准（PRISMA 2020），本伞形回顾旨在：(i) 绘制胃癌PET成像的荟萃分析证据图谱；(ii) 按临床指征（检测、分期、复发和治疗反应/预后）综合示踪剂的特异性表现；(iii) 评估方法学质量和证据的确定性，以指导临床实践和未来研究的个性化放射性药物选择。

2. 方法
2.1. 协议注册
本伞形回顾遵循PRISMA 2020声明进行系统评价和荟萃分析的报告。回顾方案事先制定并在开放科学框架（OSF）中注册（DOI:10.17605/OSF.IO/CXFDG）。该方案在研究选择和分析之前定义了目标、纳入标准、结果和证据综合方法。

2.2. 纳入标准
使用适用于基于影像学的证据综合的PICOS框架定义了纳入标准：
- 人群（P）：任何疾病阶段的胃癌患者，包括术后和复发情况。如果胃癌结果单独报告或可作为亚组进行分析，则纳入混合胃肠道或泛癌症人群的研究。
- 指标测试（I）：基于PET的影像学检查，包括PET、PET/CT和PET/MRI，使用FDG或68Ga标记的FAPI。如果胃癌结果单独报告、胃癌形成一个预先指定的亚组，或者临床问题直接涉及胃癌影像学检查，则保留包含混合胃肠道或泛癌症人群的回顾；否则，这些回顾将被排除。
- 对照组（C）：其他影像学方法、替代PET示踪剂或参考标准，如组织病理学和/或临床影像学随访。
- 结果（O）：诊断准确性指标（敏感性、特异性、比值比、诊断优势比[DOR]和曲线下面积[AUC]）、分期性能（淋巴结、远处或腹膜转移）、复发检测以及基于PET参数的预后结果。
- 研究设计（S）：系统评价和荟萃分析。排除叙述性回顾、单一主要研究、病例报告、会议摘要和社论。对于本伞形回顾，系统评价被定义为报告了明确研究问题、在至少一个电子数据库中进行了全面文献搜索、应用了明确的纳入标准并对纳入研究进行了结构化评估和综合的研究。
- 只考虑以英文发表的文章。

2.3. 信息来源和搜索策略
从研究开始到2025年12月，在PubMed、Scopus和Web of Science中进行了全面的文献搜索。搜索策略结合了与胃癌、PET、FDG、FAPI、系统评价和荟萃分析相关的控制词汇和自由文本术语（表1）。表1中展示了特定数据库的完整搜索策略。手动筛选纳入回顾的参考列表以识别额外的符合标准的研究。

2.4. 研究选择
从数据库搜索中检索的所有记录都被导入参考管理软件，并在筛选前删除了重复条目。两位独立评审员根据预定义的纳入标准对标题和摘要进行了筛选。明显不符合纳入标准的文章在此阶段被排除。使用EndNote 20（Clarivate，宾夕法尼亚州费城）进行了双重筛选，分歧通过共识和第三位评审员的仲裁解决。然后由相同的评审员独立检索并评估了潜在符合条件的文章的全文。关于纳入标准的分歧通过讨论和共识解决；必要时，会咨询第三位评审员。在全文阶段排除的原因包括缺乏系统评价或荟萃分析设计、PET特异性数据不足或与胃癌影像学无关。

2.5. 系统评价之间的重叠评估
由于本研究是一项伞形回顾，预计纳入的系统评价和荟萃分析之间的主要研究会有重叠。为了评估重叠情况，我们构建了一个引用矩阵，其中行代表单独的主要研究，列代表纳入的系统评价/荟萃分析。在给定回顾中存在主要研究的情况被二分编码。除了视觉检查外，还使用校正覆盖面积（CCA）来量化重叠程度，计算公式为：CCA = (N ? r)/(rc ? r)，其中N是跨回顾的总研究次数，r是唯一的主要研究数量，c是回顾的数量。重叠程度用常规阈值解释：轻微（0%–5%）、中等（6%–10%）、高（11%–15%）和非常高（>15%）。由于没有对主要研究数据进行重新汇总，因此将重叠视为回顾之间的冗余和依赖性，而不是新生成的荟萃分析中的直接统计重复计数。

2.6. 数据提取
数据提取由两位评审员使用预定义和试用过的提取表独立完成。对于每个纳入的系统评价或荟萃分析，收集了以下信息：文献细节（第一作者、发表年份和期刊）、回顾特征（研究设计、癌症人群、纳入的主要研究数量和总样本量）、影像学特征（PET模式、评估的放射性药物和对照影像学模式）、临床指征（主要检测、分期、复发检测和预后评估）、结果指标和汇总估计值、异质性指标（I2或等效统计量）、偏倚风险或作者使用的方法学质量评估工具。当数据以图形方式报告或不完整时，从表格或图表中提取数值。提取的数据中的任何差异通过共识解决。

2.7. 包含回顾中主要研究的偏倚风险
本伞形回顾没有重新评估单个主要研究的偏倚风险。相反，偏倚风险是根据纳入的系统评价和荟萃分析中报告的结果提取的。这些评估是在原始回顾中使用的适当工具进行的，包括QUADAS或QUADAS-2用于诊断准确性研究，以及Newcastle–Ottawa量表（NOS）或类似工具用于预后和观察性研究。由于本概述是在系统评价/荟萃分析层面综合证据，因此没有重新评估主要研究或重新汇总主要研究数据。

2.8. 关注的结果
关注的结果根据临床指征和证据类型进行了预定义和分类。诊断结果包括PET成像在检测原发肿瘤、淋巴结转移、腹膜和远处转移以及复发疾病方面的敏感性和特异性。在可获取的情况下，还提取了次要诊断指标，如阳性和阴性似然比、疾病无进展时间（DOR）和接收者操作特征曲线下面积（AUC）。分期和重新分期的性能基于PET成像在术前和术后的准确性进行评估，特别关注淋巴结和腹膜受累情况。预后和治疗反应结果侧重于PET衍生定量参数（包括标准化摄取值[SUV]、SUVmax和SUV的变化）与生存终点（如总生存期、无病生存期、无进展生存期和无复发生存期）之间的关联。此外，使用适用于诊断测试准确性和预后证据的GRADE框架对结果的确定性进行了评估，并总结了不同放射性药物和临床适应症的情况。总体而言，这些结果构成了结果部分中呈现的放射性药物性能的定性综合、比较解释和证据确定性评估的基础。

2.9. 方法学质量评估

使用AMSTAR-2工具对纳入的系统性回顾和荟萃分析的方法学质量进行了评估。两位审稿人独立地在关键和非关键领域对每项回顾进行了评估，包括方案注册、文献搜索、研究选择、数据提取、偏倚风险评估和出版偏倚的考虑。任何分歧通过共识解决。根据AMSTAR-2的指导，将每项回顾的结果的总体信心分为高、中、低或极低。领域级别的评估和总体信心评分被综合并可视化，以帮助解释证据基础。报告偏倚的评估基于纳入的系统性回顾和荟萃分析中提供的信息。在可获取的情况下，提取了出版偏倚评估的结果，如漏斗图检查、Egger回归测试、Begg测试或相关方法。当原始回顾中没有评估或未报告出版偏倚时，记录为“未报告”。由于没有进行重新分析或重新汇总原始研究数据，因此在本伞形回顾中没有进行额外的统计测试来评估报告偏倚。

2.10. 证据综合方法

采用了与伞形回顾方法一致的自然和比较证据综合方法。在荟萃分析层面综合了发现，而不是重新汇总原始研究。诊断和预后结果按放射性药物和临床适应症进行总结，汇总估计值直接来自纳入的荟萃分析。当多个荟萃分析涉及相同的示踪剂-适应症对时，结果进行了定性比较，总结解释强调了效应的方向和大小、一致性和临床相关性，而不是生成新的汇总估计值。使用视觉摘要来支持解释，包括定量比较图和基于适应症的决策框架。通过比较不同回顾中报告的异质性统计、临床背景（人群特征、疾病阶段和临床适应症）、成像方案、参考标准和结果定义，定性探讨了回顾间的异质性。由于本伞形回顾没有重新汇总原始研究数据并在荟萃分析层面综合证据，因此没有进行新的亚组分析或荟萃回归。此外，也没有对原始研究进行新的定量重新分析或敏感性分析，因为这项研究旨在综合已发表的系统性回顾和荟萃分析的证据。因此，我们的发现反映了现有汇总证据的比较评估，而不是生成新的汇总估计值。

2.11. 证据确定性

使用适用于诊断测试准确性和预后证据的GRADE框架评估了结果的确定性。对于诊断结果，确定性判断考虑了偏倚风险、不一致性、间接性、不精确性和出版偏倚，起始确定性基于每个荟萃分析总结的证据体，并根据需要进行下调。对于预后结果，应用了观察性证据的标准GRADE考虑因素，包括异质性评估、效应估计的精确度和潜在的混杂因素。确定性评分按结果、放射性药物和临床适应症进行总结，并以结构化表格和视觉热图的形式呈现，以便于透明解释。

2.12. 软件和代码

研究管理、数据提取、综合和可视化的所有阶段都使用了统计软件、参考管理工具和自定义脚本的组合，以确保透明度和可重复性。在筛选之前，使用标准参考管理软件管理和去重文献记录。数据处理、制表和图表生成主要在R（版本4.5.2）中使用RStudio（版本2025.09.1 Build 401；Posit Software，美国马萨诸塞州波士顿）作为集成开发环境。开发了自定义R脚本用于数据清洗、转换和可视化，包括生成热图、比较图和总结放射性药物性能和证据确定性的交通灯矩阵。核心R包包括数据操作和图形工具，以及用于读取电子表格文件和管理结构化数据集的包。方法学质量评估（AMSTAR-2）和证据确定性评估（GRADE）使用预定义的决策规则在电子表格中实现，并使用基于R的视觉摘要进行验证。没有重新分析或重新汇总原始研究数据。

3. 结果

3.1. 研究选择

通过数据库搜索共识别出135条记录（PubMed 34条，Scopus 65条，Web of Science 36条）。去除重复项后，剩余65条记录用于标题和摘要筛选。其中，根据预定义的资格标准排除了53条记录。有17份报告被检索以获取全文并进行资格评估。有6份报告无法检索到。剩余的11项系统性回顾和荟萃分析被纳入伞形回顾（图1）。

3.2. 纳入的荟萃分析的特征

共纳入了11项在2011年至2025年间发表的系统性回顾和荟萃分析（表2和表3）。这些回顾评估了PET成像在胃癌中的临床效用，涵盖了诊断、分期、复发检测和预后设置，包括已建立的和新兴的放射性药物。表2. 纳入的系统性回顾和荟萃分析的特征，这些回顾评估了PET放射性药物在胃癌中的应用。作者、年份（参考文献）

| 作者 | 年份 | 期刊 | 回顾类型 | 癌症类型 | 人群特异性 | 放射性药物 | 对照组 | 临床适应症 | 包含的研究数量 | 总患者数 |
|------|------|------|--------|-----------|---------|--------|------------|----------------|-----------|
| Choi等人，2023 [10] | Yeungnam Medical Science | 系统性回顾和荟萃分析（诊断准确性） | 胃癌（根治性切除后复发） | 仅胃癌 | 18F-FDG PET或PET/CT | 未作为头对头比较；评估PET/PET-CT与参考标准的诊断性能 | 检测根治性切除后的胃癌复发 | 17 | 1732 |
| Kaneko等人，2015 [11] | Journal of Nuclear Medicine | 系统性回顾（FDG亲和力预测因子）+回顾性队列+PET评分系统 | 胃腺癌 | 仅胃癌 | 18F-FDG PET/PET-CT | 无头对头对照组；识别FDG亲和力预测因子（及选择工具） | 选择FDG PET的患者进行分期（提高检出率） | 系统性回顾：18篇文章；回顾性队列：40名患者 | 40；SR患者总数未在摘录中汇总 |
| Ruan等人，2023 [12] | Theranostics | 系统性回顾和荟萃分析（FAPI PET） | 胃癌（包括原发、复发、淋巴结、远处/腹膜转移） | 仅胃癌 | 68Ga-FAPI（主要是FAPI-04；一些研究包括其他FAPI化合物） | 18F-FDG PET/CT（比较证据） | 早期诊断、初始分期、检测复发/转移；示踪剂选择（FAPI vs. FDG） | 14 | 527（总358） |
| Seevaratnam等人，2012 [13] | Gastric Cancer (Suppl 1) | 系统性回顾和荟萃分析（术前成像准确性） | 新诊断的胃癌；术前分期 | 仅胃癌 | 18F-FDG PET（作为单一模式） | AUS、CT、MRI与病理学 | 术前TNM分期（与病理学相比的准确性） | 40 | 3758 |
| Wang等人，2023 [14] | European Journal of Medical Research | 荟萃分析（仅比较试验） | 胃癌 | 仅胃癌 | [68Ga]Ga-FAPI-04 PET MRI/CT | [18F]-FDG PET MRI/CT | 检测原发肿瘤；淋巴结转移；腹膜受累 | 5 | 148 |
| Wang和Chen，2011 [15] | BMC Gastroenterology | 系统性回顾（诊断测试准确性）+荟萃分析 | 胃癌（肝和腹膜转移） | 仅胃癌 | 18F-FDG PET | US、EUS、CT和MRI | 治疗前检测肝和腹膜转移 | 33 | 总患者数在摘录中未说明（研究规模因模式而异） |
| Wu等人，2012 [8] | BMC Cancer | 荟萃分析（预后） | 胃癌 | 仅胃癌 | 18F-FDG PET（SUV） | 高SUV组与低SUV组（临界值不同） | 预后预测（治疗前PET SUV） | 8 | 1080 |
| Wu等人，2024 [16] | Translational Cancer Research | 系统性回顾和荟萃分析（诊断复发） | 所有癌症（亚组：GI/包括胃癌） | 全癌症复发回顾，含GI/胃癌亚组 | [68Ga]Ga-FAPI-04 PET | [18F]FDG PET | 检测癌症复发（包括GI复发亚组） | 12 | 224 |
| Zhang等人，2021 [17] | Experimental and Therapeutic Medicine | 系统性回顾和荟萃分析（诊断准确性） | 胃癌（原发分期+复发） | 仅胃癌 | 18F-FDG PET/CT | CECT + 组织病理学参考标准 | 原发TNM分期（N/M）+胃癌复发诊断 | 58 | 9997 |
| Zhu等人，2012 [9] | British Journal of Radiology | 系统性回顾和荟萃分析（预后） | 食管胃交界腺癌（局部化；包括胃食管交界处） | 食管胃交界/上消化道相关 | 18F-FDG PET（SUVmax, ΔSUV） | 代谢响应者与非响应者；不同的PET时间点（PET1 vs. PET2/PET3） | 新辅助治疗期间的预后分层和早期反应评估 | 10（可评估的荟萃分析研究） | 798 |
| Zou和Zhao，2013 [18] | Surgical Oncology | 系统性回顾和荟萃分析（诊断准确性） | 胃癌（术后患者） | 仅胃癌 | 18F-FDG PET/CT | 参考标准：组织病理学和/或临床和影像学随访；与CT/内镜间接比较 | 检测根治性手术切除后的胃癌复发 | 8 | 500 |

表3. 纳入的系统性回顾和荟萃分析的结果和方法学质量总结，这些回顾评估了PET放射性药物在胃癌中的应用。作者，年份（参考文献）
报告的结果
主要发现
异质性（I2）
偏倚风险工具

Choi等人，2023 [10]
灵敏度/特异性，阳性预测比（LR+）/阴性预测比（LR-），无病生存期（DOR），曲线下面积（AUC）
PET/PET-CT在复发检测方面表现出良好的灵敏度（0.82）和特异性（0.86）
灵敏度I2 = 76.5%；特异性I2 = 94.2%
修改后的QUADAS-2评分系统

Kaneko等人，2015 [11]
检出率；FDG亲和力；预测因子；评分系统性能（灵敏度/特异性）
预测因子：较大的肿瘤大小，非SRC组织类型，GLUT1阳性；评分系统灵敏度85%，特异性71%
I2未报告
未报告（重点在于预测因子合成和模型开发）

Ruan等人，2023 [12]
汇总灵敏度/特异性和AUC；按病变部位划分的亚组灵敏度；SUVmax与TBR的比较
68Ga-FAPI在总体灵敏度和AUC上优于FDG；对原发肿瘤、复发、淋巴结转移和腹膜转移的灵敏度更高
未报告单一的总体诊断准确性I2值；报告了定量汇总的异质性
QUADAS-2评分系统

Seevaratnam等人，2012 [13]
准确性；过度分期/分期不足，Kappa值，灵敏度，特异性（按检查方式划分）
PET在N分期方面的灵敏度最低，但特异性最高；没有一种检查方式在M分期方面明显更优
I2未呈现（汇总结果以平均值±标准误差表示，并进行了比较）
文章中未明确指出具体的评分工具（方法侧重于重新计算诊断性能和汇总方法）

Wang等人，2023 [14]
灵敏度（基于患者的结果；淋巴结转移；腹膜转移）
FAPI-04 PET MRI/CT在原发肿瘤、淋巴结转移和腹膜转移的检测方面优于FDG
（根据图表）基于患者的结果显示汇总灵敏度存在显著异质性（例如，基于患者分析的I2 = 84%）
CASP评分系统

Wang和Chen，2011 [15]
汇总灵敏度/特异性/DOR（按检查方式划分，肝脏与腹膜）
CT对肝脏转移的检测最为敏感；EUS对腹膜转移的检测灵敏度最高，但较低；各检查方式的灵敏度和特异性并不始终很高
I2未报告；通过Cochrane的Q值和阈值效应测试评估了异质性
QUADAS评分系统

Wu等人，2012 [8]
总生存期（OS）和无复发生存期（RFS）的风险比（HR）
治疗前的SUV值较高与较差的OS和RFS相关
I2 = 0%（OS）和I2 = 0%（RFS）

Newcastle–Ottawa评分系统（NOS）

Wu等人，2024 [16]
汇总灵敏度/特异性；胃肠道复发亚组
FAPI在复发检测方面的灵敏度高于FDG；胃肠道亚组：FAPI灵敏度1.00，FDG为0.57；特异性相似/精确度较低
使用I2来评估异质性，但提取的摘要片段中未提供I2值
QUADAS-2评分系统

Zhang等人，2021 [17]
N分期、M分期和复发的灵敏度/特异性（以及阳性预测比、阴性预测比、AUC）
PET/CT和CECT总体上有用；PET/CT的特异性较高；在排除或确认淋巴结转移或复发方面有限作用；两者都有助于确认远处转移
N分期（PET）：灵敏度I2 = 87.6%，特异性I2 = 64.2%；M分期（PET）：灵敏度I2 = 83.5%，特异性I2 = 94.1%；复发（PET）：灵敏度I2 = 75.7%，特异性I2 = 89.7%
QUADAS-2评分系统

Zhu等人，2012 [9]
基于SUVmax和SUV变化的OS和DFS风险比
SUVmax的相对变化（PET1→PET2/PET3）显著预测OS和DFS；基线SUVmax本身的预后价值有限；支持个性化治疗调整
OS（ΔSUV）：I2 = 16%；DFS（ΔSUV）：I2 = 18%；多项分析显示异质性较低
自定义的方法学质量评分系统（修改后的PET特异性评分）

Zou和Zhao，2013 [18]
灵敏度，特异性，阳性预测比（PLR），阴性预测比（NLR），无病生存期（DOR）和HSROC AUC
18F-FDG PET/CT在检测复发方面的诊断准确性中等（汇总灵敏度0.86；特异性0.88；AUC 0.93）；有助于确认复发，但单独使用时不足以排除复发
灵敏度I2 ≈ 83.7%；特异性I2 ≈ 75.8%
QUADAS评分系统

注意：包括混合胃肠道或泛癌症人群的综述被视为胃癌的间接证据，在叙述综合和GRADE评估中谨慎对待。缩写说明：ΔSUV，标准化摄取值的变化；AUC，曲线下面积；CASP，批判性评估技能计划；DM，远处转移；DOR，诊断比值比；DFS，无病生存期；FAPI，成纤维细胞激活蛋白抑制剂；FDG，18F-氟脱氧葡萄糖；GI，胃肠道；HR，风险比；HSROC，分层总结接收者操作特征；I2，Higgins不一致性指数；JBI，Joanna Briggs研究所；LN，淋巴结；LNM，淋巴结转移；LR-，阴性预测比；LR+，阳性预测比；NOS，Newcastle–Ottawa评分系统；OS，总生存期；PET，正电子发射断层扫描；PFS，无进展生存期；QUADAS，诊断准确性研究的质量评估；RFS，无复发生存期；Sens，灵敏度；Spec，特异性；SUV，标准化摄取值；SUVmax，最大标准化摄取值；TBR，肿瘤与背景比值。在11项纳入的荟萃分析中，8项（72.7%）评估了诊断准确性结果，3项（27.3%）评估了预后分析，2项（18.2%）评估了治疗反应。5项荟萃分析评估了淋巴结转移，4项评估了腹膜转移，3项评估了复发检测。两项综述专门使用基于SUV的指标来评估早期治疗反应和预后。大多数证据涉及18F-FDG PET或PET/CT，反映了其在胃癌成像中的长期应用。较新的综述纳入了68Ga-FAPI PET，要么作为FDG的直接比较对象，要么在混合模式分析中使用。各研究中的比较对象包括增强CT、MRI、超声检查，以及组织病理学和临床或影像学随访等参考标准。每项荟萃分析的主要研究数量从5项到58项不等，总患者数量从148例到近10,000例不等，具体取决于临床问题和发表时间。诊断准确性荟萃分析通常汇总了较大的人群，而以FAPI为重点的比较分析和预后综述涉及的研究和患者数量较少。尽管大多数综述仅关注胃癌，但一些针对复发或预后的分析包括了胃癌作为预定义亚组的混合胃肠道或泛癌症队列。因此，仅针对胃癌的荟萃分析的证据强度最高，而混合胃肠道或泛癌症的综述的证据强度较低，被视为间接证据。报告的结果包括诊断性能的灵敏度、特异性、比值比、DOR和AUC曲线，以及预后分析的总体生存期、无病生存期、无进展生存期或无复发生存期的风险比。总体而言，FDG PET/CT表现出中等到良好的诊断性能，通常特异性高于灵敏度。比较性荟萃分析一致表明68Ga-FAPI PET在灵敏度和病灶检测能力方面更高，尤其是在原发肿瘤、淋巴结疾病和腹膜转移方面。治疗前的高SUV值与较差的总生存期（HR > 1.5）和无复发生存期显著相关，且在汇总分析中无异质性（I2 = 0%）。治疗过程中SUV的变化（ΔSUV）对OS和DFS的预后价值更强，异质性较低（I2 = 16%–18%）。诊断准确性分析中普遍存在较大的研究间异质性（I2通常>70%），反映了患者人群、成像方案和参考标准的差异。相比之下，基于SUV变化的预后荟萃分析通常显示较低的异质性。方法学质量使用已建立的工具进行评估——诊断综述最常用QUADAS/QUADAS-2，预后分析使用NOS、CASP或JBI评分系统。总体而言，纳入的荟萃分析的方法学质量中等，支持综合分析，同时强调了证据一致性的持续变异性。

3.3. 特定放射性药物的证据综合

各项荟萃分析中特定放射性药物的证据显示出显著的异质性，报告的I2值范围从64.2%到94.2%（表3）。

3.3.1. 18F-FDG PET
来自诊断准确性荟萃分析的证据表明，18F-FDG PET/CT在特异性方面表现较高，但在灵敏度方面有限，尤其是在早期疾病、淋巴结受累和腹膜转移方面。在术前分期中，FDG-PET在淋巴结分期方面的灵敏度最低，但在所有成像方式中特异性最高，这限制了其作为独立分期工具的价值，同时支持其在确认晚期疾病中的作用[15]。同样，在评估肝脏和腹膜转移方面，FDG-PET的灵敏度并不始终很高，特别是在腹膜扩散方面，假阴性结果较为常见[14]。相比之下，FDG-PET提供了可靠的预后信息。荟萃分析证据显示，治疗前的高SUV值与较差的总生存期和无复发生存期显著相关，支持FDG-PET作为代谢风险分层的工具，而不仅仅是用于解剖分期[16]。这些发现直观地反映在图2中，其中FDG-PET在淋巴结和腹膜转移的检测方面表现出较低的汇总灵敏度，而在原发肿瘤检测和复发方面则表现较好，这强调了其在检测低体积或浸润性疾病方面的局限性。对于复发检测，汇总的灵敏度和特异性分别达到0.82和0.86[10]，异质性较高（I2 = 76.5%和94.2%）。在淋巴结分期方面，灵敏度在不同研究中低至0.40–0.60，而特异性超过0.85。

3.3.2. 68Ga-FAPI PET
更新的荟萃分析一致表明，68Ga-FAPI PET在胃癌的诊断指标方面优于FDG-PET。FAPI-PET在检测原发肿瘤、局部复发、淋巴结转移和远处转移方面表现出更高的汇总灵敏度和AUC，尤其是在腹膜转移方面，FDG-PET的表现最差[12]。定量分析进一步显示，FAPI-PET的SUVmax和肿瘤与背景比值更高，反映了正常胃组织和腹膜组织中的低生理摄取。比较性荟萃分析证实，[68Ga]Ga-FAPI-04 PET MRI/CT在检测原发肿瘤、淋巴结疾病和腹膜受累方面优于FDG-PET MRI/CT，在基于患者的分析中灵敏度有显著提高[8]。这些发现使FAPI-PET成为初始分期、复发检测和转移评估的有希望的示踪剂，特别是在FDG亲和力低的组织学亚型中。如图2所示，FAPI-PET在腹膜转移和复发方面的汇总灵敏度接近上限，置信区间比FDG-PET更窄，表明其检测能力和稳健性都有所提高。Ruan等人的荟萃分析[12]报告称，FAPI-PET在原发肿瘤和腹膜转移方面的汇总灵敏度超过0.90，AUC也高于FDG。在比较分析中，FAPI对胃肠道复发的灵敏度达到1.00，而FDG为0.57[16]。

3.3.3. 根据临床指标选择示踪剂
总体而言，证据支持个性化的放射性药物选择策略。FDG-PET在预后分层和确认代谢活跃的晚期疾病方面仍有价值，而FAPI-PET在分期和重新分期方面提供更高的诊断灵敏度，尤其是在腹膜和淋巴结疾病方面。尽管证据有限，但双示踪剂方法可能在某些情况下提高诊断信心；然而，这目前仅得到小型比较研究的有限支持，需要进一步验证[12]。因此，图2提供了一个实用的临床实践中示踪剂选择的视觉框架，推荐FDG-PET用于预后评估和代谢活跃的复发检测，FAPI-PET用于全面的分期和重新分期，特别是在有腹膜或淋巴结扩散风险的患者中。

3.3.4. 放射性药物选择的总结框架
为了将异质性的荟萃分析证据转化为临床可操作的指导，表4总结了胃癌主要临床指标下特定放射性药物的性能。该表整合了多项荟萃分析的汇总诊断和预后发现，强调了每种示踪剂的相对优势和局限性。

表4. 胃癌中特定放射性药物的临床指标性能总结
原发分期
淋巴结转移
腹膜转移
复发检测
预后价值

18F-FDG
中等的诊断性能；在早期或弥漫性肿瘤中的灵敏度有限
灵敏度低，特异性高；有助于确认晚期淋巴结疾病
灵敏度低；假阴性结果常见
中等；对于临床怀疑的复发，灵敏度可接受
高；基于SUV的指标与生存结果一致相关

68Ga-FAPI
原发肿瘤检测的灵敏度高
淋巴结受累的灵敏度高
腹膜扩散的灵敏度非常高
复发的灵敏度接近上限
新兴技术；预后效用在荟萃分析中尚未确立

缩写说明：18F，氟-18；68Ga，镓-68；FAPI，成纤维细胞激活蛋白抑制剂；FDG，18F-氟脱氧葡萄糖；LN，淋巴结；PET，正电子发射断层扫描；SUV，标准化摄取值。如表4所示，18F-FDG PET在原发分期和复发检测方面表现出中等的诊断性能，但在淋巴结和腹膜转移方面的灵敏度有限，但基于SUV的参数具有很强的预后价值。相比之下，68Ga-FAPI PET在分期和重新分期指标方面的诊断灵敏度很高，尤其是在腹膜扩散方面，但由于缺乏专门的生存期荟萃分析，其预后效用尚未得到充分证实。

3.4. 基于指标的性能

3.4.1. 原发疾病的检测
在纳入的荟萃分析中，PET示踪剂在检测原发肿瘤方面的性能因放射性药物和肿瘤生物学特性而异。18F-FDG PET在检测原发胃癌方面表现出中等灵敏度，在早期疾病和葡萄糖代谢低的组织学亚型（如印戒细胞癌和弥漫型癌）中性能较低。相比之下，68Ga-FAPI PET在检测原发病变方面表现出较高的灵敏度，这归因于其对癌相关成纤维细胞的靶向作用以及正常胃壁中的低生理摄取。这些特性提高了病变的可见性，并使得浸润性或基质丰富的肿瘤的检测更加可靠。

3.4.2. 分期（淋巴结和远处疾病）
对于分期目的，特别是淋巴结和腹膜受累的情况，依赖于示踪剂的差异尤为明显。荟萃分析证据表明，尽管18F-FDG PET的特异性相对较高，但其对淋巴结转移的敏感性有限，这反映了它无法检测到小体积或低代谢的淋巴结病变。对于腹膜转移，其表现更差，因为生理性的肠道摄取和低肿瘤糖酵解活动导致了频繁的假阴性结果。相比之下，68Ga-FAPI PET对淋巴结和腹膜转移的敏感性非常高，尤其在腹膜播散方面具有最大的相对优势。这些发现支持优先使用基于FAPI的成像技术进行全面分期，尤其是在需要准确评估手术可行性和转移负担的临床情况下。如图3所示，FAPI-PET在原发肿瘤检测方面表现出一致的高性能，而FDG-PET的敏感性仅为中等。

3.4.3. 复发的检测
肿瘤复发的检测是根治性治疗后PET成像的一个关键临床指标。荟萃分析一致显示，18F-FDG PET在复发检测方面具有中等敏感性，尤其是在代谢活跃的疾病中，但可能会遗漏小体积、纤维化或浸润性的复发病变。相比之下，68Ga-FAPI PET在复发检测方面的敏感性接近最高，包括胃肠道复发亚组，在荟萃分析中表现优于FDG-PET。这些结果表明，在重新分期和监测环境中，FAPI-PET具有明确的作用，尤其是在常规成像或FDG-PET结果不确定时。

3.4.4. 治疗反应和预后评估
目前，18F-FDG PET在治疗反应评估和预后分层方面的证据最为充分。荟萃分析显示，治疗前SUV值的升高与较差的总生存率和无复发生存率显著相关，这支持了基于FDG的代谢参数作为有效的预后生物标志物。尽管68Ga-FAPI PET在诊断性能上更优，但支持其在预后分层或治疗反应监测中作用的强大荟萃分析证据仍然有限。因此，目前应将FAPI-PET视为这一领域的新兴工具，有待专门的纵向研究和生存聚焦研究来进一步验证。

3.5. 研究之间的方法学质量和偏倚风险
所包含的系统评价和荟萃分析的方法学质量使用AMSTAR-2工具进行了评估，各领域的评分总结在图4中。总体而言，证据基础的质量参差不齐，研究在关键和非关键AMSTAR-2领域的合规性存在差异。大多数评价充分涵盖了PICO框架、研究设计、文献搜索、研究选择和数据提取，表明方法学基础总体上是可靠的。然而，协议注册的报告不一致，这是最常未满足的领域之一。在几项研究中，缺乏注册或清晰可访问的协议限制了对先验方法学决策的透明度。大多数评价中普遍报告了对排除研究的评估和提供了足够的研究描述；然而，排除的明确理由往往不完整。与主要研究资金来源相关的领域在大多数评价中报告不足，构成了一个反复出现的方法学弱点。关于综合和解释，大多数荟萃分析适当地描述了荟萃分析方法，讨论了偏倚风险对结果的影响，并讨论了研究间的异质性。尽管如此，几项评价中缺乏对出版偏倚的正式评估，或者仅部分涉及。

3.6. 不同结果的证据确定性
使用GRADE框架评估了诊断和预后结果的证据确定性，结果总结在图5中。总体而言，证据确定性因临床指标和放射性药物的不同而显著变化，反映了研究设计、人群异质性和特定结果荟萃分析的可用性的差异。

3.7. 原始研究的重叠
图6展示了所包含的系统评价和荟萃分析中原始研究的引用矩阵，显示了它们之间的重叠情况。定量重叠评估显示CCA为4.08%，表明评价之间存在轻微的重叠。进一步观察确认了部分而非完全的重叠，一些原始研究出现在多个评价中，特别是在关注类似临床指标（如复发检测和术前分期）的FDG PET荟萃分析中。图6显示了原始研究在所包含的系统评价和荟萃分析中的引用矩阵。行代表独特的原始研究，列代表被包含的评价。还使用校正后的覆盖面积（CCA）进行了定量重叠评估。早期FDG PET荟萃分析之间的重叠最为明显，反映了它们依赖于一组共同的基础研究。相比之下，较新的荟萃分析（尤其是那些评估68Ga-FAPI PET的）显示出的重叠有限，这与这一证据基础的新兴性质以及新原始研究的纳入有关。重要的是，没有单一的系统评价主导了整个证据基础，多个评价贡献了独特的原始研究，尽管存在一定程度的重复。鉴于证据综合是在评价层面进行的，并且没有对原始研究数据进行重新汇总，因此观察到的重叠预计不会对这个伞形评价的结论引入实质性偏倚。

4. 讨论
本伞形评价综合了关于胃癌个性化PET成像的荟萃分析证据，重点讨论了放射性药物的选择应如何与临床指标相匹配。在所包含的荟萃分析中，出现了两种一致的模式：（i）18F-FDG PET/CT在选定的情况下提供了临床有用的信息，但对淋巴结和腹膜疾病的敏感性有限；（ii）68Ga-FAPI PET在关键诊断指标（特别是腹膜受累）方面的汇总敏感性高于FDG，但由于证据基础较小、标准不一和临床应用仍在发展中而受到限制。

4.1. FDG-PET：已确立的作用，但受指标限制
当前的国际指南认为PET/CT是胃癌检查中有用的辅助手段，而不是普遍的一线检查方法。NCCN胃癌指南（2025年）指出，当可用时，多学科团队可以考虑使用FDG-PET/CT，这反映了其实用性和在许多途径中的非常规地位。与这种务实定位一致，荟萃分析的汇总结果显示，FDG-PET/CT在确认晚期疾病方面比排除疾病方面更为可靠——尤其是在淋巴结疾病和腹膜癌病方面。这些限制有生物学和技术上的解释。FDG的摄取随组织学亚型和肿瘤细胞密度的不同而变化，小体积病变容易受到部分体积效应的影响，从而降低了微转移淋巴结疾病和微妙腹膜扩散的检测能力。这有助于解释为什么FDG在淋巴结受累方面经常显示出高特异性但敏感性有限，而在腹膜转移方面的表现往往较差。

4.2. FAPI-PET：更强的诊断信号，尤其是对于腹膜
本伞形评价中最具临床影响力的发现是，与FDG相比，基于FAPI的PET在胃癌比较分析中具有一致的诊断优势。最大的专门针对胃癌的荟萃分析（Ruan等人，2023年）发现68Ga-FAPI的汇总诊断准确性高于FDG，在原发肿瘤检测、淋巴结评估、腹膜转移和复发/重新分期方面都有显著提高的汇总敏感性。另一项比较荟萃分析同样支持68Ga-FAPI-04 PET（MRI/CT平台）在原发肿瘤检测、淋巴结转移和腹膜受累方面的优越性。这种优势在机制上是合理的，因为FAPI示踪剂针对的是癌相关纤维母细胞上的纤维母细胞激活蛋白（FAP），通常在基质丰富的肿瘤中产生高肿瘤与背景比率，在许多正常组织中生理摄取较低。当代评价强调了FAPI-PET在各种恶性肿瘤中的临床应用范围不断扩大，同时也指出了已知的局限性（如良性炎症/纤维化过程中的摄取）。这些观点与我们的基于指标的框架一致，支持优先使用FAPI-PET进行全面分期/重新分期，尤其是在腹膜疾病是关键关注点时。然而，FAPI成像的一个重要局限性是它在良性条件下的非特异性摄取，包括炎症过程、纤维化和术后或治疗后的变化。这些假阳性发现可能会降低特异性，需要在临床背景下谨慎解释。

4.3. 复发检测：强烈的性能信号，但确定性仍然较低
在胃癌特定的荟萃分析中，FDG-PET/CT在复发检测方面表现出中等敏感性，但异质性较大。FAPI-PET在包含胃肠道亚组的荟萃分析中显示出非常高的汇总敏感性，但这些证据受到样本量小和癌症类型混合的限制。这些限制解释了为什么在我们的综合评估中复发结果的GRADE确定性仍然很低，尽管汇总点估计较为有利。临床上，这支持了一个细致的路径：FDG-PET/CT在疾病代谢活跃时仍然适用于复发评估；而FAPI-PET对于怀疑有腹膜或浸润性复发的患者可能最有价值，或者当常规成像结果不确定时。对于复发检测，FDG-PET/CT在胃癌特定的荟萃分析中表现出中等敏感性，但异质性较大。尽管汇总敏感性估计有利——尤其是对于68Ga-FAPI PET——但由于偏倚风险、间接性和不精确性，证据基础受到限制。对于预后结果，18F-FDG PET基于SUV衍生参数与总生存率之间的一致关联表现出中等确定性。然而，由于纳入队列的观察性质和SUV临界值定义的变异性，证据的确定性因偏倚风险而被下调。对于基于FAPI的成像，没有专门的预后荟萃分析，导致生存结果的确定性非常低。

4.5. “放射性药物选择 + 临床指标”的实际意义
当转化为实践时，证据支持一种精确的成像方法：
- 对于腹膜疾病高风险的分期/重新分期：优先选择68Ga-FAPI PET（在荟萃分析中具有强烈的诊断信号）。
- 复发评估：考虑将FDG-PET/CT作为广泛可用的选项；在结果不确定或怀疑有腹膜/浸润性复发时考虑使用FAPI-PET，同时认识到确定性的有限性和潜在的假阳性。
- 预后分层/代谢生物学：FDG衍生的定量参数是目前荟萃分析证据中最受支持的PET生物标志物，用于与生存相关的结果。这些含义也与当前的指南生态系统一致，其中FDG-PET/CT在胃癌分期和随访途径中被选择性地整合而不是普遍使用。初步证据表明FDG和FAPI具有互补作用，FDG反映肿瘤代谢，而FAPI反映基质活性；然而，目前缺乏对双示踪剂策略的强大荟萃分析验证。

4.6. “放射性药物选择 + 临床指标”的实际意义
当转化为实践时，证据支持以下精确成像方法：
- 对于腹膜疾病高风险的分期/重新分期：优先选择68Ga-FAPI PET（在荟萃分析中具有强烈的诊断信号）。
- 复发评估：考虑将FDG-PET/CT作为广泛可用的选项；在结果不确定或怀疑有腹膜/浸润性复发时考虑使用FAPI-PET，同时认识到确定性的有限性和潜在的假阳性。
- 预后分层/代谢生物学：FDG衍生的定量参数是目前荟萃分析证据中最受支持的PET生物标志物，用于与生存相关的结果。这些含义也与当前的指南生态系统一致，其中FDG-PET/CT在胃癌分期和随访途径中被选择性地整合而不是普遍使用。初步证据表明FDG和FAPI具有互补作用，FDG反映肿瘤代谢，而FAPI反映基质活性；然而，目前缺乏对双示踪剂策略的强大荟萃分析验证。质量、异质性以及为何确定性仍然有限

尽管有明确的方向性研究结果，AMSTAR-2和GRADE的荟萃分析仍突显出一些重要的限制因素。许多诊断性荟萃分析显示了显著的异质性，这些异质性主要由以下原因导致：（i）参考标准的不同（组织病理学与随访结果）、（ii）患者群体的差异（早期与晚期患者；组织学类型的混合）、（iii）PET扫描/解读的变异性，以及（iv）结果定义的差异（基于患者还是基于病变）[17]。此外，特别是对于FAPI成像技术，新的示踪剂和协议仍在向标准化方向发展；最近关于FAPI PET的专业指南强调了最佳实践，并指出了技术/解读方面的注意事项——这是提高可重复性和减少偏见的重要步骤[23]。定量重叠分析显示仅有轻微的重叠（CCA = 4.08%），表明各研究之间的冗余性很小，所纳入的荟萃分析主要提供了独立的证据。因此，尽管有一致的方向性证据支持FAPI在多个诊断指标上的应用，但目前的结论应被视为基于证据的比较性判断，而非最终的、综合性的效应估计。

4.7. 2026年及以后的研究重点

为了加强临床转化并提高确定性，未来的研究应优先考虑以下几点：（i）使用标准化参考标准进行前瞻性、针对胃癌的FDG与FAPI的直接比较；（ii）明确报告按部位（淋巴结、腹膜、内脏）划分的基于患者和基于病变的检测性能；（iii）统一定量指标（SUV/TBR）的阈值和报告标准以及时间节点；（iv）进行纵向研究，将FAPI的摄取模式与生存期、复发情况和治疗反应联系起来，从而实现真正的预后荟萃分析。2024-2025年的相关综述强调了FAPI-PET的潜力，同时也指出了需要解决良性摄取、标准化和临床整合的问题，这些都支持上述研究重点[20]。

5. 结论

现有证据表明，胃癌的放射性药物选择应基于具体临床需求。FDG-PET仍然是某些临床问题（尤其是预后评估和某些复发情况）中常用且易于获取的示踪剂，而FAPI-PET在分期和重新分期方面显示出更强的诊断价值，尤其是在腹膜疾病中。然而，由于部分证据来自混合人群的研究以及较新的FAPI研究，因此在广泛纳入临床指南之前，还需要进一步的高质量、针对胃癌的验证。

作者贡献

概念设计：Aiganym Amrenova、Amin Tamadon和Nadiar M. Mussin；方法学设计：Aiganym Amrenova、Alma Shukirbekova、Sholpan Akhelova和Amin Tamadon；文献检索与研究筛选：Aiganym Amrenova、Alma Shukirbekova和Jamilya Assilbayeva；数据提取与整理：Aiganym Amrenova、Sholpan Akhelova和Maira Ualieva；正式分析与证据整合：Aiganym Amrenova、Andrey Gurin、Bibigul Kaliyaskarova和Asset Sarsekeyev；方法学质量与确定性评估（AMSTAR-2、GRADE）：Aiganym Amrenova和Amin Tamadon；可视化与图表制作：Aiganym Amrenova和Andrey Gurin；初稿撰写：Aiganym Amrenova和Amin Tamadon；修订与编辑：Alma Shukirbekova、Nadiar M. Mussin、Sholpan Akhelova、Jamilya Assilbayeva、Andrey Gurin、Maira Ualieva、Bibigul Kaliyaskarova和Asset Sarsekeyev；项目监督：Amin Tamadon和Nadiar M. Mussin；项目管理：Aiganym Amrenova。所有科学内容、解释及最终决策均由作者完成。

致谢

生成式人工智能工具仅用于辅助文本的语言编辑、清晰度提升和组织结构优化，以及表格和图表的格式化。这些工具未用于数据分析、结果解读或科学结论的生成。

资金支持

阿斯塔纳医科大学提供了常规的学术和出版相关费用支持，但这种支持并不构成正式的研究资助。

披露

所有作者对最终稿件的批准负有责任，并对稿件的内容承担全部责任。

伦理声明

作者声明没有利益冲突。

数据可用性声明

本文所依据的原始数据将由作者无保留地提供。

热点排行