PREDICT预后工具v2.2与v3.0在日本乳腺癌人群中的外部验证与比较研究

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Breast Cancer》：Validation of the postoperative prognostication tool PREDICT version 2.2 and 3.0 using data from the National cancer center hospital in Japan

【字体：大中小】 时间：2026年01月20日 来源：Breast Cancer 2.9

编辑推荐：

　　本研究针对PREDICT预后模型在日本人群中的适用性问题，由日本国立癌症中心团队开展回顾性队列验证。通过对2980例术后乳腺癌患者数据分析，发现PREDICT v3.0在5年/10年总生存期(OS)预测中较v2.2具有更好校准度（校准曲线更接近理想对角线），而v2.2在长期判别能力方面略优（时间依赖性ROC曲线下面积AUC>0.80）。结果表明两个版本均适用于日本患者，其中v3.0更适用于医患共享决策，为亚洲人群个性化医疗提供重要循证依据。

在全球范围内，乳腺癌依然是威胁女性健康的头号杀手。据统计，到2040年预计将有300万新发病例和100万死亡病例。而日本的情况尤为特殊：乳腺癌不仅发病率最高，死亡率也高居第三。更值得注意的是，日本乳腺癌的发病高峰比西方国家早10年左右，且发病率持续上升，这与西方国家的下降趋势形成鲜明对比。这种流行病学差异，加上东亚人群特有的生物学特征（如Luminal B亚型比例较高、TP53突变频率差异等），使得直接应用基于西方人群开发的预后模型存在潜在风险。

PREDICT作为英国剑桥团队开发的免费在线预后工具，能够可视化评估乳腺癌术后患者的总生存期(OS)和辅助治疗额外获益。该工具经过多次更新，从最初版本逐步整合了HER2状态、Ki-67指数、孕激素受体(PR)状态等预后因素，最新版本v3.0更增加了放疗效益评估功能。虽然PREDICT已在欧美多个国家得到验证，但在亚洲人群中的验证研究仍相对有限。此前有研究显示，PREDICT v2.2在日本患者中存在长期生存低估现象，而最新版本v3.0在日本的适用性尚未明确。这种验证空白可能导致临床决策偏差，特别是在个性化医疗日益重要的今天，准确的风险评估工具对治疗方案选择至关重要。

日本国立癌症中心的研究团队试图填补这一空白。他们收集了2006-2016年间2980例接受手术的早期乳腺癌患者数据，排除男性乳腺癌、双侧乳腺癌、初诊IV期患者等不符合条件者，严格按照PREDICT模型的输入要求（年龄25-85岁、包含肿瘤大小、淋巴结状态、激素受体 status等变量），分别计算v2.2和v3.0预测的生存概率。对于缺失数据（如双膦酸盐使用情况、吸烟状态），研究人员按照模型官方指南进行合理赋值。通过校准曲线（calibration plot）比较预测值与实际观察值（Kaplan-Meier法估计）的吻合度，并采用时间依赖性受试者工作特征曲线（time-dependent ROC）分析模型的判别能力。

主要技术方法包括：1）回顾性队列设计（日本国立癌症中心医院2006-2016年2980例手术患者）；2）使用PREDICT v2.2和v3.0的R包计算个体化生存概率；3）校准分析通过校准曲线比较预测与观察生存率；4）判别分析采用时间依赖性ROC曲线和曲线下面积(AUC)评估；5）统计处理包含逆概率加权(IPCW)处理删失数据。

模型校准结果显示，无论是5年还是10年OS，两个版本的PREDICT都表现出系统性低估倾向，但v3.0的改善明显。在ER阳性组，实际5年OS为98.8%，v2.2预测为91.8%，而v3.0提升至95.5%；在ER阴性组，实际95.8%的OS被v2.2低估为77.4%，v3.0则修正至86.9%。这种改善趋势在10年OS预测中更加显著：ER阳性组实际96.0%的OS，v2.2仅预测80.5%，v3.0达到87.9%；ER阴性组实际89.4%，v2.2预测66.3%，v3.0提升至77.3%。校准曲线直观显示，v3.0的预测点更接近理想对角线，特别是在总体队列和ER阳性亚组中。

模型判别能力分析呈现有趣差异。在总体队列和ER阳性患者中，两个模型10年内均保持良好判别性能（AUC普遍>0.80）。但v2.2在5年后表现出略微优势，尤其在ER阳性组后期时间点。相反，ER阴性组的A值波动较大，5年后两种模型的判别能力均逐渐下降。这表明模型性能存在肿瘤分子亚型特异性，也揭示了校准度与判别能力之间的权衡关系——v3.0虽然校准改善，但判别能力略有牺牲。

讨论部分深入剖析了这种权衡的临床意义。在风险分层场景（如辅助化疗决策）中，v2.2优异的判别能力更具价值；而在医患共同决策时，v3.0更准确的绝对生存率估计则更为重要。研究还指出日本人群的特殊性：较早的发病高峰、持续上升的发病率、独特的肿瘤生物学特征，以及日裔人群较好的生存结局，这些都可能是模型低估生存的原因。值得注意的是，v3.0通过纳入诊断年份变量部分捕捉了时间趋势，但可能仍不足以完全反映日本特有的流行病学特征。

研究承认了一些局限性：双膦酸盐和吸烟状态等变量的大量缺失、Ki-67状态近半数为"未知"，以及10年时点的高删失率（超过2300例）都可能影响结果可靠性。特别是ER阴性组中接受内分泌治疗的患者极少，可能反映历史诊断标准差异或数据记录问题。

最终结论强调，这是首个在日本队列中同时验证PREDICT v2.2和v3.0的研究。虽然两个版本都表现出生存低估，但v3.0的校准改善使其更适合个性化预后沟通，而v2.2在长期风险区分方面仍有优势。这种版本选择的情境依赖性提示临床医生应根据具体目标（风险分层或预后沟通）灵活选择工具。研究为PREDICT在亚洲人群中的应用提供了重要循证依据，也为开发针对日本人群优化的预后模型奠定了基础。随着人工智能技术在预后模型中的快速发展，结合机器学习方法与区域特异性数据，有望进一步提升乳腺癌个性化医疗的精准度。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号