《Epidemiology》:Adapting Back-calculation Methods to Estimate the Incidence of Tuberculosis
编辑推荐:
本综述创新性地将艾滋病研究中的反演计算(back-calculation)方法进行改良,应用于结核病(TB)发病率估计。通过引入伽马分布描述感染期(infectiousness period),并利用流行率与报告率比值(P:N)构建治愈模型(cure model)来校正漏报,本研究建立了贝叶斯框架,以估计越南、柬埔寨和菲律宾三国分性别的结核病历史发病率。结果表明,实际发病率平均比报告数高19%,且男性发病率普遍高于女性。该方法规避了世界卫生组织(WHO)模型对疫情处于平衡态的强假设,能更灵敏地捕捉报告数据动态,为准确评估结核病负担提供了新的时序建模工具。
背景
结核病(TB)仍是全球单一传染病的主要死因,但其疾病负担的准确估计仍面临挑战。现有方法,如世界卫生组织(WHO)采用的模型,常存在资源消耗大、依赖疫情平衡态假设、难以验证等诸多局限性。本研究旨在开发一种基于贝叶斯反演计算的新方法,通过考虑疾病发生到报告之间的延迟,来更准确地估计结核病的历史发病率。
方法
本研究对最初为艾滋病(HIV)发病率估计开发的反演计算方法进行了关键性改良,以适应结核病的自然史特征。核心改进在于,使用“感染期分布”替代传统的“潜伏期分布”。感染期定义为从个体发展为细菌学阳性结核病到被报告并开始治疗(假设治疗后很快不再具有传染性)的时间段。该分布采用离散化的伽马分布进行参数化,其形状参数(α)和速率参数(β)依据各国感染期中位数的95%可信区间(CrI)确定。
为校正结核病病例的漏报问题,模型引入了随时间变化的乘数,该乘数基于特定年份的流行率与报告率比值(P:N)计算得出。报告的概率(pi)通过公式 pi= 1 - (1 - qi)(α/β)进行估算,其中qi为一年内结核病患者被报告的概率。
模型的核心公式为:观测到的某年报告数Xi的期望值,是历年发病率Ij与感染期分布f(·)及报告概率pi的卷积。模型假设发病率Ij服从泊松分布。为确保发病率估计值的时序平滑性(反映发病率不会剧烈波动的先验知识),模型对发病率的对数施加了惩罚似然先验。最终,利用马尔可夫链蒙特卡洛(MCMC)方法进行参数估计,并产生了分性别的结核病发病率后验分布。
数据来源
研究使用世界卫生组织(WHO)提供的菲律宾(2003年起)、柬埔寨(1998年起)和越南(1996年起)15岁及以上人群的分性别年度结核病报告数据。选择这些国家的原因是它们拥有多次结核病流行率调查数据以及感染期持续时间估计值。数据分析截止到2019年,以排除COVID-19大流行对结核病报告系统的重大干扰。
结果
研究估计,三个国家的实际结核病发病率平均比报告病例数高出约19%。在性别差异方面,男性的结核病发病率均高于女性,在越南平均高出3.8%,在柬埔寨平均高出1.3%,在菲律宾平均高出2.5%。各国的发病率时间趋势呈现不同特点:柬埔寨的发病率估计值从2002年的高点(每10万人667例)下降至2009年的低点(每10万人335例);菲律宾的发病率在整个研究期间呈现上升趋势;越南的发病率则在1996年达到峰值(每10万人417例)后下降至2012年的低点(每10万人218例),之后又有所回升。
与WHO的估计结果相比,本方法得到的估计值可信区间(CrI)更窄,并且能更敏锐地反映出报告数据中的波动(例如各国在2014-2015年出现的报告数上升),这表明该方法可能具有更好的时间精度。
讨论与结论
本研究成功地将贝叶斯反演计算框架应用于结核病发病率估计。该方法的核心优势在于明确考虑了从疾病发生到报告之间的延迟,这可能比现有方法在时间上更为准确,并能提供更早的性别分层发病率估计。然而,该方法严重依赖于输入数据(即结核病报告数据)的质量,报告系统本身的变化(如诊断技术引入、强制报告政策出台等)会直接影响估计结果。因此,在报告数据受到已知但未量化的干扰时期(如COVID-19大流行),需谨慎使用此方法。未来的研究方向包括整合更多不确定性来源以及探索竞争风险模型来进一步完善估计。总体而言,这种贝叶斯反演计算方法为评估全球结核病负担提供了一个新的、以数据为重点的补充视角。