《Current Epidemiology Reports》:Application of Spatial Methods in Rural Cancer Control Research in the United States
编辑推荐:
本综述系统梳理了适用于农村癌症控制研究的各类空间方法,从识别地理模式到测量空间可及性,再到回归分析等。文章特别指出,在远程医疗兴起和农村医院关闭的新背景下,这些方法需不断调整和创新(如纳入2SVCA模型)。通过使用小区域估计技术,可为干预措施提供关键的风险因素和疾病负担数据,对持续存在的农村癌症差异问题至关重要,是制定精准政策和干预措施的重要工具。
在美国,约6600万农村居民面临着显著的癌症差异。为了有效制定干预政策,必须审视这些差异背后的空间因素。本文旨在总结农村癌症控制研究中应用的空间方法,涵盖从可视化、集群识别到复杂统计建模的广泛技术,并探讨其在应对农村地区特有挑战(如人口分散、数据稀疏)中的应用与创新。
空间方法概述
空间方法在癌症控制研究中至关重要,其范围覆盖从病因、预防、筛查、诊断、治疗到生存的整个癌症控制连续谱。核心方法主要包括三大类:用于可视化和识别空间模式的制图与集群分析方法;用于衡量医疗服务可及性的空间可达性测量方法;以及整合了空间要素的回归分析方法。选择和应用这些方法时,需充分考虑行政地理单元的局限性、农村定义的多样性以及农村地区常见的小样本数量问题。
定义“农村”
美国对“农村”并无单一的金标准定义,多个联邦机构根据其规划、监管和政策需求制定了不同的标准。常见做法是先定义“城市”或“大都市区”,不符合标准的区域则被归为“农村”或“非大都市区”。农村-城市的分类通常基于县、人口普查区或邮政编码制表区等地理单元。定义的选择取决于具体用例,包括数据的空间分辨率(如针对罕见癌症的研究可能需要在更粗的空间尺度上进行)和样本量。
制图与可视化
可视化空间模式有助于揭示表格数据中不易察觉的地理差异,使研究人员和政策制定者能识别高负担区域、医疗服务缺口以及针对性干预的机会。在地广人稀、医疗基础设施有限的农村地区,这一点尤为重要。常用的可视化工具包括等值区域图,它通过颜色和阴影梯度展示变量在地理区域间的差异。双变量等值区域图可同时展示两个变量,例如,可识别宫颈癌筛查率低且乳腺癌和宫颈癌早期检测项目可及性有限的区域,作为重点干预目标。
然而,在农村背景下使用等值区域图需谨慎。面积较大的农村县可能掩盖其内部异质性,并给人以整个区域情况均一的错误印象。此外,人口规模小常导致比率不稳定,需要采用平滑或经验贝叶斯技术来避免误导性模式。数据保密规则可能导致癌症结局数据缺失,从而模糊人口稀少地区的癌症负担。同时,可修改面积单元问题(MAUP)也会影响分析结果,其中聚合效应指的是在较大地理单元(如县)观察到的关联在较小单元(如人口普查区块)进行分析时可能不再成立。
识别与评估疾病模式和集群
虽然等值区域图有助于可视化,但无法判断观察到的模式是否具有统计学显著性。为此,需要使用空间关联局部指标(LISA)方法,如用于识别空间集群和异常值的局部莫兰指数I,或用于探测热点和冷点的Getis-Ord Gi*统计量。这些方法将统计推断直接整合到空间可视化中,已应用于农村癌症研究,例如在县级层面考察癌症筛查可及性的空间模式。
另一种常用方法是核密度估计(KDE),它是一种空间滤波方法,可将点或多边形数据转换为栅格密度表面。针对农村地区人口密度和空间异质性,方法上已有所调整,以减少人口稠密区的过度平滑,同时稳定农村地区的估计值。仿真方法(如Luo等人应用于乳腺癌分期的研究)通过明确纳入区域内异质性,为解决聚合效应提供了策略。
空间可达性测量
医疗可及性包含多个维度,常概括为“可及性的5A”,其中空间维度包括可用性(服务供应,如社区肿瘤医生数量)和可达性(与交通相关的因素和成本,通常以出行阻力、时间或其他成本衡量)。可达性又分为潜在可及性(获取现有医疗服务的潜在成本/负担)和实现可及性(服务的实际利用)。
测量空间可达性的方法有多种。最简单的是“容器法”,即计算行政边界(如县)内的提供者或设施数量。供应-需求比(如医患比)对此有所改进,它考虑了服务需求人口。然而,容器法受限于固定的行政边界,并假设边界内所有人享有同等可及性,且人们不会跨区寻求服务。
基于地理信息系统(GIS)的距离测量法可以计算潜在可及性(如从居民点到最近设施的最小距离)或实现可及性(患者实际就诊的旅行距离/时间)。这些方法在农村癌症研究中很有意义,已被用于研究健康食品、癌症筛查服务和临床试验等的可及性。
引力模型通过考虑供应点和需求点之间的相互作用,改进了容器法。其中,浮动集水区(FCA)方法通过指定半径或出行时间来定义服务区域,更真实地模拟了跨边界互动。最基本的FCA方法计算人口点(如人口普查区中心)指定半径内的医患比。随后发展出两步浮动集水区法(2SFCA),并进一步演变为三步浮动集水区法(3SFCA)、增强型两步浮动集水区法(E2SFCA)等多种改进方法。例如,Zahnd等人比较了2SFCA、E2SFCA和V2SFCA在评估南卡罗来纳州结肠镜可及性与诊断分期关系中的应用。随着远程医疗在癌症护理中的作用日益重要,考虑空间和虚拟双重可及性变得关键,近期研究已创新性地将宽带接入影响纳入,形成了两步虚拟集水区法(2SVCA)。
小区域估计技术
当关注人群或样本量较小时(如农村县或小地理区域),直接估计可能不精确。小区域估计技术利用样本充足区域的信息,来预测样本不足甚至为零的区域的结局,对于估计农村地区的癌症发病率、筛查普及率等至关重要。这些方法已被用于创建重要的公共数据库,如CDC PLACES和NCI State Cancer Profiles数据。
例如,500 Cities Project和CDC PLACES采用了经过验证的多层次回归与事后分层技术,为每个关注的指标构建多层次逻辑回归模型。NCI State Cancer Profiles则使用贝叶斯层次模型,结合BRFSS、NHIS的加权调查数据和ACS的人口统计变量,在人口普查区和邮政编码制表区级别生成模型化的小区域估计。这些技术也可应用于医疗索赔和癌症登记数据,通过贝叶斯条件自回归(CAR)等模型,为筛查普及率等指标提供小区域估计,为公共卫生干预提供信息。
空间回归
空间回归模型可用于分析空间分布的因变量(如癌症率)与自变量(如社会人口特征)之间的多变量关系。其优势在于能够考虑空间自相关,这是关键,因为空间数据常常违反独立性和平稳性假设。在进行空间回归分析前,通常需要先定义空间权重矩阵,以表征数据中每个面积单元的“邻居”关系。
空间回归模型可分为全局模型(如空间滞后或空间误差模型)和局部模型(如地理加权回归GWR和多尺度地理加权回归MGWR)。在农村癌症研究中,空间回归分析通常在县或人口普查区层面进行。例如,有研究使用空间滞后模型评估了密西西比河下游三角洲地区人口普查区层面乳腺X线摄影服务可及性与社会人口因素的关系。GWR方法则被用于分析农村和城市县中医疗服务提供者密度与前列腺癌死亡率的局部关联。
考虑空间因素的多水平模型
多水平(或分层)建模方法经常被用于同时考虑个体水平和区域水平(宏观水平)因素与癌症结局的关联。对于聚焦农村的分析,这通常包括宏观因素。这种方法考虑了组内观测值的非独立性(如聚集到地理单元的病例),从而提高了标准误计算的准确性并减少了I类错误。
在多水平模型中考虑空间因素有几种方式,包括采用贝叶斯方法、交叉分类模型,或在回归分析中纳入重要的空间衍生因素。例如,一项2024年的研究应用混合效应广义线性模型,在调整了农村医院关闭、急性护理空间可及性以及当地专科医生供应等因素后,考察了农村适龄成年人的癌症筛查接受情况。这个例子凸显了在癌症控制连续谱中,考虑农村医疗环境变化(如医院关闭影响)的重要性。
结论
面对持续存在的农村癌症差异,流行病学、生物统计学和卫生服务研究方法必须将农村性不仅视为一个分类概念,更应视为一个空间动态概念。这包括使用明确考虑距离、邻近性以及小样本数挑战的制图和其他空间分析方法。同时,空间可达性测量必须不断创新,以反映就医模式的转变,包括出行行为的变化和远程医疗的日益普及。最后,基于回归的方法(包括模型化小区域估计、空间回归和多水平建模)对于指导干预和政策决策、以及增进对农村医疗环境变化如何影响癌症结局的理解至关重要。