一种用于检测医疗机构层面医疗支付风险评分编码强度差异的定量方法

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Health Services and Outcomes Research Methodology》：A quantitative method for detecting organization-level variation in healthcare payment risk score coding intensity

【字体：大中小】 时间：2026年05月23日 来源：Health Services and Outcomes Research Methodology 1.6

编辑推荐：

　　总额预算与基于风险的医疗支付高度依赖精准的风险调整。美国医疗保险和医疗补助服务中心分层病情分类（CMS–HCC）模型将人口统计学与诊断信息关联至预测支出，以支撑上述支付安排。然而，若不同医疗机构的诊断编码强度存在差异，预测支付可能偏离实际患病负担。本研究提出一

总额预算与基于风险的医疗支付高度依赖精准的风险调整。美国医疗保险和医疗补助服务中心分层病情分类（CMS–HCC）模型将人口统计学与诊断信息关联至预测支出，以支撑上述支付安排。然而，若不同医疗机构的诊断编码强度存在差异，预测支付可能偏离实际患病负担。本研究提出一种事后补充性一致性校验方法，以低裁量性住院作为独立参照，识别医疗机构层面的风险评分编码强度差异。研究人员采用历史医疗保险理赔数据开展计算模拟与评估研究，基于2018年指标构建研究专用的CMS–HCC v22支出预测，并据此划分预测支出十分位数。通过在9类易被高编码的CMS–HCC指标中，以10%和20%的强度提升水平，随机将基线年份指标由0置为1，模拟风险评分编码差异。从2019年住院理赔中筛选出45组低裁量性诊断相关分组（DRG）簇，并在十分位数层面开展DRG回归，生成补充支出预测及对应误差带（定义为DRG基支出预测±1.96倍标准差）。两类模型均预测2019年年度医疗保险总支出，数据均来自两年均参与传统医疗保险的参保人。无模拟编码差异时，验证队列的DRG基预测与CMS–HCC预测高度吻合，且处于DRG预测误差带内。模拟编码强度提升后，CMS–HCC十分位数预测值同时高于实际支出与DRG基一致性估计：10%提升水平下，除最高支出十分位外，其余均超过+1.96倍标准差；20%提升水平下，所有十分位均超出该阈值。DRG基十分位数预测的标准差范围为最高支出十分位占均值3.5%，最低支出十分位约占11%。低裁量性DRG簇可为识别CMS–HCC编码强度差异提供实用的群体层面参照信号。该方法仅作为补充性一致性校验工具，而非独立风险模型，天然适配医疗机构层面的评估场景。

总额预算与基于风险的医疗支付已成为全球应对人口老龄化与医疗资源约束的重要改革方向，其核心依赖精准的风险调整机制。美国医疗保险和医疗补助服务中心分层病情分类（CMS–HCC）模型通过将人口统计学特征与诊断信息映射至预测支出，支撑联邦医疗保险优势计划（Medicare Advantage, MA）、责任医疗组织（Accountable Care Organization, ACO）等基于价值的支付安排。然而，近年证据显示，诊断编码强度的机构间差异可能导致预测支付偏离实际患病负担，引发过度支付风险——例如MA计划的针对性病历审查、家访诊断等操作已被证实造成数十亿美元级超额支付，且不同机构的编码强度异质性显著。现有研究尚未充分量化ACO等场景下的风险评分编码变异，也未完全厘清共享节余测算的准确性偏差来源，因此亟需开发可识别特定人群（如ACO归属参保人）风险评分膨胀的独立方法。该研究发表于《Health Services and Outcomes Research Methodology》，提出一种以低裁量性住院为参照的事后补充性一致性校验框架，验证其在机构层面检测CMS–HCC编码强度差异的可行性。

研究人员采用5%标准样本的传统医疗保险（fee?for?service, FFS）理赔数据，纳入2018—2019年连续参加A部分和B部分、年龄≥65岁且无终末期肾病（End?Stage Renal Disease, ESRD）的参保人，排除MA参保人以保障理赔完整性，最终按随机拆分获得553?262人的开发队列与553?068人的验证队列。核心技术方法包括三方面：一是CMS–HCC十分位数划分与模拟编码强化，基于2018年指标构建研究专用CMS–HCC v22支出预测，按预测值排序均分10组，通过在9类易高编码的CMS–HCC指标中分别以10%、20%概率将基线指标由0置1，模拟编码强度差异；二是低裁量性诊断相关分组（Diagnosis Related Group, DRG）筛选，通过分层规则排除内科、可预防急性事件相关DRG簇，最终保留45组低裁量性DRG簇；三是十分位数层面DRG回归，以低裁量性DRG簇为自变量，在群体层面拟合支出预测模型，显式纳入随机变异参数生成±1.96倍标准差的误差带，作为独立于CMS–HCC的参照基准。

研究结果部分显示：在无模拟编码差异的开发队列中，CMS–HCC与DRG基模型的 grouped R²均为0.99，表明二者均与实际支出高度吻合。验证队列中，实际支出与开发队列偏差约2%，DRG基预测的预测比（Predictive Ratio, PR）介于0.95—1.17且全部落在±1.96倍标准差误差带内；CMS–HCC预测在无模拟强化时与DRG基预测一致，而10%编码强化下除最高支出十分位外，其余十分位预测均超出DRG基+1.96倍标准差误差带，20%强化下所有十分位均超出该阈值。DRG基十分位数预测的标准差随支出水平升高而降低：最高支出十分位为均值的3.5%，最低支出十分位约为11%。

讨论部分指出，该方法可在机构层面检测10%—20%的编码强度差异，且对低支出十分位人群的敏感度更高。实际应用中，仅需将目标机构的低裁量性DRG结果乘以预计算的回归系数，即可生成补充支出估计并与CMS–HCC预测比对，无需再划分十分位数。需注意，该方法为事后群体层面校验，不追溯个体、具体诊断或提供者层面的编码强化来源；研究采用的5% FFS样本未包含MA与ACO参与标识，低裁量性DRG集由作者规则筛选，未来可通过多专科临床输入扩展DRG范围以提升检测性能。

研究结论明确，低裁量性住院可作为独立参照，有效识别定义人群或机构层面的风险评分编码强度差异相关的支出偏差。该方法作为补充性一致性校验工具，而非独立风险模型，天然适配医疗机构评估场景。受限于回顾性数据与模拟编码设计，研究结果为可行性证据，后续需在MA等其他风险支付场景中进一步验证，并完善低裁量性入院的识别体系。

联系信箱：

粤ICP备09063491号

热点排行