《Journal of Cachexia, Sarcopenia and Muscle》:Cancer Cachexia Prevalence Is Underestimated in Medical Records of Patients in a Regional Tertiary Hospital
编辑推荐:
本文通过对法国鲁昂大学医院临床数据仓库(CDW)的回顾性分析,发现仅依赖国际疾病分类(ICD)代码会严重低估癌症恶病质的真实流行率。研究结合结构化数据(ICD编码)与非结构化数据(临床文本的自然语言处理),揭示了诊断记录与体重数据(BMI<20 kg/m2或体重下降>5%)之间存在显著脱节,强调了提高临床意识和规范化数据记录对改善患者护理与研究至关重要。
引言
癌症恶病质是一种多因素综合征,其特征是在存在恶性疾病的情况下出现以骨骼肌丢失(伴或不伴脂肪量减少)为特征的体重下降。国际德尔菲共识小组提出了临时诊断标准值:过去6个月内体重下降>5%,或体重下降2%–5%且身体质量指数(BMI)<20 kg/m2,或肌肉质量减少。这些标准已被验证并纳入美国临床肿瘤学会(ASCO)的癌症恶病质管理指南。恶病质对患者的生活质量、化疗耐受性和生存期均产生负面影响。然而,由于缺乏广泛认知和有限的真实世界流行率证据,恶病质护理和研究受到阻碍。本研究旨在评估法国一家三级医院中癌症患者恶病质的流行率,并检验仅依赖国际疾病分类(ICD)代码是否准确反映了实际情况。
方法
研究数据来源于法国鲁昂大学医院的临床数据仓库(EDSaN),该仓库整合了电子健康记录(EHR)和各类临床数据库的数据,包括结构化数据(如编码诊断、标准化的体重、身高和BMI表格)和非结构化数据(如出院摘要、信件、程序结果等临床叙述性笔记或报告)。研究涵盖2018年至2023年期间的所有门诊就诊和住院记录,对数据进行了两项连续的搜索分析。第一项搜索(第一组)旨在确定所有诊断为癌症(ICD-10代码为C*)的患者中恶病质的流行率,使用了ICD-10代码R64(恶病质)、电子体重记录和非结构化叙述数据。第二项搜索(第二组)则聚焦于已知恶病质高发的三种癌症:结直肠癌、胰腺癌和支气管/肺癌,旨在评估这些癌症中恶病质的流行率、诊断是否得到体重数据支持,以及是否存在客观体重数据表明恶病质但未获诊断的情况。对于非结构化数据的搜索,使用了自然语言处理(NLP)算法来查询与恶病质相关的术语。
结果
在2018年至2023年期间,数据库中的患者总数为737,906人。初步搜索显示,76,547名患者(10.4%)被诊断为患有任何原发部位的癌症。针对所有癌症患者(第一组)的深入分析显示,共有1,856名患者(占所有癌症患者的2.42%)可被归类为患有恶病质。其中,620名患者通过ICD-10代码R64识别,1,507名患者通过非结构化数据识别,271名患者通过两种方法共同识别。这表明,如果仅使用ICD代码进行搜索,恶病质流行率将被低估为0.81%,而非实际发现的2.42%。在这1,856名患者中,有648名患者缺乏完整的体重下降和BMI数据来根据国际共识定义确诊,其中386名患者完全没有体重下降或BMI的记录。
针对高恶病质流行率癌症(第二组:结直肠癌、胰腺癌、肺癌)的分析共确定了6,946名患者。在这组患者中,共有2,033名患者(29.3%)通过结构化和/或非结构化数据被识别为患有恶病质。结构化数据搜索(包括ICD代码R64和体重/BMI标准)仅识别出1,594名患者(占该组的22.9%),其中仅有254名患者(15.9%)是通过ICD-10 R64代码识别的。这意味着仅使用ICD代码会大大低估结构化数据中的恶病质流行率(仅识别出3.66%的患者)。此外,在通过ICD代码或术语“恶病质”识别的467名患者中,有47.8%(223/467)没有支持诊断的BMI或体重下降数据。同时,非结构化数据搜索额外识别出439名患者,这些患者未被结构化搜索发现。研究还发现,许多患者(在高恶病质癌症组中占41.2%)因缺少体重下降、BMI或两者数据而无法确认是否患有恶病质。
讨论
本研究的主要发现包括:(1)仅使用标准ICD代码搜索恶病质,无法识别大多数患者,从而严重低估了在所有癌症以及已知高流行率癌症中的恶病质流行率;(2)尽管存在表明恶病质的数据,但许多病例并未被诊断;(3)临床医生根据观察分配的许多恶病质ICD代码,并未得到BMI或体重下降数据的支持;(4)许多患者的恶病质状况因缺乏任何体重历史或BMI记录而未知。这些发现与之前在大型生物医学数据库(如英国生物样本库、斯洛文尼亚国家住院数据库)中的研究结果一致,均表明ICD代码对恶病质的报告严重不足。本研究的一个关键启示是,在治疗了数万名癌症患者的机构中,临床记录中经常缺失任何与体重相关的数据。纳入BMI和体重下降数据不仅对临床护理至关重要,也对研究至关重要。缺乏这些数据,临床医生可能会错过早期恶病质,从而延误干预并影响临床试验的患者招募。此外,ICD代码在恶病质中的使用明显极少,原因未知,可能与医生将该术语等同于消瘦的身体状况有关。研究强调了提高医疗保健专业人员对癌症恶病质定义的认识,以及更严格的记录和编码实践的必要性,以改善患者护理和研究结果。
本研究也存在一些局限性,例如数据来源于单一机构、其他机构或国家的编码行为可能不同、许多患者缺乏可评估的数据等。然而,即使获得更多患者数据,也只会增加被确认为恶病质但未被诊断的患者数量,从而强化本研究的主要结论。总体而言,本研究支持越来越多的文献强调需要更全面地使用诊断标准和改进癌症恶病质的编码实践,以提升对患者护理和研究工作的水平。