开发并验证了一个机器学习模型和一个网络工具,用于预测中国患者患克罗恩病的风险
《Public Health》:Development and validation of a machine learning model and a web tool for predicting the risk of Crohn's disease diagnosis in Chinese patients
【字体:
大
中
小
】
时间:2026年05月04日
来源:Public Health 3.2
编辑推荐:
周泽天|王洪勤|何一舒|龚燕|孙长青|魏娟|陈红东南大学中大医院消化内科,中国江苏省南京市丁家桥87号,210009摘要目的克罗恩病(CD)的诊断延迟可能会增加预后不良的风险。本研究开发并验证了一个机器学习(ML)模型,以帮助临床医生进行初步诊断并转诊疑似患者。研究设计这是一项回
周泽天|王洪勤|何一舒|龚燕|孙长青|魏娟|陈红
东南大学中大医院消化内科,中国江苏省南京市丁家桥87号,210009
摘要
目的
克罗恩病(CD)的诊断延迟可能会增加预后不良的风险。本研究开发并验证了一个机器学习(ML)模型,以帮助临床医生进行初步诊断并转诊疑似患者。
方法
这项回顾性双中心研究分析了两家中国三级医院的电子病历(EMRs)(2020–2024年)。纳入标准为首次诊断为CD且疾病持续时间≤24个月的患者,排除了年龄<18岁、病史不完整或之前使用过氨基水杨酸盐、糖皮质激素或生物制剂的患者。训练了九种算法,包括逻辑回归(LR)、支持向量机(SVM)、梯度提升机(GBM)和神经网络(NN)。通过接收者操作特征曲线下面积(AUROC)、校准曲线和决策曲线分析来评估模型性能。使用SHapley Additive exPlanations(SHAP)值增强了最佳模型的可解释性。
结果
最终模型使用了金陵医院526名患者的数据(276名CD患者和250名非IBD患者),通过单变量和多变量逻辑回归从28个候选变量中选择了10个预测特征。GBM模型表现优异,在训练队列中的AUROC为0.998(95% CI:0.995–1.000),在测试队列中的AUROC为0.954(95% CI:0.923–0.985)。在中大医院对196名患者进行的外部验证中,AUROC为0.944,Brier分数为0.094。
结论
利用双中心数据,开发并验证了一个可解释的ML模型,以支持早期CD诊断和转诊决策。
引言
克罗恩病(CD)是一种慢性肠壁炎症性疾病,属于炎症性肠病(IBD)的亚型,正在全球范围内对临床治疗和公共卫生造成越来越大的挑战和负担。11990年至2019年间,中国IBD的发病率激增,估计男性每10万人中有3.35例,女性每10万人中有2.65例。2预测表明这一趋势将在未来25年内持续,之后才会趋于平稳。尽管诊断技术有所进步,但由于CD的初始症状不典型(包括腹痛、腹泻和体重下降),诊断延迟仍然存在。在高收入国家,CD的诊断延迟中位时间为6.2个月;而在低收入和中等收入国家,这一时间间隔几乎翻倍,达到11.7个月。3尽管中国关于诊断时间线的全面数据仍然有限,但有证据表明,诊断延迟会导致更高的并发症发生率,如瘘管、脓肿和肠手术——这些结果显著影响了生活质量并增加了医疗成本。3,4
2017年的ECCO-ESGAR指南5强调,目前没有单一的CD诊断金标准。诊断需要综合临床特征、实验室检查、内镜评估、影像学检查和组织病理学。
2010年,Peyrin Biroulet等人基于临床、内镜、放射学和其他证据定义了早期CD的六个标准:(1)确诊CD,(2)胃肠道功能正常,(3)有疾病活动迹象,(4)疾病持续时间小于2年,(5)无肠道损伤,(6)无既往手术/内镜干预或疾病修饰疗法的使用。6
值得注意的是,部分患者可能以中度至晚期疾病的形式出现,包括瘘管、脓肿或狭窄。7因此,首次CD诊断有时会发生在疾病早期窗口之外。这突显了及时诊断干预以优化临床结果的关键性。
目前加快CD诊断的策略包括使用预测模型,如红旗指数(Red Flags Index),该指数可以识别高风险症状,包括未愈合的肛门瘘管或肛周病变。8然而,召回偏差限制了其实用性。Gionata Fiorino等人提出的将粪便钙卫蛋白(FC,一种肠道炎症生物标志物)与红旗指数结合的方法提高了早期检测的敏感性。9IBD-REFER标准也采用了FC检测方法。10然而,基于FC的工具的广泛采用受到检测可用性不一致和检测方法不统一的阻碍。2021年提出了一种利用血液、尿液和粪便检测的模型12,显示出高诊断CD的准确性。由于研究队列包括先前已诊断的CD患者,疾病进程对实验室检测结果的潜在影响尚不清楚。2025年的一项基于英国人群的研究对超过200万名患者进行了IBD预测模型的开发,使用了年龄、吸烟状况、胃肠道/肠道外症状和实验室标志物等关键变量。13虽然初级护理数据通过减少响应偏差提高了普遍性,但准确性可能仍受编码错误或不完整记录的限制。该模型还反映了西方的人口统计和环境暴露模式。
机器学习(ML)作为人工智能的一个子领域,在各种领域的风险预测方面具有变革潜力。通过利用复杂的数据集识别细微模式,ML算法可以生成强大的诊断模型。14在消化病学中,ML在预测胃肠道出血死亡率和结直肠肿瘤等方面展示了有希望的应用前景。15,16
然而,其在中国的风险症状人群中的应用仍有待进一步探索。
在这项研究中,我们旨在开发并验证一个基于ML的预测模型,以识别早期诊断的中国CD患者的风险因素,从而促进早期诊断和干预。我们还使用了SHapley Additive exPlanations(SHAP)这一可解释性框架,以阐明模型输出并提高透明度。本研究旨在为临床医生提供可扩展的、基于证据的解决方案,帮助他们进行初步诊断和转诊疑似患者。
章节摘录
研究队列
这项回顾性队列研究使用了中国南京两家三级医院的电子病历(EMRs)数据。纳入标准是首次诊断为CD且疾病持续时间(从初始症状到诊断)≤24个月的患者,其诊断代码根据国际疾病分类第10版(ICD-10)为K50、K50.0、K50.1、K50.8、K50.9。排除标准包括:(1)年龄<18岁;(2)病史不完整
队列特征
从最初的1330名CD患者中,经过排除标准后,随机选择了276名新诊断为CD的患者和250名非IBD对照组患者,最终形成了526名患者的队列。这些患者按7:3的比例分为训练组(n = 369)和测试组(n = 157)。30%的保留测试集未用于网格搜索超参数调整。训练组和测试组的特征见表1。CD患者的年龄显著更年轻
主要发现和临床意义
在这项双中心研究中,我们开发并验证了一个可解释的ML模型,用于早期诊断具有疑似症状的CD患者。我们的研究发现,年轻年龄、肛周疾病的存在、体重下降、低BMI和腹痛是与CD显著相关的临床特征,同时实验室标志物如MCV降低、ALB降低、Hb降低和LYM升高也有助于早期诊断CD。我们使用单变量和
伦理声明
本研究获得了中大医院伦理委员会和金陵医院伦理委员会的批准(批准编号:2021ZDSYLL297-P01, 2022DZKY-048-02),并遵循了赫尔辛基宣言的伦理原则。由于回顾性设计,无需获得知情同意,研究方案符合STROBE指南。
关于写作过程中生成式AI和AI辅助技术的声明
在准备这项工作时,作者使用了DeepseekR1工具来提高手稿的可读性和语言表达。使用该工具后,作者根据需要审查和编辑了内容,并对出版物的内容负全责。
数据可用性声明
本研究的数据集、代码和算法文件不公开。但是,可以根据合理请求从相关作者处获取分析数据。
资金
本研究未获得公共部门、商业部门或非营利部门的任何特定资助。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号