《Hepatology Research》:Machine Learning Approach Enables Highly Accurate Identification of At-Risk Metabolic Dysfunction-Associated Steatohepatitis
编辑推荐:
本研究开发了一种仅使用七项常规临床参数(AST、PT-INR、GGT、年龄、糖尿病、高血压、血小板计数)的随机森林(RF)机器学习模型(STEALTH-ARMS),用于无创识别高危代谢功能障碍相关脂肪性肝炎(at-risk MASH,即NAS≥4且纤维化≥F2)。该模型在验证队列中表现出色(AUROC:0.8434),其准确性显著优于FIB-4指数(AUROC:0.7329)和肝脏硬度测量(LSM,AUROC:0.7428),并与FAST评分(AUROC:0.7914)相当。该研究为资源有限环境下实现高危MASH的精准、无创、低成本筛查提供了创新解决方案。
研究背景与目的
代谢功能障碍相关脂肪性肝病(MASLD),作为新提出的脂肪性肝病(SLD)命名体系中的一个亚型,其疾病谱范围从无症状性脂肪变性到代谢功能障碍相关脂肪性肝炎(MASH),并可能进展为肝硬化和肝细胞癌(HCC)。识别“高危MASH”(定义为NAFLD活动度评分[NAS] ≥ 4且纤维化分期 ≥ 2)至关重要,因为它与肝脏相关死亡率增加和HCC负担加重显著相关。虽然肝活检是诊断MASH的金标准,但其有创性和高成本限制了广泛应用。基于振动控制瞬时弹性成像(VCTE)的肝脏硬度测量(LSM)及其衍生的FibroScan-天冬氨酸氨基转移酶(FAST)评分等无创方法,在特定人群(如高体重指数[BMI])中存在可及性、成本和性能方面的局限性。因此,本研究旨在利用全国性多中心注册队列,开发一种实用且临床适用的机器学习(ML)模型,该模型整合易于获取的常规临床数据,在不使用LSM的情况下准确识别高危MASH患者。
研究方法
本研究纳入了来自全国性多中心注册队列研究(STEALTH研究)的884例经组织学确诊的MASLD患者。将整个数据集按8:2的比例随机分为推导队列(80%)和验证队列(20%)。评估了多种ML算法,包括随机森林(RF)、梯度提升(GB)、支持向量机(SVM)、深度学习(DL)以及作为线性模型的逻辑回归(LR)。使用推导队列进行超参数优化(采用贝叶斯优化和10折交叉验证),验证队列则完全保留至最终评估。模型的判别性能通过受试者工作特征曲线下面积(AUROC)评估,并与FIB-4指数、LSM和FAST评分进行比较。此外,还评估了模型的整体预测性能(Brier评分)和校准性能(平均校准误差,MCE)。使用置换重要性评分和SHapley加法解释(SHAP)值来解释模型并确定关键预测变量。
研究结果
患者特征与模型比较:在884例患者中,347例(39.3%)存在高危MASH。在验证队列中,RF模型对高危MASH的预测显示出最佳的判别能力(AUROC: 0.8405),优于LR(0.7729)、GB(0.8252)、SVM(0.7816)和DL(0.7422)模型。
简化模型(STEALTH-ARMS)的性能:基于特征重要性分析,最终确定仅使用七个关键临床变量(AST、PT-INR、GGT、年龄、糖尿病、高血压、血小板计数)构建简化的RF模型,命名为STEALTH-ARMS模型。该模型在推导队列和验证队列中分别取得了0.9775和0.8434的AUROC。在验证队列中,STEALTH-ARMS模型的性能显著优于FIB-4指数(AUROC: 0.7329; p < 0.001)和LSM(AUROC: 0.7428; p = 0.01),并且与FAST评分(AUROC: 0.7914)无显著差异(p = 0.09)。STEALTH-ARMS模型还表现出优异的整体预测性能(Brier评分: 0.1706)和良好的校准性能(MCE: 0.1033)。
关键预测因子与模型解释:置换重要性分析显示,AST、PT-INR、GGT、患者年龄和糖尿病状态是预测高危MASH最重要的变量。SHAP分析进一步阐明了这些变量与风险之间的方向性关系:较高的AST水平、较高的PT-INR、年龄较大、血小板计数较低以及存在糖尿病和高血压与较高的MASH风险相关。值得注意的是,GGT与风险呈非线性关系,较低和较高的GGT水平均与风险降低相关。
结论与意义
本研究成功开发并验证了STEALTH-ARMS模型,这是一种基于随机森林机器学习算法、仅使用七项常规临床参数的无创工具,用于准确识别高危MASH。该模型的性能与需要专用设备(FibroScan)的FAST评分相当,甚至优于LSM和FIB-4指数,为解决LSM在可及性、成本和特定人群性能方面的局限性提供了强有力的替代方案。STEALTH-ARMS模型的高精度、低成本和无创特性使其特别适合在资源有限的初级保健机构中广泛应用,有望促进高危MASH的早期发现和干预,从而改善患者预后。该模型已封装为易于使用的在线应用程序,便于临床医生进行个体化风险评估。未来的前瞻性多中心研究将进一步验证其普适性和临床效用。