《Nature Communications》:Machine learning-predicted insulin resistance is a risk factor for 12 types of cancer
编辑推荐:
本期推荐的研究通过一项大规模人群队列分析,利用机器学习模型(AI-IR)预测胰岛素抵抗,发现预测的胰岛素抵抗不仅是糖尿病的强风险因素,还与子宫癌、肾癌、食管癌等12种癌症的发病率升高显著相关。该研究为利用常规临床指标进行多疾病风险分层提供了新策略,论文发表于《Nature Communications》。
在现代社会,糖尿病和肥胖症的流行已成为全球性的公共卫生挑战。这两者不仅是心血管疾病的“元凶”,越来越多的证据还指向它们与多种癌症的风险增加有关。科学家们推测,连接糖尿病和肥胖的“桥梁”——胰岛素抵抗,可能是背后关键的驱动因素。然而,要在大规模人群中直接验证这一假设却困难重重。因为精准评估胰岛素抵抗的“金标准”方法(高胰岛素-正葡萄糖钳夹试验)操作复杂,无法在常规临床中开展;而常用的替代指标(如HOMA-IR)又依赖不易常规检测的空腹胰岛素水平。这就导致了一个核心困境:我们怀疑胰岛素抵抗是癌症的风险因素,却缺乏在人群层面进行大规模流行病学研究的有效工具。那么,能否找到一种更简便、可利用常规体检数据的方法来评估胰岛素抵抗,并在此基础上探究其与癌症的真实关联呢?
为了回答这个问题,研究团队将目光投向了一项宝贵资源——英国生物银行(UK Biobank)大型队列。他们应用了一项先前开发的机器学习预测模型,该模型仅需年龄、性别、种族、身体质量指数(BMI)、空腹血糖(FPG)、糖化血红蛋白(HbA1c)、甘油三酯(TG)、总胆固醇和高密度脂蛋白胆固醇(HDL)这九项常规临床参数,就能预测个体是否存在胰岛素抵抗(定义为HOMA-IR>2.5)。这个模型被称为人工智能衍生的胰岛素抵抗(AI-IR)。本研究的主要目的,就是将AI-IR应用于UK Biobank队列,系统评估预测的胰岛素抵抗与糖尿病、心血管事件以及多种癌症发病率之间的关联,并将其预测效能与身体质量指数(BMI)、代谢综合征(MetS)等传统指标进行比较。
研究人员开展本研究主要依赖于几个关键技术方法:首先,他们利用已建立的机器学习(XGBoost)模型,基于九项临床参数计算每个参与者的AI-IR状态。其次,研究的核心数据来源于UK Biobank大型前瞻性队列,该队列链接了英国国民医疗服务体系(NHS)的医疗记录,用于长期追踪疾病发病率。最后,统计分析采用了逻辑回归(用于糖尿病发病率)、Cox比例风险模型(用于癌症和心血管事件的时间-事件分析)以及Kaplan-Meier生存曲线,以比较不同风险组间的累积发病率差异。
机器学习预测的胰岛素抵抗与糖尿病、心血管疾病和死亡率的较高风险相关
研究首先在基线无糖尿病的参与者中验证了AI-IR的预测能力。结果发现,AI-IR阳性者发生糖尿病的风险显著高于阴性者(比值比OR=7.31)。即使考虑不同空腹时间,此关联依然稳健。同时,AI-IR阳性也与更高的心血管事件(如3点主要不良心血管事件MACE)、心血管死亡和全因死亡风险相关。重要的是,即使在调整了BMI之后,AI-IR与糖尿病和MACE的关联仍然显著,说明该模型能捕捉到独立于BMI的胰岛素抵抗效应。
机器学习预测的胰岛素抵抗相比既往报告的指标能实现更好的糖尿病风险分层
研究人员将AI-IR与BMI、代谢综合征(MetS)、甘油三酯与高密度脂蛋白胆固醇比值(TG/HDL)、甘油三酯-葡萄糖指数(TyG)等传统指标进行比较。受试者工作特征曲线(ROC)分析显示,AI-IR预测糖尿病发病的曲线下面积(AUC)最高(0.798),优于其他所有指标。分层分析进一步揭示,单纯高BMI(≥30)但AI-IR阴性者,糖尿病风险并未显著增加;而AI-IR阳性者,无论BMI高低,其糖尿病风险都显著增高。这表明AI-IR能有效区分“代谢健康型肥胖”和“代谢不健康型肥胖”,提供了更精准的风险分层。
机器学习预测的胰岛素抵抗对癌症发病率的影响
这是本研究的核心发现。通过分析基线无癌症的参与者,研究人员发现AI-IR与特定癌症的发病率升高显著相关。在经过Bonferroni多重检验校正后,AI-IR与以下六种癌症的风险增加显著相关:子宫癌(风险比HR=2.340)、肾癌(HR=1.557)、食管癌(HR=1.464)、胰腺癌、结肠癌和乳腺癌。此外,AI-IR还与另外六种癌症(肾盂癌、小肠癌、胃癌、肝胆癌、白血病、支气管和肺癌)的发病率存在名义上的正相关。有趣的是,AI-IR还与皮肤癌的风险降低相关。当把风险随AI-IR升高的10种癌症(共病癌症)合并分析时,AI-IR阳性者的发病风险比阴性者高出25%(HR=1.25)。
机器学习预测的胰岛素抵抗对癌症发病率的BMI依赖性和非依赖性影响
由于BMI是AI-IR模型中最重要的特征,研究进一步分析了在调整BMI后,AI-IR与癌症的关联有何变化。对于多数癌症(如肾盂癌、胃癌、胰腺癌、结肠癌、乳腺癌等),AI-IR的效应在调整BMI后减弱或不再显著,表明其影响在很大程度上依赖于BMI。然而,一个关键的发现是,对于支气管和肺癌,在调整BMI后,AI-IR的正向关联反而变得更强且更显著(HR从1.14升至1.33),提示存在独立于BMI的效应。进一步分析发现,这种效应在既往吸烟者中最为明显。
机器学习预测的胰岛素抵抗相比既往报告的指标能实现更好的癌症风险分层
与糖尿病风险分层的结果类似,在预测共病癌症风险时,AI-IR的预测能力优于BMI和TyG指数,与MetS和TG/HDL比值相当。重要的是,单纯高BMI(≥30)但AI-IR阴性并未增加共病癌症风险,而AI-IR阳性则显著提高了风险,再次证明了AI-IR在肥胖人群中识别高风险个体的价值。
结论与讨论
本研究通过将机器学习预测的胰岛素抵抗(AI-IR)模型应用于UK Biobank大型队列,首次在大规模人群中系统证实了预测的胰岛素抵抗是多种癌症(共12种)的独立风险因素。AI-IR不仅对糖尿病具有最优的预测效能,其对一系列癌症(定义为“共病癌症”)的风险预测能力也优于或等同于传统指标如BMI和TyG指数。研究揭示了AI-IR的效应既包含通过BMI介导的部分,也包含独立于BMI的部分,后者在肺癌风险中尤为突出。
这项研究的重大意义在于,它提供了一种实用的“数字生物标志物”——AI-IR。利用常规、易得的九项临床参数,AI-IR能够整合多维度的代谢异常信息,生成一个单一的、强大的风险评分。这使得在临床实践中识别出那些具有高胰岛素抵抗、进而面临糖尿病、心血管病和多种癌症高风险的人群成为可能。对这些高风险个体进行早期、更密集的监测和针对性筛查,有望实现疾病的早防早治,改善公共卫生结局。尽管研究存在队列年龄和种族相对单一等局限,但它为利用人工智能和常规数据深化对疾病共通病理生理机制的理解,并推动精准预防医学的发展,开辟了富有前景的新路径。