《Cancer Medicine》:Epidemiology of Risk Stratification, Machine Learning Early Prediction Model, and Tumor Suppressive Mechanism of RHBDF2 in Esophageal Cancer in Gansu Province
编辑推荐:
本研究聚焦于中国西北高发区(甘肃省)的食管癌防控难题。为解决早期检测生物标志物匮乏、风险因素复杂及区域分布差异大等问题,研究团队整合人群流行病学调查、多组学分析与机器学习算法,系统评估了甘肃省食管癌流行病学特征与风险因素,成功构建了高性能早期预测模型,并深入探索了潜在生物标志物RHBDF2的肿瘤抑制机制。该研究为高风险区域的食管癌精准预防和早期干预提供了关键证据与实用工具,具有重要的公共卫生意义。
食管癌是全球范围内一个重大的公共卫生挑战,尤其是在中国西北等高发地区,其预后差、五年生存率低的问题尤为突出。甘肃省作为食管癌的高发区,其发病率存在显著的地理差异,且病因复杂,涉及遗传易感性与多种环境暴露因素的交互作用。尽管医学手段不断进步,但食管癌的早期诊断率依然不高,多数患者在确诊时已至晚期,错过了最佳治疗时机。因此,开发有效的早期检测生物标志物和风险评估工具,对于改善食管癌的防治现状、降低疾病负担至关重要。在这一背景下,一项发表于《Cancer Medicine》的研究,通过整合多学科方法,对甘肃省食管癌的流行病学、风险因素、早期预测模型及分子机制进行了系统性的探索。
为了回答上述问题,研究团队主要运用了以下几个关键技术方法:首先,基于甘肃省卫生健康委员会的食管癌健康大数据(2013-2021年,覆盖20,035名患者)以及针对10个代表性县/区(包含汉族、东乡族、保安族、回族、藏族、裕固族等民族)的2129份现场问卷调查数据,进行了大规模的流行病学分析和风险因素调查。其次,利用机器学习算法(包括随机森林、支持向量机、K-近邻等)对问卷调查数据构建了食管癌初级预防风险模型,以筛选关键预测因子。再者,对来自甘肃省不同风险等级地区的食管癌组织和正常组织样本(共计20例)进行了高通量蛋白质组学测序,以筛选差异表达蛋白。最后,结合来自癌症基因组图谱(TCGA)的食管癌(ESCA)队列数据,对筛选出的关键蛋白RHBDF2进行了生物信息学分析,包括差异表达分析、基因集富集分析(GSEA)、免疫微环境分析等,以揭示其潜在功能与机制。
研究结果如下:
4.1 甘肃省流行病学分析(2013-2021年)
通过对甘肃省10个县/区长达9年的数据分析,研究发现食管癌发病率存在明显的地区差异。裕固族自治县是唯一的高风险地区(发病率:54.2/10万),而民勤县、舟曲县、东乡族自治县和皋兰县为中等风险地区,其他县区为低风险地区。病例主要集中在40岁以上人群,且除裕固族自治县外,男性是主要的受累人群。
4.2 食管癌风险区域评估与分类
研究基于2021年人口普查数据和年龄标准化发病率,绘制了食管癌风险等级的地理分布图,清晰展示了高风险区域(裕固县)的独特性。分析还发现,男性在多数县区发病率高于女性,但在裕固县则呈现女性发病率更高的特殊模式。
4.3 与高食管癌风险相关的因素
通过问卷调查分析,研究确定了多种与食管癌风险相关的因素。保护性因素包括健康的饮食(适量摄入红肉/白肉、水果、新鲜蔬菜)、规律运动以及积极情绪。风险因素则包括吸烟、饮酒和高盐饮食。此外,在高风险地区,患者更频繁地出现嗳气、恶心、黑便、吞咽困难、胸痛等临床症状。
4.4 日常习惯与心理情绪健康对食管癌风险的影响
吸烟(包括被动吸烟)、饮酒、饮用可能受污染的湖水/河水与更高的食管癌风险相关。而和谐的婚姻关系、良好的人际关系、积极的情绪调节和A型性格(有雄心、自信)则显示出保护作用。
4.5 构建食管癌初级预防风险模型
研究人员利用64个指标构建了多种机器学习模型。其中,随机森林(Random Forest)模型表现出最佳的预测性能,其受试者工作特征曲线下面积(AUC)达到0.995,准确率为0.960。该模型筛选出胃癌风险分级和每日糖摄入量等关键预测因子。
4.6 RHBDF2通过EMT和KRAS信号抑制食管肿瘤进展
蛋白质组学分析发现,基因RHBDF2在食管癌组织中表达下调,且其表达水平随病理分期升高而降低,与地区风险等级趋势一致。生物信息学分析表明,RHBDF2的低表达与上皮间质转化(EMT)和KRAS信号通路的下调激活相关,提示RHBDF2可能通过抑制这些促癌通路来发挥肿瘤抑制作用,有望成为潜在的诊断生物标志物和治疗靶点。
结论与讨论:
本研究首次系统描绘了甘肃省食管癌的流行病学全景,揭示了其显著的地理和人群差异,特别是明确了裕固族自治县为高风险区且女性发病率异常高的特点。这提示需要针对特定地区和人群制定差异化的防控策略。研究整合传统流行病学与前沿多组学、人工智能技术,成功构建了高性能的早期风险预测模型,为在高风险地区实施精准筛查提供了实用工具。更重要的是,研究在分子层面鉴定出RHBDF2作为一个新的潜在抑癌基因和生物标志物,并初步阐明了其可能通过调控EMT和KRAS信号通路抑制肿瘤进展的机制,为食管癌的早期诊断和靶向治疗提供了新的思路。总之,这项多维度、整合性的研究不仅为理解中国西北高发区食管癌的流行规律和病因提供了扎实的数据支撑,也为推动从“群体预防”到“个体化精准预防”的实践迈出了关键一步,对降低该地区的食管癌疾病负担具有重要的科学价值和公共卫生意义。