基于多组学与机器学习整合解析黄曲霉毒素B1在乳腺癌中潜在致癌机制及新型标志物发现

《Scientific Reports》:Integrative transcriptomic and machine learning framework reveals candidate genes and potential mechanisms of aflatoxin B1 exposure in breast cancer

【字体: 时间:2026年02月15日 来源:Scientific Reports 3.9

编辑推荐:

  本研究为阐明环境致癌物黄曲霉毒素B1(AFB1)在乳腺癌发生发展中的分子机制与潜在生物标志物,研究人员通过整合转录组学、共表达网络分析(WGCNA)、免疫微环境、转录因子调控网络以及空间和单细胞转录组学等多组学方法,结合机器学习筛选,最终确立了包含EGFR、MIF、MET、PPARG、MME、NQO2和NR3C2在内的7个核心标志物,并构建出高精度(AUC=0.996)的复合分类器,为AFB1暴露相关的乳腺癌风险预测与机制探索提供了新思路与工具。

  
在我们的生活环境中,潜藏着一些看不见的健康威胁。黄曲霉毒素B1(AFB1),一种由特定霉菌产生的强效致癌物,就是其中之一。它常常污染着花生、玉米等农作物,通过饮食进入人体。尽管AFB1已被世界卫生组织列为一级致癌物,并与肝癌等疾病密切相关,但它与全球女性最常见的恶性肿瘤——乳腺癌之间的关联,其背后具体的生物学通路却如同一团迷雾,尚未被清晰地揭示。为什么有的暴露会增加患癌风险?它究竟如何在细胞层面“作祟”?为了解开这些谜题,并探寻潜在的风险预测与干预靶点,一项发表于《Scientific Reports》的研究,通过一套创新的整合分析框架,为我们点亮了前行的路灯。
为了回答这些问题,研究人员主要运用了转录组学分析、共表达网络分析(WGCNA)、免疫微环境表征、转录因子调控网络分析、空间转录组学和单细胞转录组学。通过构建机器学习分析流程,对潜在的生物标志物进行筛选和模型优化。
研究结果
1. 基因模块与生物标志物筛选
研究人员通过综合分析,在AFB1预测靶点与疾病相关表达模块的交集中,识别出22个候选基因。经过进一步的机器学习模型(包括glmBoost和StepGLM算法)优化与筛选,最终提炼出一组包含7个基因的高置信度核心生物标志物组合,分别是:EGFR、MIF、MET、PPARG、MME、NQO2和NR3C2
2. 高性能预测模型的建立
利用上述7个标志物构建的复合分类器表现出了卓越的区分能力。该模型在受试者工作特征曲线下的面积达到0.996,显示出极高的预测准确性。
3. 模型可解释性与基因功能倾向
研究者采用SHAP可解释性方法对模型决策过程进行解读。分析表明,在这组标志物中,PPARG可能扮演着保护性角色,而MIF则显示出促进风险的特征。这为理解这些基因在AFB1致癌过程中的具体功能提供了初步线索。
4. 表达异质性分析
通过单细胞和空间转录组学技术,研究团队进一步观察到这组标志物基因的表达在不同细胞亚群和肿瘤组织空间区域中存在显著的异质性,提示AFB1的影响可能具有细胞类型和微环境特异性。
结论与讨论
本研究的结论清晰地指出,通过整合多组学数据与先进的计算生物学方法,成功构建了一个能够深刻解析AFB1在乳腺癌中潜在作用机制的分析框架。该研究不仅识别出一组由7个基因构成的、具有高判别效能的潜在生物标志物组合,为AFB1暴露相关的乳腺癌风险无创评估提供了新的工具;更重要的是,通过可解释的机器学习模型,揭示了PPARG和MIF等关键因子可能发挥的相反作用,为理解AFB1如何“编程”细胞命运、驱动肿瘤发生提供了具体的分子线索。空间和单细胞层面的表达异质性分析,进一步将研究视野从组织平均水平延伸至细胞微环境,提示未来的干预策略可能需要更具针对性。这项工作的意义在于,它超越了传统的单一维度研究,展示了一种系统性的、数据驱动的范式,如何能够有效地将环境暴露因素与复杂的疾病生物学连接起来,不仅深化了我们对AFB1这一特定环境致癌物致癌机制的认识,也为更广泛的环境健康与肿瘤学交叉研究提供了可借鉴的方法论。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号