集成学习(Ensemble Learning)揭示青藏高原人群早期骨质疏松症预测的新型代谢组生物标志物

《Metabolism Open》:Ensemble Learning Uncovers Novel Metabolomic Biomarkers for Early Osteoporosis Prediction in Tibetan Plateau Populations

【字体: 时间:2026年06月06日 来源:Metabolism Open 2.7

编辑推荐:

  背景:骨质疏松症(Osteoporosis)是中老年人常见的代谢性骨病,其预防和早期检出对临床及公共卫生具有重要意义。现有研究多关注低海拔人群,高原地区因独特环境面临特殊挑战。方法:于西藏拉萨纳入177名成年居民,收集人口学特征、健康状况及女性生殖参数。骨质疏

  
背景:骨质疏松症(Osteoporosis)是中老年人常见的代谢性骨病,其预防和早期检出对临床及公共卫生具有重要意义。现有研究多关注低海拔人群,高原地区因独特环境面临特殊挑战。方法:于西藏拉萨纳入177名成年居民,收集人口学特征、健康状况及女性生殖参数。骨质疏松症诊断采用T值≤-2.5(>50岁男性及绝经后女性)或Z值≤-2(≤50岁男性及绝经前女性)。血清代谢组学通过高效液相色谱-串联质谱(HPLC-MS/MS)鉴定3381种代谢物。采用最小绝对收缩和选择算子(LASSO)及随机森林(Random Forest, RF)集成学习算法构建预测模型,并于MetaboAnalyst中进行通路富集分析(P<0.05)。结果:177名受试者中检出41例(23.2%)骨质疏松症患者,多为绝经后女性(36/41)。基线特征显示两组间年龄、性别、入睡困难(Difficulty Initiating Sleep, DIS)及绝经状态差异均有统计学意义(均P<0.05)。LASSO筛选出的9种代谢物对骨质疏松具卓越预测能力(AUC: 0.995),RF基于10种代谢物能较好预测骨量减少进展(R2: 0.848)。基于Z值的模型优于T值亚组。绝经状态及入睡困难被确定为高危因素;二氢-3-羟基-4,4-二甲基-2(3H)-呋喃酮(Dihydro-3-hydroxy-4,4-dimethyl-2(3H)-furanone)、γ-谷氨酰色氨酸(gamma-Glutamyltryptophan)及双同-γ-亚麻酸(di-homo-gamma-linolenate)作为骨量丢失潜在早期指示物。通路富集提示嘧啶代谢(Pyrimidine metabolism)及相关疾病可能是骨丢失的潜在治疗靶点。结论:本研究提出一种代谢组学驱动的骨质疏松预测模型,为高原地区早期临床干预建立了创新的生物标志物框架。
论文解读:《Ensemble Learning Uncovers Novel Metabolomic Biomarkers for Early Osteoporosis Prediction in Tibetan Plateau Populations》
研究背景与立项依据
骨质疏松症(Osteoporosis)是以骨量减低和微结构破坏为特征的全身性代谢性骨病,易导致骨折,严重危害中老年健康。目前临床依赖双能X线吸收测定法(DXA)测量骨密度(Bone Mineral Density, BMD)进行诊断,但难以实现早期筛查,且缺乏基于个体代谢维度的有效预测生物标志物。现有预测框架主要针对低海拔人群,而青藏高原等高海拔地区存在低氧、低温及强紫外线等独特环境应激,可能加剧骨丢失,该人群尚缺乏适用的早期骨质疏松预测模型。因此,研究人员通过开展拉萨地区人群横断面调查,整合BMD与血清代谢组学,旨在识别特异性代谢标志物并建立高危人群的早期骨质疏松风险预测模型。
主要技术方法
研究人员于2023年7—8月在西藏拉萨开展横-sectional study(横断面研究),初始纳入202名成人,排除骨折史、影响骨代谢的慢性病及用药史、基线资料不全者后,最终177人纳入分析。采集人口学、健康档案(含入睡困难Difficulty Initiating Sleep, DIS)及女性生殖参数,用Sunlight Miniomni超声骨密度仪测左桡骨远端T值和Z值并按WHO标准分型。采集空腹血清,经蛋白沉淀处理后采用HPLC-MS/MS(HPLC-MS/MS, High Performance Liquid Chromatography-Tandem Mass Spectrometry)检测代谢物,保留RSD<30%的3381种代谢物。先用单变量线性回归初筛与Z/T值显著相关的代谢物,再分别构建分层LASSO回归(二分类,用于骨质疏松诊断预测)和连续LASSO回归(用于骨量减少预测),以及随机森林(Random Forest, RF)回归模型评估代谢谱与BMD关联,变量重要性以%IncMSE衡量。显著性代谢物于MetaboAnalyst 5.0行KEGG通路富集分析(Holm-Bonferroni校正P<0.05)。
研究结果
3.1. Baseline Characteristics(基线特征)
177名受试者平均年龄53岁,骨质疏松组41例(23.2%),其中87.8%为女性。组间比较显示年龄、性别、体重指数(Body Mass Index, BMI)、教育程度、婚姻状况、DIS及女性绝经状态差异均有统计学意义(P<0.05),提示绝经和睡眠启动困难为高危因素。
3.2. Screening of Metabolic Biomarkers(代谢生物标志物初筛)
经单变量线性回归,Z值亚组(n=79)筛选出105种与Z值显著相关的代谢物,T值亚组(n=123)筛选出132种与T值显著相关的代谢物,供后续建模使用。
3.3. Filter of Markers for Osteoporosis Using Hierarchical LASSO Regression(基于分层LASSO回归筛选骨质疏松标志物)
基于Z值亚组105种代谢物及临床变量构建分层LASSO模型(λ=0.02857168),纳入9个关键变量(含γ-谷氨酰色氨酸gamma-Glutamyltryptophan、乳清苷酸Orotidylic acid等),对骨质疏松vs非骨质疏松判别AUC达0.995,准确率0.962。T值亚组LASSO模型(λ=0.05975626)纳入18个变量(性别、DIS及代谢物),AUC为0.944,表明Z值模型预测效能更优。
3.4. Identification of Early Markers of Osteopenia Based on LASSO Regression(基于LASSO回归识别骨量减少早期标志物)
将Z/T值作为连续变量行LASSO线性拟合。Z值连续模型(λ=0.04188124,28变量)R2=0.818;T值连续模型(λ=0.08051736,46变量)R2=0.807,提示代谢谱可较好预测骨密度变异,DIS、绝经状态及特定代谢物与BMD下降相关。
3.5. Markers of Osteoporosis Predicted by Random Forest Regression(随机森林回归预测的骨质疏松标志物)
RF模型基于Z值数据集R2=0.848(MSE=0.442),重要代谢物包括4-甲基十四烷酰肉碱(4-Methyltetradecanoylcarnitine)、二氢-3-羟基-4,4-二甲基-2(3H)-呋喃酮(Dihydro-3-hydroxy-4,4-dimethyl-2(3H)-furanone)及双同-γ-亚麻酸(di-homo-gamma-linolenate, DGLA, 20:3n-6)等。T值数据集RF模型R2=0.849但MSE较大。LASSO与RF共同筛选出γ-谷氨酰色氨酸、二氢-3-羟基-4,4-二甲基-2(3H)-呋喃酮及双同-γ-亚麻酸为跨方法一致的关键早期骨丢失候选标志物。
3.6. Enrichment Analysis of Metabolic Biomarkers(代谢生物标志物富集分析)
Z值亚组共有4种重叠代谢物(gamma-Glutamyltryptophan、Orotidylic acid等),富集分析显著富集嘧啶代谢(Pyrimidine metabolism)、嘧啶生物合成等通路;T值亚组11种共有代谢物显著富集丙酸代谢(Propanoate metabolism)、支链氨基酸分解代谢及嘧啶分解代谢。嘧啶代谢及相关疾病在Z/T值亚组中均显著富集,提示其在骨量降低中的潜在核心作用。
讨论与结论翻译
本横断面研究通过分析拉萨177名居民的血清代谢组与BMD数据,整合集成学习算法阐明骨质疏松进展中的代谢异质性。Z值亚组分层LASSO(AUC=0.995)和RF(R2=0.848)均展现优异预测性能,优于T值亚组,可能与该亚组(≤50岁男性及绝经前女性)内分泌及代谢稳态较稳定有关。研究人员鉴定出γ-谷氨酰色氨酸、二氢-3-羟基-4,4-二甲基-2(3H)-呋喃酮及双同-γ-亚麻酸作为预测早期骨丢失向临床骨质疏松转化的关键候选代谢物。乳清苷酸(Orotidylic acid)提示嘧啶代谢紊乱参与早期成骨受损;苯醌乙酸(Benzoquinoneacetic acid)及5-羟基癸-7-烯酰肉碱(5-Hydroxydec-7-enoylcarnitine)在老年亚组关联显著。嘧啶代谢通路跨亚组富集支持其作为骨稳态调控及潜在治疗靶点的价值。绝经后女性为高危人群,雌激素骤降致骨吸收大于骨形成;DIS亦为值得关注的预警信号。研究局限包括样本量偏小、横断面设计无法推断因果、缺乏独立外部验证队列等,需未来大样本多中心纵向研究确认。
结论(Conclusions)部分原文意译:
综上,本研究利用集成学习从西藏人群血清中鉴定出15种评估早期骨质疏松的关键代谢物(如gamma-Glutamyltryptophan和di-homo-gamma-linolenate),揭示了早期骨质疏松/骨量减少的新型分子特征。富集到的嘧啶代谢等通路可能为骨质疏松提供新治疗靶点。所提生物标志物及通路需独立队列外部验证。结果提示绝经后女性及入睡困难人群为高原地区骨质疏松高危群体。本研究建立的代谢预测框架为高原地区骨质疏松早期预防与管理提供了新参考。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号