《Scientific Reports》:Radiomic features and carotid stenosis in periodontitis a two stage bootstrap and multimodal machine learning study
编辑推荐:
本研究针对牙周炎患者颈动脉粥样硬化(CAS)早期诊断难题,开发了基于锥形束CT(CBCT)影像组学特征的深度学习模型。通过SMOTE过采样和双重bootstrap特征筛选,最终构建的随机森林(RF)模型在五折交叉验证中表现出色(AUC=0.892,灵敏度0.957,特异性0.710),为临床早期筛查提供了有效工具。
牙周炎作为一种常见的慢性炎症性疾病,近年来越来越多的研究表明其与全身性血管疾病存在密切关联。特别是颈动脉粥样硬化(Carotid Atherosclerosis, CAS)作为脑卒中的重要危险因素,在牙周炎患者中的早期检测显得尤为重要。然而,传统的诊断方法存在侵入性强、成本高、依赖专家经验等局限性,迫切需要开发一种无创、精准的早期筛查工具。
在这一背景下,研究人员将目光投向了医学影像领域的新兴技术——影像组学(Radiomics)。影像组学能够从常规医学影像中提取大量定量特征,通过机器学习算法挖掘潜在的疾病生物标志物。锥形束CT(Cone Beam Computed Tomography, CBCT)作为口腔颌面领域的常用影像技术,为实现牙周炎患者颈动脉粥样硬化的无创检测提供了可能。
本研究创新性地将CBCT影像组学与机器学习相结合,旨在开发一个能够早期识别牙周炎患者并发颈动脉粥样硬化的预测模型。研究团队收集了279例观察数据,每个样本包含206个影像组学特征。面对数据不平衡的挑战,研究人员采用合成少数类过采样技术(Synthetic Minority Over-sampling Technique, SMOTE)进行数据增强,将样本量扩展至390例。
在技术方法上,研究采用了双重bootstrap特征筛选策略:首先通过1000次bootstrap抽样,结合Spearman等级相关性和Lasso回归进行初步特征选择;随后对高频出现的特征进行第二轮bootstrap分析,使用逻辑回归(Logistic Regression, LR)结合Akaike信息准则(Akaike Information Criterion, AIC)确定最终特征集。基于筛选出的特征,研究人员构建了三种机器学习模型:逻辑回归(LR)、支持向量机(Support Vector Machine, SVM)和随机森林(Random Forest, RF),并通过五折交叉验证评估模型性能。
特征选择结果
经过1000次bootstrap迭代,研究初步识别出26个出现频率超过500次的高频特征。通过第二轮bootstrap结合AIC准则,最终确定了20个最具预测价值的影像组学特征。这些特征主要反映了颈动脉区域的纹理特征、形态特征和统计学特征,为理解牙周炎与颈动脉粥样硬化之间的关联提供了新的生物学视角。
模型性能比较
三种机器学习模型中,随机森林(RF)表现最为优异,其接收者操作特征曲线下面积(Area Under the Curve, AUC)达到0.892,灵敏度为0.957,特异性为0.710,准确率为0.859。逻辑回归(LR)和支持向量机(SVM)模型也表现出良好的预测能力,但RF模型在各项指标上均优于其他模型。
模型验证与临床适用性
接收者操作特征(Receiver Operating Characteristic, ROC)曲线分析显示,RF模型具有最佳的判别能力。校准曲线表明模型预测概率与实际风险具有良好的一致性。决策曲线分析(Decision Curve Analysis, DCA)进一步证实,RF模型在广泛的风险阈值范围内都能提供较高的净收益,体现了其临床应用的潜在价值。
研究结论表明,基于CBCT影像组学特征的随机森林模型能够有效区分伴发和不伴发颈动脉粥样硬化的牙周炎患者。该模型的高灵敏度(0.957)特别适合用于早期筛查,有助于识别需要进一步专科评估的高风险人群。这一研究成果为牙周炎患者的全身健康管理提供了新的思路,实现了从局部口腔疾病到全身血管健康的桥梁构建。
本研究的创新之处在于将常规口腔影像检查扩展至全身血管风险评估,充分利用了现有医疗资源,避免了额外的检查成本和辐射暴露。随着人工智能技术在医学领域的深入应用,这种基于影像组学的无创筛查方法有望成为牙周炎患者心血管风险评估的标准工具,为预防脑卒中等严重并发症提供重要依据。
未来研究可进一步扩大样本规模,纳入更多临床变量和生物学标志物,提升模型的泛化能力和解释性。同时,前瞻性临床试验将有助于验证该模型在真实世界场景中的实用价值,推动其向临床常规应用的转化。