
-
生物通官微
陪你抓住生命科技
跳动的脉搏
利用免疫学和临床病理学特征结合机器学习技术,预测乳腺癌患者的腋窝淋巴结转移情况
《Breast Cancer Research》:Leveraging immune and clinicopathological profiles with machine learning to predict axillary lymph node metastasis in breast cancer patients
【字体: 大 中 小 】 时间:2026年05月10日 来源:Breast Cancer Research 5.6
编辑推荐:
摘要 背景 乳腺癌是女性癌症相关死亡的主要原因,当肿瘤细胞扩散到附近的淋巴结(尤其是腋窝淋巴结,ALN)时,死亡率会增加。尽管有一些研究预测患者在诊断时已经出现ALN转移(pdALN+),但很少有研究探讨ALN内免疫成分的预后价值。鉴于免疫反应对乳腺癌的影响,本研究开发了一个
乳腺癌是女性癌症相关死亡的主要原因,当肿瘤细胞扩散到附近的淋巴结(尤其是腋窝淋巴结,ALN)时,死亡率会增加。尽管有一些研究预测患者在诊断时已经出现ALN转移(pdALN+),但很少有研究探讨ALN内免疫成分的预后价值。鉴于免疫反应对乳腺癌的影响,本研究开发了一个机器学习模型,以识别与pdALN+最常相关的原发肿瘤和非转移性ALN(ALN?)的临床病理学和免疫特征。
本研究使用了1995年至2008年间诊断出的两组管腔型乳腺癌患者的数据:数据集1包括83名女性(42名pdALN?和41名pdALN+),数据集2包括344名女性(204名pdALN?和140名pdALN+)。使用随机森林算法开发了三种机器学习模型:模型1使用了数据集1的临床病理学数据;模型2使用了数据集1的临床病理学和免疫反应数据;模型3使用了数据集2的临床病理学数据。所有模型都遵循相同的机器学习流程,包括数据预处理、使用递归特征消除和交叉验证进行特征选择、使用随机搜索交叉验证进行算法优化,以及使用Shapley加性解释值来解释结果。在选择了表现最佳的模型后,使用其数据集和特征开发了模型4。最佳特征集是在添加更多特征后模型性能指标开始下降时确定的。
尽管模型3基于更大的患者群体,但模型2的性能优于模型1和模型3。这突显了免疫反应在乳腺癌进展中的关键作用。模型4的中位ROC AUC为0.84,中位准确率为0.76,中位召回率为0.75。值得注意的是,十个预测特征中有九个是免疫相关指标。肿瘤内滤泡树突状细胞标记物CD21+是最具预测性的特征,其预测能力甚至超过了肿瘤直径这一公认的乳腺癌预后因素。因此,它可能成为一个新的生物标志物候选者。
本研究不仅发现了有前景的生物标志物候选者,还强调了在乳腺癌患者分层中纳入诸如介导炎症等机制性特征的重要性。
乳腺癌是女性癌症相关死亡的主要原因,当肿瘤细胞扩散到附近的淋巴结(尤其是腋窝淋巴结,ALN)时,死亡率会增加。尽管有一些研究预测患者在诊断时已经出现ALN转移(pdALN+),但很少有研究探讨ALN内免疫成分的预后价值。鉴于免疫反应对乳腺癌的影响,本研究开发了一个机器学习模型,以识别与pdALN+最常相关的原发肿瘤和非转移性ALN(ALN?)的临床病理学和免疫特征。
本研究使用了1995年至2008年间诊断出的两组管腔型乳腺癌患者的数据:数据集1包括83名女性(42名pdALN?和41名pdALN+),数据集2包括344名女性(204名pdALN?和140名pdALN+)。使用随机森林算法开发了三种机器学习模型:模型1使用了数据集1的临床病理学数据;模型2使用了数据集1的临床病理学和免疫反应数据;模型3使用了数据集2的临床病理学数据。所有模型都遵循相同的机器学习流程,包括数据预处理、使用递归特征消除和交叉验证进行特征选择、使用随机搜索交叉验证进行算法优化,以及使用Shapley加性解释值来解释结果。在选择了表现最佳的模型后,使用其数据集和特征开发了模型4。最佳特征集是在添加更多特征后模型性能指标开始下降时确定的。
尽管模型3基于较大的患者群体,但模型2的性能优于模型1和模型3。这突显了免疫反应在乳腺癌进展中的关键作用。模型4的中位ROC AUC为0.84,中位准确率为0.76,中位召回率为0.75。值得注意的是,十个预测特征中有九个是免疫相关指标。肿瘤内滤泡树突状细胞标记物CD21+是最具预测性的特征,其预测能力甚至超过了肿瘤直径这一公认的乳腺癌预后因素。因此,它可能成为一个新的生物标志物候选者。
本研究不仅发现了有前景的生物标志物候选者,还强调了在乳腺癌患者分层中纳入诸如介导炎症等机制性特征的重要性。