打开图表查看器 结论: 基于CpG的甲基化特征与岭回归相结合,实现了高度准确的多类癌症分类,并在不同平台上表现出良好的泛化能力。这些发现支持了甲基化分析在CUP诊断和个性化治疗规划中的临床应用价值。
摘要
背景:
原发部位不明的癌症(CUP)是一种转移性恶性肿瘤,其原发部位无法确定,通常导致经验性化疗和较差的治疗效果。DNA甲基化分析已成为提高肿瘤识别和分类的有效工具。通过利用独特的甲基化特征,这种方法可以提高诊断准确性并指导个性化治疗策略。
目的:
开发并验证一种基于特定CpG位点集的癌症类型分类预测模型。
方法:
从TCGA和其他公共数据集中获取了7,476名患者(涵盖21种癌症类型)的甲基化数据(Infinium HumanMethylation450)。数据被分为训练集和测试集。采用结合Shapley值和梯度提升的混合特征选择方法来识别CpG区域,并在测试集上评估模型性能。基于选定的CpG谱型进行Louvain聚类,以探索肿瘤表型并评估异质性与预测性能之间的关联。使用我们机构提供的31例(代表17种癌症类型)的Infinium MethylationEPIC v2.0数据进行了独立验证。 结果:
共选择了1,000个CpG区域。在测试的模型中,岭回归(Ridge regression)表现最佳,训练集的分类准确率(CA)为95.4%,AUC为0.998,F1分数为0.953,Matthews相关系数(MCC)为0.951。测试集的性能分别为:分类准确率94.7%,AUC为0.998,F1分数为0.945,MCC为0.943;独立验证的结果为:分类准确率87.1%,AUC为0.9993,F1分数为0.847,MCC为0.867。无监督分析揭示了20个不同的Louvain簇,突显了不同癌症类型之间的异质性。尽管异质性和纯度与MCC相关,但在调整混杂因素后,回归分析并未证实其独立的预测效应。 引用格式:
Marco A. De Velasco, Kazuko Sakai, Daiki Nakatsu, Seiichiro Mitani, Shuji Minamoto, Takahiro Haeno, Hidetoshi Hayashi, Kazuto Nishio. 利用CpG甲基化特征实现跨平台的多类癌症分类 [摘要]。载于:2026年美国癌症研究协会年会论文集;第1部分(常规摘要);2026年4月17-22日;加利福尼亚州圣地亚哥。费城(PA):AACR;Cancer Res 2026;86(7 Suppl):Abstract nr 3869。 

