《HUMAN MUTATION》:From Variant to Biomarker in NSCLC Immunotherapy Resistance: Multiomics Evidence Chains and Accountable AI Integration
编辑推荐:
免疫检查点抑制剂已成为非小细胞肺癌(NSCLC)治疗管理中的重要组成部分,然而原发性耐药与获得性耐药仍然常见,且仅能被程序性死亡配体1(PD-L1)免疫组织化学和肿瘤突变负荷(TMB)等常规生物标志物部分捕获。耐药现象日益被视为一种多轴功能表型,其形成受抗原性
免疫检查点抑制剂已成为非小细胞肺癌(NSCLC)治疗管理中的重要组成部分,然而原发性耐药与获得性耐药仍然常见,且仅能被程序性死亡配体1(PD-L1)免疫组织化学和肿瘤突变负荷(TMB)等常规生物标志物部分捕获。耐药现象日益被视为一种多轴功能表型,其形成受抗原性与新抗原质量、抗原加工与递呈能力、干扰素(IFN)信号传导与适应性耐药程序、肿瘤-免疫空间组织结构、抑制性髓系/基质生态系统以及限制效应功能的代谢约束共同塑造。多组学分析为将基因组事件锚点转化为可重复、具有机制可解释性的生物标志物输出提供了可行路径,其方式是在基因组学、转录组学、表观基因组学、蛋白质组学和代谢组学之间构建连贯的证据链,并辅以空间检测、数字病理学和影像衍生替代指标。
1. Introduction
1.1. Clinical Expansion of Immune Checkpoint Blockade and Persistent Heterogeneity
文章首先指出,免疫检查点阻断已广泛扩展至非小细胞肺癌(NSCLC)不同分期和不同治疗线别,但临床获益始终存在显著异质性。部分患者可获得持久缓解,而原发性耐药、早期进展以及初始获益后的获得性耐药仍较常见,提示在治疗压力下存在持续的肿瘤-免疫共演化。当前临床主要依赖程序性死亡配体1(PD-L1)免疫组织化学与肿瘤突变负荷(TMB)进行决策,但这两类指标在不同队列、治疗方案和检测平台中的表现并不稳定。PD-L1表达具有可诱导性和空间异质性,且受取样部位、检测时间、肿瘤内变异和抗体克隆影响;TMB则依赖检测面板大小、覆盖范围、测序深度、伪影过滤、胚系变异扣除及校准策略。研究进一步强调,PD-L1与TMB均无法覆盖若干关键耐药决定因素,如抗原加工与递呈完整性、干扰素信号传导能力、肿瘤巢空间可达性、抑制性髓系/基质生态构型及肿瘤微环境中的代谢限制。由此,文章提出应将耐药理解为具有机制锚定的功能表型,而非单一分子维度问题。多组学分析的价值并不在于简单叠加数据层,而在于通过跨层一致性区分稳定生物学信号与队列特异性相关或技术伪影。作者据此提出以遗传变异作为事件锚点,以转录组学、表观基因组学、蛋白质组学和代谢组学共同刻画免疫程序、调控可塑性、执行层状态以及微环境约束,并结合单细胞与空间转录组学、多重免疫组织化学、数字病理学(pathomics)和影像组学(radiomics)解析组织结构和病灶层级异质性。同时,驱动基因改变如EGFR激活突变、ALK融合、ROS1融合、MET外显子14跳跃、RET融合及KRAS突变,以及STK11、KEAP1、TP53、PTEN等共变异,均与不同免疫生态相关,但单纯依赖基因型进行决定性分层并不可靠,更可迁移的路径应是将基因组背景作为先验信息,再通过多组学测量验证功能性免疫状态。
2. Immunotherapy Resistance as a Multiaxis Functional Phenotype
本节将非小细胞肺癌免疫治疗耐药界定为多轴功能表型,认为相较于简单的响应/不响应二分类,这种框架更适合生物标志物开发。首先,抗原性是核心耐药轴之一。尽管新抗原负荷决定免疫可识别性,但TMB不能充分反映新抗原质量与有效递呈,因此只是抗原性的粗略替代指标。真正有效的抗原暴露还取决于新抗原是克隆性还是亚克隆性、突变肽是否被高效加工和递呈,以及其是否在多个病灶中稳定共享。因此,高TMB肿瘤若以亚克隆突变为主,其可操作的克隆性新抗原可能少于低TMB但具有早期主干事件的肿瘤;吸烟相关或载脂蛋白B mRNA编辑酶催化多肽样蛋白(APOBEC)相关突变模式及DNA修复缺陷信号,可能比单一标量TMB更真实地表征抗原景观。其次,抗原加工与递呈能力决定免疫可见性。主要组织相容性复合体I类(MHC Class I)通路完整性,包括人类白细胞抗原I类(HLA Class I)表达与装配机制、β
2-微球蛋白、抗原加工转运体及肽装载复合体,对CD8 T细胞识别至关重要。若这些组分发生遗传破坏、等位基因层面异常或调控性沉默,即可使基于突变的抗原性与真实免疫可见性脱耦。再次,干扰素(IFN)信号传导既支持免疫激活与抗原递呈,也可能诱导适应性耐药程序,如PD-L1上调和其他负性调控环路,因此必须区分“炎症型且可响应”与“炎症型但适应性耐药”状态,单凭PD-L1表达无法完成这一判别。
文章随后强调肿瘤-免疫空间结构的重要性。效应细胞的存在并不等于其能接触恶性肿瘤巢;免疫细胞可能滞留于肿瘤周围基质而无法进入肿瘤巢,表现为“免疫排斥”。基质组织方式、致密细胞外基质、成纤维细胞驱动程序及转化生长因子-β(TGF-β)相关信号可构成物理与信号屏障,从而解释为何整体炎症信号存在而耐药依旧持续。与此同时,抑制性髓系与基质生态系统可通过细胞因子/趋化因子信号、抑制性检查点配体表达、肿瘤抗原隔离及代谢竞争,使肿瘤内效应T细胞虽已浸润但功能失效。代谢约束也是关键维度,包括缺氧、乳酸积累导致的酸化、氨基酸耗竭和脂质代谢重编程等,均可削弱细胞毒活性与增殖能力,并促进抑制性分化。特别是乳酸积累和细胞外酸化可损害T细胞效应功能与细胞因子产生,脂质代谢重构可能同时支持肿瘤适应与免疫失能,而通过犬尿氨酸(kynurenine)通路进行的色氨酸分解代谢则可进一步强化免疫调节程序。综上,多个耐药轴联合表征后,能够构建比任何单一生物标志物更接近真实耐药机制的功能表型,多组学生物标志物开发的目标因此应是建立紧凑、连贯且可外部验证的联合测量体系。
3. Multiomics Evidence Chains From Genetic Variation to Biomarker Outputs
本节系统阐述从遗传变异到生物标志物输出的多组学证据链构建逻辑。作者认为,多组学开发的关键不在于增加维度,而在于为每一数据层指定明确角色。基因组学用于提供机制性先验,识别与抗原性、免疫逃逸及信号能力相关的复发性改变;转录组学与表观基因组学用于判断这些先验是否转化为免疫状态程序或调控可塑性;蛋白质组学用于验证这些程序是否在抗原递呈和信号活性层面真正执行;代谢组学则用于确定肿瘤微环境是否存在缺氧、酸化、营养耗竭或脂质重塑等抑制性约束。最终产出应是跨层、具机制可解释性的生物标志物框架,用于识别主导耐药轴,而非依赖单一替代指标。
在基因组层面,文章指出TMB仅为抗原性的粗略近似,且必须进行显式校准,因为其绝对值与阈值会受检测设计和生物信息学流程影响。吸烟相关突变特征或APOBEC活性可提供新抗原生成机制背景,但只有在跨分析流程可重复并在独立外部队列中带来增量收益时才应纳入模型。更重要的是,抗原性本身不足以解释疗效,基于突变的推断必须辅以“免疫能力”核查,即验证抗原加工/递呈与干扰素应答是否保持完整,并尽可能通过下游表达或蛋白读出进行佐证。EGFR/ALK、KRAS及STK11、KEAP1、TP53等共变异背景,最适合作为引导需重点检测何种耐药轴的先验,而不是直接判定免疫治疗受益。由于克隆性与空间异质性会进一步复杂化解读,文章建议在可行时进行多区域或纵向分析;若不可行,则应采用具克隆性感知的汇总指标并保持审慎解释。
在转录组层面,文章主张采用紧凑且可解释的模块,而非冗长基因列表。这些模块应覆盖干扰素信号、细胞毒效应活性、抗原递呈表达、基质/TGF-β相关排斥、髓系抑制以及肿瘤内在应激或代谢程序,并在总体样本中结合肿瘤纯度校正和保守的去卷积方法使用,以提高跨平台可迁移性。单细胞转录组学与空间转录组学在开发阶段尤为重要,可用于确定特征来源细胞并将其压缩为可在总体或靶向检测中部署的最小标志物集,同时直接验证免疫排斥与生态位结构。表观基因组学则有助于解释在缺乏明显新增编码变异时形成的耐药状态,例如通过DNA甲基化和染色质可及性判断抗原递呈及干扰素程序是被表观抑制还是处于激活预备状态,且这些信号在与转录组程序及蛋白层验证一致时说服力最强。蛋白质组学与数字病理学则提供执行层证据,不仅限于PD-L1,还包括递呈组分、干扰素通路效应子及抑制/抑制性信号的检测,并且更接近可标准化面板。代谢组学可进一步支持乳酸相关酸化、色氨酸-犬尿氨酸通路活性、缺氧相关重编程及脂质重塑等微环境约束,但其受取样与全身性混杂因素影响较大,因此前分析控制极其重要。影像组学则可提供病灶异质性及缺氧/坏死模式等非侵入性补充信息,但应定位为支持性手段,而非分子谱分析的替代。总体而言,作者强调目标不是最大化维度,而是在现实缺失数据情境下构建可靠、简约、可解释的证据集,并以结构化耐药表型而不是PD-L1或TMB单一数值来报告结果。
4. Applying Multiomics to Recurrent NSCLC Immunotherapy Patterns
本节将上述框架应用于非小细胞肺癌免疫治疗中的常见情境,提出更具可操作性的解释模板。核心原则是:基因组发现只是起点线索,只有当下游证据支持其隐含机制时,才能赋予耐药解释。这些下游证据包括免疫激活状态、抗原加工与递呈能力、效应细胞进入肿瘤巢的空间可达性、抑制性髓系/基质程序以及微环境代谢约束。不同基因背景可能更倾向对应不同主导耐药轴,但这些联系应理解为概率性的而非决定性的。
对于EGFR突变或ALK重排肿瘤,临床上通常观察到较低的检查点阻断获益,但其机制并不统一。文章建议从基因组背景和经校准的抗原性替代指标出发,再进一步检查真实免疫状态:若激活信号低且病理上效应细胞浸润稀少,则更支持免疫冷型;若存在一定免疫激活,但免疫细胞在空间上与肿瘤巢分离且基质/排斥信号突出,则更符合“炎症型但排斥型”状态。因此,同一驱动背景中的不同病例应根据主导机制输出不同耐药表型,而非套用统一规则。
对于KRAS突变并伴STK11和/或KEAP1共变异的非小细胞肺癌,回顾性研究中常见抑制和代谢约束占主导的现象,但仅凭基因型仍不足以可靠判断。更可迁移的结论需建立在多层证据一致基础之上,即激活程序减弱、髓系抑制模块富集、空间或病理学上存在排斥或髓系优势特征,以及代谢组学或稳健替代模块提示代谢限制。在这些证据汇聚时,耐药更可能源于抑制性、代谢受限的微环境,而非单纯缺乏检查点靶分子表达。
对于TP53共变异背景,某些队列中可见炎症或干扰素相关信号增强,但疗效差异仍很大。文章提出,应重点区分“炎症型且可达”与“炎症型但适应性耐药”两种状态。若高干扰素活性与高抑制程序并存,且蛋白质组学或病理学显示执行层抑制证据,即使PD-L1很高,也更支持适应性耐药;相反,若抗原递呈能力完整且效应细胞与肿瘤巢空间接近,则更支持具有较高获益可能性的炎症可达型状态。
对于高TMB但无应答的情形,文章进一步说明抗原性并不足够。此类不应答往往更符合抗原加工/递呈受损、干扰素信号功能异常,或空间排斥/抑制结构占主导,而不是突变不足。因此,最有价值的输出不应是“高TMB肿瘤理应应答”,而应是对识别-杀伤链条中限制环节的结构化说明。
对于获得性耐药,作者强调单时间点分析可能产生误导,因为主导机制可能是在治疗压力下新近形成。获得性耐药本质上是动态的肿瘤-免疫共演化过程,单纯基线组织往往无法完整表征。为此,文章提出动态多组学监测可能优于单次基线预测,液体活检与影像随访可用于追踪耐药演进轨迹及新出现的逃逸机制。实践中不一定需要完整重复多组学分析,更可行的是围绕首要假设耐药轴进行聚焦纵向面板监测,如抗原递呈能力下降、新出现的干扰素反应减弱、排斥程序增强、抑制性髓系状态扩张或代谢约束加重等。
5. AI-Based Model Construction for Multiomics Integration in NSCLC Immunotherapy
本节围绕人工智能(AI)在多组学整合中的建模原则展开。作者明确指出,AI整合应被视为模型构建问题,而非单纯追求预测性能。模型目标在于从异质模态中学习可重复的生物状态,在数据不完整时仍保持可靠,并最终压缩为适于临床部署的紧凑、可审计输出。围绕这一目标,模型设计可归纳为三项任务:跨模态学习稳定表征、在模态缺失情境下进行不确定性感知推断,以及将复杂模型蒸馏为兼顾性能和可解释性的最小证据集。
针对模态异质性,文章指出基因组学、转录组学、表观基因组学、蛋白质组学、病理学及代谢组学在尺度、噪声、批次结构和取样偏倚方面差异显著,因此应避免简单特征拼接,以免放大模态主导效应和技术伪影驱动的伪捷径学习。更稳健的方式是先借助适配的编码器学习模态特异嵌入,再在表征层完成对齐或融合;融合策略可采用后期融合集成、门控或注意力融合,或将肿瘤内在信号与免疫状态程序分层处理的层级架构。尽管当前多模态融合的可解释性仍不完全成熟,但文章认为其已并非方法学空白。诸如SHAP等复杂模型事后解释工具,以及概念层和反事实分析,可用于评估模型行为是否具有生物学与临床合理性。不过,这些方法只能作为支持性工具,因为注意力权重本身并不保证解释忠实性,且解释稳定性可能在扰动下下降。基于此,所谓“可问责AI”并不等同于完全透明,而是指模型能够生成可审计、稳健且具临床可解释性的证据轨迹。
对于现实世界中常见的模态缺失问题,文章强调必须在训练和评估阶段内生性处理。多组学完整样本在非小细胞肺癌队列中并不常见,且缺失往往具有系统性,受组织量、标本质量、成本和临床时效驱动。若仅使用完整病例训练,模型通常会高估性能并在部署时失效。因此,建模时应采用模态丢弃、专家混合或可接收可变模态集合的条件融合架构,并输出经校准的不确定性估计,以便对低置信度预测进行加测或保守解读。插补可以用于辅助分析,但不能替代不确定性感知推断,也不应掩盖关键证据缺失的事实。作者进一步提出“优雅降级”策略:当仅有核心模态时,模型输出基础证据集;当确认性模态可用且与之相符时,则提高置信度并细化耐药表型。
在转化层面,文章认为真正进入临床的通常不是大型多模态网络本身,而是由其识别出的稳定信号载体。通过特征归因、约束建模和稳定性选择,可筛选出在平台漂移和批次扰动下仍持续存在的特征,再将其蒸馏为最小证据集。这类证据集通常整合经校准的抗原性与突变过程特征、免疫能力核查、少量激活/排斥/抑制模块以及若干执行层或约束层确认指标,从而降低操作负担、提高可重复性并促进外部复现。模型评估则不应仅报告区分度指标,而应按部署场景开展压力测试,包括跨平台迁移、中心偏移、肿瘤纯度和细胞组成变化以及现实缺失模态模式,并明确报告校准表现、失败模式与适用边界。文章最后强调,在非小细胞肺癌免疫治疗中,AI的真正价值在于帮助构建可迁移、可解释的多组学生物标志物,而不是在单一队列中追求最高性能。与此同时,作者也指出实际应用仍受组织量有限、检测异质性、批次效应、成本、周转时间、高维小样本过拟合及不完整模态等持续挑战限制,因此更现实的路径是从广泛发现性谱分析逐步过渡到与常规病理和分子流程兼容的低负担紧凑面板,并辅以模态感知标准化、缺失感知模型架构、受生物学约束的特征选择、跨平台/跨中心压力测试及前瞻性验证。
6. Conclusions
结论部分指出,非小细胞肺癌免疫治疗耐药最适合被表征为由遗传变异、免疫能力、适应性耐药程序、空间结构、抑制性生态系统和代谢约束共同塑造的多轴功能表型。多组学分析使遗传事件能够作为机制假设被解释,并通过跨基因组学、转录组学、表观基因组学、蛋白质组学和代谢组学的连贯证据链,结合空间检测、数字病理学和影像衍生替代指标,转化为可迁移的生物标志物。人工智能(AI)在支持稳定状态表征、面向不完整数据的不确定性感知推断以及向最小证据集的有纪律压缩时,可进一步增强这一过程。文章最终强调,跨层一致性、可解释性和外部可迁移性,仍是与可重复表现和可信机制推断最直接相关的评价标准;未来进展的关键,较少在于继续增加特征维度,而更多在于严格校准、经压力测试的验证、耐药演化轨迹的纵向建模,以及与临床流程相匹配的简约测量面板构建。