《Journal of Genetics and Genomics》:Single-nucleotide transcription start sites profiling via Nascent Strand-Specific RNA sequencing uncovers IFN-γ-induced promoter dynamics
编辑推荐:
转录起始位点(TSS)精准定位对解析基因调控至关重要,但传统RNA-seq存在时空分辨率不足的问题。本研究提出新型转录组测序技术NSS-seq,通过RNA-DNA复合物富集与模板转换技术,直接捕获RNA 5'端,实现单核苷酸精度的TSS动态追踪。经验证,NSS-seq在IFN-γ刺激模型中成功揭示短时基因激活模式,克服了现有方法的时空局限性,为研究细胞响应机制提供高效工具。
孙凯|沈吕茂|王俊丽|郑家豪|张旭|罗福成|陈凯|宋宁
中国云南省昆明市昆明科技大学灵长类转化医学研究所灵长类生物医学研究国家重点实验室,邮编650500
摘要
转录调控是一个高度动态的过程,新生RNA提供了转录活动的最直接读数。因此,精确绘制转录起始位点(TSSs)对于理解启动子结构和基因调控至关重要,但这在技术上仍然具有挑战性。在这里,我们介绍了新生链特异性RNA测序(NSS-seq),这是一种强大且简化的方法,用于全基因组范围内分析新生RNA的5′端。通过直接捕获转录起始事件,NSS-seq克服了传统RNA-seq所固有的时间延迟问题,实现了对转录动态的时间分辨研究。应用于干扰素-γ(IFN-γ)刺激实验后,NSS-seq揭示了以前未被识别的IFN-γ响应基因以及干扰素介导的肿瘤抑制功能背后的瞬时转录因子激活模式。总体而言,NSS-seq为解析细胞响应过程中的启动子级调控动态提供了一个经济高效且技术上可行的平台。
引言
基因表达本质上是一个高度动态的过程。虽然总RNA分析能够提供关于转录调控的宝贵见解,但它往往无法捕捉快速或短暂的变化。传统的RNA-seq测量的是稳态RNA水平,反映的是RNA合成与降解之间的平衡,而不是实时的转录活动(Paulsen等人,2014年)。在研究对刺激(如小分子干扰或应激信号)的快速响应时,这一局限性尤为明显,因为延迟检测可能会掩盖主要的转录效应(Bhatt等人,2012年)。新生RNA测序通过选择性地捕获新合成的转录本,提供了对转录动态的直接窗口(Churchman和Weissman,2011年)。
然而,由于新生RNA的丰度低和半衰期短,其分析面临技术障碍。目前的方法大致可以分为代谢标记和基于RNA聚合酶II(RNAPII)的富集技术。代谢标记方法,如SLAM-seq和Bru-seq,在转录过程中加入核苷酸类似物(Paulsen等人,2014年;Herzog等人,2017年;Muhar等人,2018年)。然而,这些方法需要较长的标记时间(通常为数小时),限制了时间分辨率,并且无法捕获短寿命的RNA(Cardiello等人,2019年)。基于RNAPII的方法,包括GRO-seq、PRO-seq和NET-seq,通过单核苷酸分辨率对延长中的聚合酶3′端进行测序来定位它们(Core等人,2008年;Kwak等人,2013年;Nojima等人,2015年;Mahat等人,2016年)。GRO-seq和PRO-seq依赖于体外转录延伸反应,这些反应容易受到实验条件和聚合酶停滞的影响(Core等人,2012年;Weber等人,2014年)。相比之下,原生延长转录本(NET)测序使用RNAPII抗体直接从染色质中分离新生RNA-RNAPII-DNA复合物,保持了延长转录本在其天然环境中(Churchman和Weissman,2011年,2012年)。尽管如此,抗体的性能和染色质纯化效率的变异性可能会影响重复性(Mahat等人,2016年;Mylonas和Tessarz,2019年)。尽管存在这些限制,但在高盐、去污剂和尿素等恶劣生化条件下,RNA-DNA-RNAPII复合物的固有稳定性为新生RNA的分离提供了坚实的基础(Wuarin和Schibler,1994年;Mayer和Churchman,2016年)。这种固有的稳定性不仅巩固了基于NET的方法作为新生转录本研究的基石,还表明其不断优化的衍生物有望提高时空分辨率和重复性,从而更有效地阐明转录动态。
虽然大多数新生RNA-seq方法主要解析转录本的3′端,但它们固有的3′端偏倚需要补充的5′端捕获策略,以实现精确的全基因组转录起始位点(TSSs)映射(Adiconis等人,2013年),这对于理解启动子结构和调控机制至关重要。TSSs的失调与多种疾病有关,从癌症到发育障碍,这突显了精确TSS分析的必要性(Mihailovich等人,2007年;Boyd等人,2018年)。现有的5′端捕获方法,包括寡核苷酸加帽、基因表达的帽分析(CAGE)和模板转换,需要在特异性、输入需求和技术复杂性之间进行权衡(Zhu等人,2001年;Shiraki等人,2003年;Core等人,2008年)。例如,高级方法如GRO-cap和PRO-cap结合了延伸转录和寡核苷酸加帽,但在内含子区域存在高假阳性率的问题(Core等人,2014年;Adiconis等人,2018年)。CAGE提供了单核苷酸分辨率的TSS定位,但需要大量的RNA输入(≥5 μg)和复杂的工作流程(Hirabayashi等人,2019年)。模板转换逆转录(TSRT)在单细胞RNA-seq中广泛使用,简化了5′端捕获,但可能会引入寡核苷酸二聚化和过度PCR扩增的伪影(Kapteyn等人,2010年;Turchinovich等人,2014年)。最近在TSO设计和协议优化方面的改进部分缓解了这些限制(Policastro等人,2020年)。然而,将这些改进策略应用于新生RNA进行TSS分析的效果尚未得到充分研究,其在动态转录环境中的有效性仍不清楚。
细胞因子干扰素-γ(IFN-γ)激活转录程序,以抵御细菌和病毒感染,同时维持关键的肿瘤监视功能(Schneider等人,2014年)。在肿瘤微环境中,IFN-γ具有双重作用。一方面,它与颗粒酶B和穿孔素合作,通过caspase依赖途径诱导肿瘤细胞凋亡(Tau等人,2001年;Maimela等人,2018年);另一方面,IFN-γ促进免疫检查点分子的上调,导致免疫抑制环境(Angelova等人,2015年;Mojic等人,2017年)。虽然IFN-γ信号传导的核心成分(如JAK-STAT通路)已经得到充分研究,但响应微环境信号调节基因表达的染色质重塑过程仍知之甚少。
为了克服这些限制,我们开发了新生链特异性RNA测序(NSS-seq),该方法结合了RNA-DNA-RNAPII复合物的纯化和优化的模板转换技术,以实现精确的5′端捕获。与现有方法相比,NSS-seq减少了细胞输入需求,使得在样本量有限的条件下也能进行转录分析。其简化的协议可以在标准分子实验室中在一天内完成。通过与已建立的新生转录本和5′端映射方法(包括NET-CAGE、CAGE、GRO-cap和PRO-seq)的系统对比,我们验证了NSS-seq在捕获新生RNA和识别转录起始位点方面的可靠性和准确性(Core等人,2014年;Hirabayashi等人,2019年;Steinparzer等人,2019年)。应用于干扰素-γ(IFN-γ)信号传导和Mediator激酶抑制模型,NSS-seq解析了刺激特异性的启动子使用情况和转录因子的时间活性。总体而言,这项研究确立了NSS-seq作为一个多功能平台,能够在单核苷酸分辨率下解析转录起始和启动子调控。
NSS-seq的开发
我们开发了NSS-seq,这是一种用于高分辨率映射新生RNA 5′端的简化方法。基于RNA-DNA-RNAPII复合物的固有稳定性(Mayer等人,2015年),我们采用了一种优化的模板转换逆转录(TSRT)策略,使用低至100 ng的新生RNA即可高效捕获转录起始位点(图1A)。细胞在含有尿素的缓冲液中裂解以分离RNA-DNA-RNAPII复合物,随后进行染色质DNA消化
讨论
在这项研究中,我们介绍了NSS-seq,这是一种基于新生RNA的简化测序策略,能够实现单核苷酸分辨率的全基因组TSSs分析。通过选择性地富集加帽的、正在转录的以及含有内含子的RNA,NSS-seq准确地再现了典型的TSS特征,如Y-1R+1基序和特征性的二核苷酸频率模式(Zhang和Dietrich,2005年)。与已建立的TSS捕获方法进行系统对比后,证明NSS-seq能够
细胞培养
人类结直肠癌细胞系HCT116在37°C、5% CO2条件下,在Dulbecco改良的Eagle培养基(DMEM)中培养,添加10%胎牛血清(FBS)和1%青霉素-链霉素。细胞因子和抑制剂
使用人干扰素-γ(Gibco,PHC4031)以10 ng/ml的浓度刺激HCT116细胞。在IFN-γ刺激前1小时,加入Cortistatin A(MedChemExpress,HY-122586)以100 nM的浓度。经过45分钟、90分钟、180分钟、360分钟和720分钟的IFN-γ处理后,收集HCT116细胞。
新生RNA提取
细胞
代码可用性
所有数据分析的代码可在GitHub上获取(
https://github.com/lnarwhale/NSS-Seq.git)。
未引用参考文献
Davuluri等人,2008年;Grob等人,2001年;Hao等人,2019年。
数据可用性
本文报告的原始序列数据已存放在国家基因组数据中心(Bao等人,2025年)的基因组序列档案库(Zhang等人,2025年)中,该数据库由中国国家生物信息中心/中国科学院北京基因组研究所(GSA-Human: HRA016577)公开提供,访问地址为
https://ngdc.cncb.ac.cn/gsa-human。
CRediT作者贡献声明
孙凯:方法学、数据管理、研究、验证、可视化、初稿撰写、审稿与编辑。沈吕茂:数据管理、初稿撰写、可视化。王俊丽和郑家豪:研究、验证。张旭:资源准备、审稿与编辑、资金获取。罗福成:资源准备、审稿与编辑。陈凯手稿准备过程中生成式AI和AI辅助技术的使用
在准备这项工作时,作者使用了ChatGPT来润色语言。使用该工具后,作者根据需要审查和编辑了内容,并对出版物的内容负全责。致谢
本研究得到了国家自然科学基金(编号32270560)、南方海洋科学与工程广东实验室(项目编号YQ2024004)、云南省自然科学基金(编号202102AA100053)以及山东省自然科学基金(编号ZR2023MC091)的支持。