《SLAS Technology》:Improving genotyped functional screening: A versatile closed-tube PCR for illumina library generation reduces background sequences in multiplexed sequencing
编辑推荐:
研究人员提出了一种改进的DNA索引平台,可对阵列化用于高通量筛选的所有结合蛋白克隆进行基因型-表型关联分析。该方法针对退火温度差异超过10°C的两对引物进行了优化,可在单管封闭体系中完成板与孔ID条形码标记。相较于早期的分层索引策略,该闭管方法将最高丰度序列与
研究人员提出了一种改进的DNA索引平台,可对阵列化用于高通量筛选的所有结合蛋白克隆进行基因型-表型关联分析。该方法针对退火温度差异超过10°C的两对引物进行了优化,可在单管封闭体系中完成板与孔ID条形码标记。相较于早期的分层索引策略,该闭管方法将最高丰度序列与第二高丰度序列的计数比提升了三倍,并将背景序列占总序列的比例从72%降至43%。样品交叉污染(即索引跳跃,index hopping)从14%降至可忽略水平,嵌合体形成减少了近六倍。此外,通过将测序接头拆分至目标扩增引物和索引引物中,该方法可直接生成适用于Illumina测序的文库,且人工序列更少。该策略尤其适用于序列同源性高的扩增子,例如合成抗体库——此类样本在使用高度多重化索引方案的Illumina测序中常出现嵌合体及其他背景序列。背景噪声的降低确保了结果的准确性,提升了下游分析(如多样性或富集计算)的可靠性,并支持更高通量的多重样本检测。同时,该平台仅需设计两对新靶标扩增引物即可适配新型结合支架,如纳米抗体或DARPins。
本研究发表于《SLAS Technology》,针对下一代测序(next generation sequencing, NGS)在蛋白质工程应用中长期存在的背景噪声干扰、索引跳跃及嵌合体形成等问题,开发了一种通用型闭管双条形码PCR方法,旨在实现基因型与功能表型的高效精准关联。现有多重测序体系面临的核心挑战包括:低多样性文库中嵌合体比例可高达70%; patterned flow cell与ExAmp化学技术加剧了索引跳跃,背景序列率超10%; Unique Dual Indexing(UDI)虽能提升准确性,但9216样本的试剂成本高达26万欧元,难以规模化应用。为此,研究人员基于前期四重条形码体系,结合evSeq策略的优势,构建了无需开盖操作的闭管索引平台,成功将9216个抗体克隆的可变区序列转化为测序就绪的Illumina文库,显著降低了背景噪声,提升了基因型判定的置信度。
关键技术方法方面,研究人员采用熔解温度(melting temperature, Tm)差异约13°C的两对引物:高Tm(~69°C)的靶标特异性引物携带部分Illumina TruSeq接头,低Tm(~56°C)的96+96通用索引引物携带剩余接头序列及7 nt唯一索引。通过Touchdown PCR程序调控退火温度,先完成靶标扩增,再激活索引引物延伸,实现单管双索引标记。验证阶段使用抗登革病毒2非结构蛋白1(DENV-2 NS1)Fab质粒及噬菌体展示富集的合成Fab库(抗SpyCatcher)作为样本队列,通过琼脂糖凝胶电泳、Sanger测序及Illumina MiSeq测序评估性能,并利用Python脚本对背景序列进行分类统计。
研究结果部分如下:
2.1 闭管索引的开发与验证
研究人员首先验证了闭管法与两步法(evSeq式)的扩增效率无显著差异,均能特异性扩增500 bp(VH)和550 bp(VL)片段,且无模板对照无扩增。Sanger测序显示16/18克隆获得全长序列,11个样本完全准确,错误主要源于Taq聚合酶或引物合成,后续改用高纯度Ultramer寡核苷酸。闭管法与两步法的产物质量无差异,但前者避免了开盖操作的交叉污染风险。
2.2 NGS数据分析与比较
对4320份样本(含3600份DENV-2 NS1位点饱和突变库及480份抗SpyCatcher库)的测序数据显示:闭管法的主序列与第二序列比值中位数达70(四分位距123),显著高于四重条形码法的27(四分位距41)(p<0.001)。背景序列占比从72.2%降至43.0%,其中交叉污染从14.3%降至0.0%,嵌合体从13.6%降至2.4%,未识别序列略有上升(35.7%→40.0%)。这表明闭管法有效抑制了由模板混合导致的嵌合体重组。
2.3 抗DENV-2 NS1亚库的基因型功能筛选
研究人员利用ANARCI对抗原结合信号进行归一化分析,确认四个突变位点(H53、H57、H58、H98)的氨基酸分布均匀,亲本基因型占比符合预期。功能筛选未发现亲和力优于亲本克隆49A3的突变体,验证了筛选体系的可靠性。
讨论部分指出,该研究通过物理分隔的单管反应,从源头阻断了异源模板接触,从根本上降低了嵌合体形成。相较于UDI的经济壁垒,组合索引策略仅用192种引物即可覆盖9216样本,试剂成本降低98%。尽管背景序列仍包含部分未识别错误,但通过优化PCR循环数或纯化方法可进一步改善。该平台可直接迁移至纳米抗体、DARPins等其他结合蛋白支架,仅需更换靶标引物,极大拓展了应用场景。研究人员强调,在抗体库多样性与富集分析中,必须严格控制嵌合体等伪影,否则将导致多样性被高估。最终结论表明,该闭管条形码方法显著提升了序列清晰度,为大规模基因型-表型关联研究提供了高性价比、高可靠性的解决方案。