技术小贴士 | 50ng预文库可以做捕获吗?捕获文库用量测试

在之前的文章中(技术小贴士 用多少文库捕获合适?预文库投入量与有效深度的关系),我们开展了5-100%预文库使用量的捕获实验,用于评估预文库使用比例对捕获的有效深度的影响。实验结果表明,在需要高深度测序时,10%-25%以上的文库用量是相对较优的选择(图1)。

图1 40000x理论测序深度下,不同预文库用量的捕获测试

在设计上述实验时,考虑到许多用户关心的预文库用量绝对值(ng)的问题。我们设计了50-1000ng范围的单个预文库投入量测试(推荐值500ng)。由于要兼顾5-100%的预文库投入比例测试,在测试了不同Pre-PCR循环数的预文库产出后,选择产出1000ng预文库的PCR循环数,5%*1000=50ng,这样就可以观测两种变量的影响。此外,采用2-Plex进行捕获,杂交文库的总量约为100-2000ng的范围(图2)。

图2 1x Wash Buffer保存测试的实验设计

在得到捕获测序数据后,取1000x理论深度数据进行数据分析统计。如下表所示,从比对率、碱基质量、GC含量、测序深度到特异性和覆盖均一性来看,1x Wash Buffer的4种保存条件的捕获数据与对照无明显差别,所有实验组的捕获均表现出优异的特异性与均一性。

实验重复间的稳定性良好(CV),保存条件测试的稳定性与对照相近。其中,4℃保存与对照组的所有参数的CV均控制在1%以内(除Duplication外,其绝对值较低,可忽略其波动),保持着非常稳定的捕获表现。室温保存组的部分参数的CV值有轻微增加(Q20、GC、Depth、On-Target)。

图2 实验设计以及捕获后文库产出与杂交文库总量的相关性

首先要评估的一个问题是,在100ng这种杂交文库用量下,捕获反应是否能够正常进行。如图2右所示,不同杂交文库用量的捕获后文库产量与投入量保持良好的线性关系,说明杂交反应过程中,探针与文库片段和链霉亲和素磁珠的结合反应正常。

在介绍测试数据表现之前,先对一个问题进行简单说明。On-Target参数被用于评估捕获数据的特异性,为了直接反映最终获得的Unique Depth的高低,常使用去除冗余(DeDup)后的数据来评估On-Target。但是,由于捕获数据中,Target区域的文库丰富度低于Off-Target部分(Target区域的Reads Dup更高),所以,DeDup后的On-Target参数受评估使用的数据量影响(Duplication)。如图3所示,使用去重前的OnTarget(WithDup)进行评估,不会受到测序数据量和文库丰富度的干扰,更真实的反映捕获本身的特异性。

图3 不同数据量对On-Target参数的影响

如图4所示,48-915ng的单个预文库,或是96-1830ng的杂交文库总投入量,它们的捕获数据在特异性和均一性两个方面,都没有明显的差别,说明投入量低至~50ng(Input/PreLib)或者杂交文库总投入量~100ng(Input/Capture)捕获反应仍能正常工作。

图4 不同文库投入量的捕获表现

小结

通过PCR循环数、预文库用量等一系列捕获测试,我们为小伙伴们介绍了伯科液相基因芯片捕获测序技术的基本工作原理,下面简单总结。

1)预文库构建时的PCR循环数对于模板利用率至关重要,推荐4-6个循环以上;
2)预文库投入比例对于低起始量样本比较关键,建议25%以上;
3)伯科捕获技术可以耐受低至50ng/100ng(单文库/总量)的基因靶向富集。

推荐阅读