积跬步、至千里 | 伯科WES均一性“黑科技”揭秘

2021-08-13

2020年9月,伯科生物科技有限公司(以下简称为“伯科”)宣布已经完成首款全流程国产DNA探针人全外显子捕获试剂盒TargetCap® Core Exome Panel v3.0研发和测试,正式推向市场。


经过大量的测评工作,由伯科自主研发生产的全外显子Panel,TargetCap® Core Exome Panel v3.0,其性能表现得到了众多用户的高度认可,尤其是覆盖均一性方面。如图1所示,在测序500x的情况下,Core Exome Panel v3.0在不同测序平台上都能达到1.4左右的Fold 80。有用户表示,该均一性已经超过诸多国外竞品,大大超出预期。

图1. TargetCap® Core Exome Panel v3.0在高深度测序下的均一性表现。

覆盖均一性是靶向测序最重要的参数之一,它决定了有多少目标区域能够达到分析要求。换言之,高均一性能够减少测序数据量,节约成本(图2A)。

如图2B所示,使用伯科TargetCap® Core Exome Panel v3.0进行捕获分别在Illumina和MGI平台测序,在测序7.5Gb时(92/101X),≥20X以上的目标区域占比达到99.6%;5Gb测序时(61/68X), ≥20X以上的目标区域占比仍然超过98%,远高于国标《GB/T 37872-2019》规定的80%。

图2. 高均一性可有效节约测序数据量。

那么,如此优秀的均一性是怎么做到的呢?

接下来,小编和大家聊一聊TargetCap® Core Exome Panel v3.0的开发中用到的一些“黑科技”。

影响覆盖均一性的因素有很多,其中目标区域GC含量最为关键,通过对低/高GC区域的局部探针浓度调整可以优化Panel的覆盖偏好。但除了GC含量,还有一个鲜为人知的关键因素——探针补偿效应。伯科研发团队对引起覆盖偏好的因素进行聚类分析时发现,目标区域所覆盖的探针数量的多少与其覆盖深度正相关,也就是说探针之间的侧翼补偿效应会引起覆盖偏好,其原理如图3所示。

图3. 探针侧翼补偿效应产生覆盖偏好示意图。

按照目标区域覆盖探针数量的多少,伯科团队把目标区域分为低、中、高补偿区(L-FLK、M-FLK和H-FLK),分别对~1.5万条探针组成的Panel进行统计,如图4所示。目标区域的覆盖深度与其探针数量正相关,也就是说,长短不一的目标区域会因为覆盖探针的多少产生天然的深度差异,其与GC偏好一样,是影响Panel覆盖的重要因素。

图4. GC含量和探针补偿效应对覆盖深度的影响。

那么,调整L/M/H-FLK这3种区域的局部探针浓度,能否改善Panel的覆盖偏好呢?为验证这一假设,研发人员合成了L/M/H-FLK区域探针不同浓度配比的Panel,并进行捕获测序。如图5所示,浓度配比2#的三个区域之间的覆盖差异最小,数据表现最优,与比例1#相比,Fold 80降低0.1(SNP等位基因频率并未受到影响),证明探针补偿效应也是影响覆盖均一性的重要因素,调节补偿效应区域探针浓度是优化Panel均一性的有效手段。

图5. 调整不同探针补偿区的探针配比对覆盖均一性的影响。

在此基础之上,对GC偏好区域的探针局部浓度进行调整,也能使Fold80降低0.1,进一步表明探针补偿效应是独立于GC的覆盖偏好影响因子(图6)。

图6. 调整不同GC含量目标区域探针配比对覆盖均一性的影响。

综上所述,针对覆盖偏好的关键影响因子探针补偿效应和GC含量,调整对应的探针浓度,可以明显改善Panel的覆盖均一性(图7)。

图7. 由伯科生物自主研发的覆盖偏好优化技术原理示意图。

在WES Panel的开发过程中,除了使用伯科独创的局部探针浓度调整技术,TargetCap® Core Exome Panel v3.0还采用伯科自主知识产权的专利生物素修饰。分别采用伯科生物素与常规生物素分别制备Core Exome Panel v3.0,并进行捕获测序。结果显示,与常规生物素相比,伯科生物素能够进一步提升覆盖均一性(图8)。除此之外,通过加入多种小分子化合物,伯科自主研发的杂交试剂能够进一步降低GC偏好。

图8. 伯科生物素与常规生物素修饰的Core Exome Panel v3.0比较。

综上所述,从杂交试剂、探针修饰/合成/设计、探针局部浓度调整等多方面测试优化调整,所谓“积跬步至千里“,每一步1%的提升积累,使得TargetCap® Core Exome Panel v3.0的覆盖均一性在众多竞品中脱颖而出。同时,伯科将继续努力,打磨技术,精益求精。

推荐阅读