产业

从技术到应用,深度解读罗氏“穷尽法”甲基化捕获文库

DNA甲基化已被证明能在多种生物过程中起到重要作用,包括基因表达、剂量补偿、基因组稳态等等。近年来,其在癌症和许多其他疾病相关领域中也日益受到关注。2017年,几位华人科学家的多项研究表明,ctDNA甲基化标志物在癌症早筛、早诊以及预后评估等方面具有巨大的应用前景

目前,ctDNA甲基化标志物的研究思路已经比较明确。首先,通过芯片或二代测序对肿瘤组织和正常组织进行全基因组范围的甲基化信号扫描,寻找肿瘤特异的的甲基化marker;然后,再利用这些marker对cfDNA进行性价比更高的靶向测序,验证甲基化marker的性能。

虽然研究思路比较清晰,但甲基化测序技术的诸多局限也一直困扰着研究人员。一方面,现有甲基化靶向测序技术设计难,且容易丢失模板。另一方面,在亚硫酸氢盐(BS)处理后,聚合酶很难有效扩增含U碱基的DNA片段,同时还会产生扩增偏好。简而言之,我们需要在高效捕获BS DNA片段的同时,还要保证甲基化信号在扩增过程中均匀放大,不走样。

针对这些迫切需要解决的问题,罗氏公司整合旗下KAPA和NimbleGen公司的产品,为科研人员提供了一整套高通量DNA甲基化测序的解决方案,包括文库构建、富集、甲基化靶向捕获等产品。

1. NimbleGen Seqcap Epi——甲基化靶向捕获技术

目前,主要的DNA甲基化靶向测序技术有三种,包括基于PCR的扩增子技术、基于杂交原理的捕获技术以及介于二者之间的Padlock(也称为MIP),但是由于化学试剂-亚硫酸氢盐(BS)转化的缘故,这三种技术都较难顺利开展。

一方面,BS处理后,大量未甲基化C转化为T,DNA变为AT-rich,碱基多样性下降,难以保证引物特异性,这使得扩增子和Padlock的引物设计变得非常困难,这一点,在2017年Nature Materials发表的基于甲基化的肝癌诊断研究中已有所体现(图1[右] [1])。相对而言, NimbleGen Seqcap Epi产品是基于核酸杂交原理的捕获方法,能够靶向更大的目标区域,可以保证探针特异性,在设计上相对容易,探针设计成功率更高。 

图1:三种甲基化靶向测序技术原理比较(右图修改自[1])

另一方面,由于每个CpG位点都存在甲基化和非甲基化两种可能,CpG位点越多其可能的组合也越多。如何捕获所有状态的甲基化DNA,做到不遗漏任何一种可能? SeqCap Epi选择了“最难”但也是最稳妥的“穷尽法”,以全面覆盖所有可能的甲基化状态。如图2所示,如果一个目标区域含有5个CpG位点,SeqCap Epi便设计对应的25=32种探针。

图2:SeqCap Epi甲基化捕获探针设计理念

但是,这种设计的问题也随之而来,即大量的探针之间的相互影响会产生覆盖不均匀等弊端。为了解决这些问题,NimbleGen公司经大量测试,系统优化探针的长度、密度、GC含量等参数(图3[左]),使得SeqCap Epi的覆盖均匀性表现优异,领先于其他同类产品(图3[右])。

图3:SeqCap探针密度优化示意图[左,引自参考文献2]以及对人基因组的甲基化测序表现[右,引自参考文献3]

值得一提的是, 450K等芯片法是行业认可度较高的DNA甲基化检测技术;然而,大量研究表明,基因组上广泛存在的SNP是影响450K芯片准确性的重要因素。SNP同样也会干扰甲基化捕获;不过,SeqCap Epi同时捕获正负双链的探针设计,能够帮助区分碱基改变到底是来源于BS处理还是碱基序列变异(图4[上]),这也是该款产品的一大亮点。特别是ctDNA marker区域的CpG位点较少时,SNP的影响会更大,例如,一个用于肝癌诊断的甲基化marker:cg26668608就只含有两个CpG位点(图4[下])。

图4:双链捕获区分SNP与甲基化修饰的原理示意图

还有一点需要强调,与同类产品相比,SeqCap Epi产品先BS处理后捕获的特点充分保证了目的片段不会因为捕获效率低而损失(图5),这对于痕量的ctDNA甲基化检测尤为重要。

图5:先BS再捕获流程不易丢失模板

通过穷尽法探针设计保证捕获过程不丢失模板,调试探针配比减少测序数据成本,双链捕获确保甲基化判读不受SNP影响以及BS处理后捕获提高模板利用率等一系列优化, SeqCap Epi的测序数据与450K的结果具有非常高的相关性,更能保证相关研究的兼容性和延续性(图6)

图6:SeqCap Epi、450K等技术检测CpG-rich PCDHA 基因甲基化的相关性分析[3]

2. KAPA HiFi——低偏好文库富集技术

高效、特异、均匀的捕获目的片段仅仅是甲基化靶向测序流程中的一个重要环节,在捕获前后,我们都需要对文库进行PCR富集。高效、高保真、无偏好的扩增才能保证靶向捕获取得的胜利成果不会付之东流。

亚硫酸盐处理后的DNA会含有大量U,并且GC偏倚严重,所以,对于富集预文库的聚合酶而言,就是难上加难了。这要求聚合酶既能高效的兼容U碱基,并且均匀扩增各种GC含量的DNA片段。

凭借在定向进化技术以及NGS工程酶优化方面积累的丰富经验,罗氏旗下KAPA品牌推出的 KAPA HiFi Uracil+已经被证明是扩增BS DNA的优选方案之一。来自KAPA官方的测评显示,和同类产品相比,无论是扩增效率,还是扩增均匀性,KAPA HiFi Uracil+都具有无与伦比的优势(图7);与此同时,来自第三方实验室的独立研究业表明,KAPA HiFi Uracil+对GC几乎无偏好[4]。这些优势将有助于还原ctDNA最真实的甲基化模式,加速该领域的临床研究。

图7:KAPA HiFi Uracil+ ReadyMix 提供更高的文库产量和最小的文库分子大小偏差。 使用12、14或16个循环的标准方案扩增人类全基因组亚硫酸氢盐处理的文库,并使用Bioanalyzer® 2100高灵敏度DNA检测系统分析扩增文库。与A相比,KAPA HiFi Uracil+ ReadyMix的产量更高 (左),片段大小偏差更小 (右)。

而另一款富集产品,KAPA HiFi文库扩增试剂盒,又非常适用于甲基化捕获后的文库富集。大量的基础研究已经证明,KAPA HiFi更加适合NGS文库富集[5-7]。除了甲基化测序,KAPA HiFi还可以广泛应用于液态活检中ctDNA检测,微生物菌群分析(免疫治疗)等研究领域。2014年Nature Medicine杂志报道的CAPP-Seq ctDNA检测技术研究中,KAPA HiFi DNA聚合酶制备的文库对肿瘤相关基因区间具有更为均匀的覆盖度,而且扩增效率更高,(图8A)。2016年,Nature Biotechnology杂志报道称,高均一性、高保真性以及高效性的KAPA HiFi DNA聚合酶,较常规使用的Taq DNA聚合酶更加适合用于微生物菌群分析(图8B)。

图8A:液态活检中,KAPA HiFi与Phusion DNA聚合酶的覆盖均匀性比较[8]; 图4B:Q5、KAPA和Taq DNA聚合酶在16s rDNA扩增子测序中的错误率比较[9]。

参考文献

1. Circulating tumour DNA methylation markers for diagnosis and prognosis of hepatocellular carcinoma.

2. METHODS AND SYSTEMS FOR UNIFORM ENRICHMENT OF GENOMIC REGIONS- US 8,383,338 B2

3. DNA methylation profiling: comparison of genome-wide sequencing methods and the Infinium Human Methylation 450 Bead Chip.

4. Methylated DNA is over-represented in whole-genome bisulfite sequencing data.

5. Optimal enzymes for amplifying sequencing libraries.

6. Optimizing illumina next-generation sequencing library preparation for extremely at-biased genomes.

7. Analyzing and minimizing PCR amplification bias in Illumina sequencing libraries.

8. An ultrasensitive method for quantitating circulating tumor DNA with broad patient coverage.

9. Systematic improvement of amplicon marker gene methods for increased accuracy in microbiome studies.

(2)

本文由 SEQ.CN 作者:白云 发表,转载请注明来源!

热评文章