游离DNA的甲基化修饰可以作为生物标志物应用于无创产前检测、癌症早筛早诊、器官移植评估等多个临床领域[1]; 前不久,张鹍教授在Nature Genetics上发表的文章证实,利用甲基化差异信号不但能够检测早期癌症,还能够溯源肿瘤的具体位置[2];这篇报道如同一剂强心剂,进一步证实了甲基化生物标志物在临床中的价值和应用前景,也将人们对甲基化测序的热情推到了新的高度。那么,对于甲基化测序,如何选择实验方法,实验过程中又会遇到什么样的问题呢?
对于常见的甲基化测序方法,其一是使用甲基化DNA结合蛋白 (MBD) 或是甲基化抗体 (MeDIP) 进行捕获测序,该方法能够获得全基因组范围内100-1000bp分别率的甲基化信号,但无法获得单碱基分辨率的信号;此外,简化基因组甲基化测序 (RRBS) 利用限制性内切酶富集CpG区域,在提高测序性价比的同时,可获得部分基因组 (~10%) 单碱基分辨率的甲基化信号;作为鱼与熊掌兼得的方法,全基因组甲基化测序 (WGBS) 则能得到全基因组范围内单碱基分辨率的甲基化信号。
图1:不同DNA甲基化测序方法参数比较
下面就来重点说说WGBS方法,该方法利用亚硫酸氢盐(Bisulfite, BS)转化达到单碱基分辨率,其应用存在两个问题:1. 建库起始量高(微克级别);2. 有效数据量低。例如,为了获得30x测序深度,需要高达~230Gb的测序数据量 (按照80%比对率,50%冗余率的数据表现计算),如果再考虑甲基化测序文库的碱基不均匀性对测序质量的影响,情况可能更糟。样本质量门槛过高将限制该技术的应用,高额的测序费用也是巨大的负担。造成上述问题的根本原因,是让人“又爱又恨”的BS转化技术。
成也BS:1970年,BS转化技术第一次被报道,通过BS处理,将非甲基化的C转化为U,而甲基化状态的C保持不变,通过简单的测序便可对甲基化修饰信号进行检测,极大的简化了研究手段,促进了表观遗传学的发展。BS就像是一个转化器,将“修饰信息”转化为“碱基信息”。
败也BS:BS转化包括变性、脱氨基和脱磺酸基,在这个过程中DNA先被变性成单链,然后它们将遭遇高温、高盐、酸性、碱性环境,如过山车般遭受冰火两重天,最终状态好似经历千万年岁月洗礼的古DNA:单双链混合、出现缺刻、缺口损伤、含有dU核苷酸等。
传统WGBS文库构建流程中,BS转化过程导致~90%的DNA模板丢失,是造成建库起始量高,有效数据量低的 “罪魁祸首”[4]。那么,如何用好BS这套“七伤拳”呢?
图2:亚硫酸氢盐处理导致DNA损伤示意图[3]
改善BS文库构建效率的一种办法是先进行BS转化再构建文库(Post-Bisulfite Construction, PBC),这种策略能够有效的规避BS处理对预文库的损伤,提高模板利用率,降低建库起始量,同时提高测序文库丰富度,增加有效测序数据 (5)。经Bisulfite处理后,DNA以单链和双链的混合状态存在,传统双链连接接头的建库方法不再适用。
图3:转化后建库优势示意图
接下来,再来说说PBC建库方法:
1. 随机引物扩增法
与传统RNA-seq、WGA方法类似,此方法利用一段随机序列合成一链 (随机序列的5’端具有单分子标记序列、接头序列等),然后利用含另一侧接头序列的随机引物进行二链合成,再通过PCR引入完整的测序接头得到测序文库 [5]。此方法的优势是操作简单,建库周期短,与任何基于随机引物建库的方法一样,如何控制扩增偏好是建库的关键。
2. 单链连接法
开发此方法的初衷是对高度降解的DNA进行文库构建[6],如古DNA、FFPE样本等;所以,单链连接法也适用于PBC文库构建。先将DNA变性为单链,去磷酸化防止单链DNA串连,再与单链接头连接,利用与单链接头互补的引物进行二链合成,并连接另一侧接头,经PCR扩增引入完整的测序接头序列并同时完成文库富集;此方法建库效率高,覆盖均一性好,但操作较为繁琐,建库周期较长;该方法在2017年已经升级至2.0版本,上述不足得到了优化 [7]。
3. 末端加尾法
末端加尾法是指利用末端转移酶 (TDT) 向底物3’端添加同聚多核苷酸尾 (Tailing),再利用尾部序列作为二链合成引物的互补区进行二链合成 (Extension) 后,将另一侧接头连接至双链DNA (Ligation),通过PCR扩增富集,完成文库构建的方法 [8]。此方法成功与否的关键有三点:1) TDT酶的底物利用率,直接关系到建库效率和文库丰富度,最终影响有效数据量;2) TDT酶的加尾偏好性,该特性会影响测序数据的覆盖均一性;3) 底物加尾长度,一方面,加尾过长会降低二链合成引物与尾部序列的退火效率,影响建库效率;另一方面,过长的尾部Poly序列会进一步加剧BS文库的碱基不均匀性,降低测序质量;加尾长度可以通过调整反应缓冲液或混入双脱氧核苷酸进行控制 [8][9]。
图4:三种转化后建库思路
除了通过PBC策略优化甲基化测序流程,BS-Free也是未来值得关注的方向,三代测序可实现BS-Free的甲基化检测,但目前在应用上存在一定局限。
参考文献:
1. Plasma DNA tissue mapping by genome-wide methylation sequencing for noninvasive prenatal, cancer, and transplantation assessments. PNAS , 2015 , 112 (40) : E5503
2. Identification of methylation haplotype blocks aids in deconvolution of heterogeneous tissue samples and tumor tissue-of-origin mapping from plasma DNA. Nature Genetics, 2017 , 49 (4) : 635
3. DNA methylation analysis: speedup of bisulfite-mediated deamination of cytosine in the genomic sequencing procedure. Proceedings of the Japan Academy, 2004 , 80 (4) : 189-194
4. Bisulfite genomic sequencing: systematic investigation of critical experimental parameters. Nucleic Acids Research, 2001, 29 (13) : 65-5
5. Amplification-free whole-genome bisulfite sequencing by post-bisulfite adaptor tagging. Nucleic Acids Research, 2012, 40 (17) : e136
6. A High-coverage Genome Sequence from an Archaic Denisovan Individual. Science, 2012, 338 (6104) : 222-6
7. Single-stranded DNA library preparation from highly degraded DNA using T4 DNA ligase. Nucleic Acids Research, 2017, 45 (10) : e79
8. TELP, a sensitive and versatile library construction method for next-generation sequencing. Nucleic Acids Research, 2015, 43 (6) : e35
9. Homopolymer tail-mediated ligation PCR: a streamlined and highly efficient method for DNA cloning and library construction. Biotechniques, 2013, 54 (1) : 25
本文由 SEQ.CN 作者:戴胜 发表,转载请注明来源!