文章发表在PNAS上
DNA纯化、文库制备或测序过程中的错误通常改变互补DNA链中相应位置的单个碱基,而非两个碱基。因此,检测罕见突变最敏感的方法是双链测序,即对DNA两条链的序列分别进行独立的标记和测序,以区分真正的突变和错误,指数降低错误率。这些步骤在原理上较为简单,并且只涉及对传统文库制备方法的最小改变,但在遗传和表观遗传分析中,通过保留大多数cfDNA模板分子的方式执行这些步骤是具有挑战性的。
因此,研究团队基于SaferSeqS技术开发了MethylSaferSeqS方法,可以很容易地适应现有的测序和实验策略,评估同一模板分子内的DNA序列、甲基化或拷贝数等变化,能够应用于不同文库制备方法中。
图1. MethylSaferSeqS技术原理和流程图。
MethylSaferSeqS方法首先通过标准建库技术将待测cfDNA分子与Y形测序接头相连接,每个原始链均被接头特异性引物复制,形成复制链。引物5'末端利用脱氧尿嘧啶(dU)进行修饰,形成由原始链和复制链组成的杂交双链分子。经变性处理以及链霉亲和素系统,实现原始链与复制链的分离,原始链经过亚硫酸盐转化用于DNA甲基化分析。MethylSaferSeqSh巧妙地实现了原始cfDNA序列和复制后序列的分离和分别PCR扩增,避免了扩增后序列甲基化信号丢失的问题,实现了遗传学和表观遗传学双组学标志物的联合分析。
为尽可能多的回收cfDNA模板分子,研究团队还进行了多个循环。结果显示,在一次和两次循环中,cfDNA分子的回收率分别为37%和81%。通过三次循环,几乎所有在SaferSeqS中被成功回收的cfDNA分子也都被MethylSaferSeqS回收。
图2. MethylSaferSeqS、SaferSeqSDNA分子回收率比较评估。
接下来,研究团队评估了MethylSaferSeqS和SaferSeqS技术检测cfDNA中的突变及次等位基因频率(MAF)的一致性(图3)。将19例晚期结直肠癌(CRC)患者的cfDNA样本分成两等份,分别用于构建MethylSaferSeqS文库和标准SaferSeqS文库;随后,检测了48个通常在癌症基因组区域的体细胞突变。结果检测到35个体细胞突变,其中22个(63%)同时存在于MethylSaferSeqS和SaferSeqS文库中,这些突变及其MAF高度一致,平均MAF为17.6%。
图3. MethylSaferSeqS技术与SaferSeqS技术的突变检测性能对比。
为分析拷贝数变化,研究团队使用17名CRC患者的cfDNA样本构建了MethylSaferSeqS文库和标准SaferSeqS文库,使用同一引物分别进行PCR扩增,然后进行全基因组测序(WGS)(图4)。结果显示,两个文库中特定的染色体区域以及断点具有几乎相同的变化。在MethylSaferSeqS文库中发现了122个拷贝数增加或丢失的区域,其中有112个(92%)在相应的SaferSeqS文库中发现了相同的变化。使用更严格的标准排除边界区域后,SaferSeqS和MethylSaferSeqS文库中剩余的数据几乎一致。
图4. MethylSaferSeqS与SaferSeqS的拷贝数变异检测同样具有高度一致性。
为评估MethylSaferSeqS能否检测血浆中突变的DNA片段甲基化状态,研究团队检查了两个患者样本。由于原始分子的Watson链和Crick链在亚硫酸氢盐转换后失去了互补性,研究团队使用了两组PCR引物,反映了SaferSeqS文库中C to T的转变(图5)。结果显示,在SaferSeqS和MethylSaferSeqS文库中共找到409个分子条形码(UID),其中11例(2.7%)含有PIK3CA p.H1047R突变。根据研究数据,突变后为CG时甲基化水平大幅度提高,而原本的CG位点突变后,甲基化水平大幅度降低。综上所述,MethylSaferSeqS方法能够分析单位点突变前后甲基化水平的变化。
图5. MethylSaferSeqS检测野生型和突变型cfDNA分子中的甲基化变化。
综上所述,研究团队开发了一种称为MethylSaferSeqS的通用方法,允许检测同一DNA模板中任何类型的遗传或表观遗传变化,包括C to T转变。MethylSaferSeqS创新的步骤是用引物复制每个DNA条形码的两条链,能够将原始链与复制链分离,可以分别从原始链和复制链中获得DNA分子中存在的表观遗传和遗传改变。MethylSaferSeqS对于解决与遗传学和表观遗传学相关的各种问题具有不容小觑的潜力。
本文由 SEQ.CN 作者:白云 发表,转载请注明来源!