科研

首页 - 全部文章 - 科研 - MinION纳米孔测序仪完成迄今最连续的人类基因组组装:纳米孔测序技术迈出新的一步

MinION纳米孔测序仪完成迄今最连续的人类基因组组装:纳米孔测序技术迈出新的一步

获取并解读人类基因组是现代医学的基石。此前,由于测序系统、速度和成本等多种因素影响,这项工作显得令人望而生畏。如今,虽然测序技术不断改进,但是要快速、低成本地组装人类基因组并保证高准确度和完整性依颇具挑战。直至今日,科学界也没有100%测序人类基因组。

2018年1月29日,著名学术期刊《自然·生物技术》发布了一项重磅研究成果,来自英国诺丁汉大学的研究人员首次通过MinION纳米孔测序仪,利用超长reads完成了人类基因组组装。据悉,这是迄今为止最连续的人类基因组组装,而且只使用了单一的测序技术。可以说,这项成果标志着该技术达到了新的里程碑,同时向最终完成人类基因组再次迈出了新的一步。

人类基因组组装的全新时代

文章的主要作者之一、诺丁汉大学医学副教授Matthew Loose表示:“完成这项成果意义重大。这是第一次在纳米孔测序仪上产生足够的数据来进行人类基因组的重新组装。”

研究团队使用Oxford Nanopore Technologies(ONT)公司的MinION测序仪,共产生了超过91.2 Gb的序列数据,覆盖基因组~30X。研究人员实现了高达882kb的单个read,N50超过100kb,使研究人员能够对过去技术分析不了的人类基因组区域进行测序。比如,该研究所述方法可以检测基因组中的结构变异和表观遗传修饰,填补人类参考基因组GRCh38中的12个空缺,从而提高了参考基因组的准确性,而在高度重复的序列中,较短的reads是不可能做到的。对此,Loose教授解释道:“你可以想象有这样一副拼图,拼图上的两个区域有着相同的图像,那么就没有办法去分辨哪一部分应该在哪里。但当你获得的reads越来越长,就会在这些reads中获得更多独特的元素,从而让你看到它们应该在哪里。”此外,超长reads使得作者能够识别整个主要组织相容性复合体(MHC)区域,并通过超长序列数据成功重建了2个杂合等位基因。MHC是基因组中最密集且高度可变的区域之一。

针对这一成果,测序中国第一时间对话了北京希望组CEO汪德鹏,他表示:“Nanopore技术经过多年的发展,已经逐步成熟,本次采用MinION完成一个人类基因组组装项目,预示着基因组组装已经进入一个全新的时代,快速、低成本、高质量、接近完成图的基因组研究,将成为最近两年全球的研究热点。”

数据集总结

超长reads、组装及端粒

准确率问题如何克服?

SanDiegOmics.com基因组顾问Shawn Baker也指出:“这无疑打开了那些难以阅读的基因组区域的大门,就帮助了解基因组而言,这是一场胜利。”然而,准确性可能仍然是一个棘手的问题。Baker指出,与参考基因组相比,单独的纳米孔测序数据并不如其他测序技术那样精准。他提到:“单靠纳米孔测序的reads似乎有很大的系统误差是无法纠正的。因此他们需要引入Illumina高质量的短reads来提高准确性。”

此外,后处理工具有助于提高精确度,例如“Nanopolish”这样的软件便可以对组装结果进行进一步提升。安大略省癌症研究所计算生物学家、论文共同作者之一Jared Simpson博士指出,原始信号含有相当多的模糊之处。纳米孔测序的工作原理是将单链DNA穿过纳米孔,每个核苷酸碱基会以不同的方式扰乱电流,序列的获取取决于这些电流的变化。“观察到的信号取决于孔内和孔周围的多个碱基,而不是一个碱基。例如,由C包围的A将看起来与被G或T包围的A不同。由于这种不确定性,初始的结果可能是有缺陷的。”

为了将这些错误最小化,辛普森博士创建了“Nanopolish”,它考虑了周围环境的来正确解码信号数据。在这种情况下,Nanopolish将序列的准确率从95.74%提高到99.44%,再根据Illumina的数据,准确率被提高到99.96%。

此外,表观遗传标记也可能是造成准确率降低的另一个原因。由于纳米孔测序仪直接使用DNA而不经过PCR扩增,因此这些DNA分子保留了纳米孔可以检测到的表观遗传修饰。具有表观遗传修饰(如甲基化修饰)的碱基会产生与未修饰碱基不同的电流变化。Loose博士说道:“我们曾天真地认为,目前的变化只会告诉你有关A、T、G、C的信息。但实际上,这些电流变化可以告诉你更多。”目前Nanopolish已经可以用来解读核苷酸上的甲基化修饰,解读其他修饰的能力可能也不会太晚。Loose博士说:“能够直接获得表观遗传信息可能是革命性的。”

MinION测序仪

纳米孔测序技术,未来值得期待

迄今为止,纳米孔测序技术主要用于微生物基因组的测序,例如跟踪非洲的埃博拉病毒的爆发或美洲的寨卡病毒。本次最新研究证明其能够进行人类基因组测序可能会促进纳米孔测序在其他应用领域的普及,这无疑会让一些研究人员开始考虑将MinION用于测序更大的基因组。尽管这种“袖珍”设备对整个人类基因组进行常规测序的速度仍然缓慢,但是一些工作已经表明,纳米孔测序比用于检测复杂染色体重排的短读取技术更为出色,如在一些癌症和罕见遗传性疾病中。

尽管纳米孔测序技术还并不完全成熟,但Baker表示:“随着测序平台的普及,情况应该会逐渐改善。”

如今,使用纳米孔测序技术进行从头组装的大规模基因组项目持续火热,针对国内的进展,北京希望组CEO汪德鹏提到:“2016年我们参与发表了基于PacBio SMRT技术的第一个长读长中国人参考基因组‘华夏一号’,成功的补上了国际人类基因组参考序列的25%的漏洞,成为了国际标准的一个部分。现在,我们又启动了基于Nanopore技术的‘华夏一号’样本的测序,希望能得到更加完整的中国人基因组参考序列。于此同时,我们还将利用已经构建的20台Nanopore GridION平台(MinION的5倍通量),完成中国人类基因组结构变异数据库的构建,目前已经启动了20个样本的测序,计划于两年之内完成1000个中国人样本。”

我们也相信,随着单分子测序技术的不断发展和普及,未来这项技术必将在生命科学领域发挥出更大的力量。

参考资料:

1. Nanopore sequencing and assembly of a human genome with ultra-long reads

2. First Nanopore Sequencing of Human Genome

(2)

本文由 SEQ.CN 作者:白云 发表,转载请注明来源!

热评文章