2000年,第一个人类基因组草图绘制完成,耗时13年,耗资38亿美元。2007年,第一个中国人基因组绘制耗时数月,耗费300万美元。
2023年,超过400人的全基因组测序耗时仅需2.5天,单个人基因组测序成本仅不到100美元!
将单人全基因组测序成本降低至100美元甚至更低,这是基因测序行业的共同目标。
近日,华大智造(MGI)推出的DNBSEQ-T20×2(简称T20)平台在真正实现这一目标*的同时,创造了全球基因测序仪单机通量的新纪录,为基因科技的未来提供了更多可能。
众所周知,当基因测序技术成本降到一定的程度,基因测序会逐步成为推动传统医疗向精准医疗转变的关键技术。因此,T20的发布意义重大,不单单是一台新设备的问世,更是为全球基因科技的发展和普及按下了加速键,加快人类对基因组学的研究,促进医学健康领域的应用,助力实现基因科技普惠人人的宏伟目标。
测序仪被称为基因测序产业链上的珍珠,其技术革新推动着人类基因组测序通量的提高和成本的下降,但技术革新从来不是一蹴而就。最初,科学家们设想能够在一张载片上分析超过十亿个扩增后的DNA片段,通过大规模并行的反应和信号检测减少试剂耗材的消耗,降低成本。2015年,第一款基于该设想的机型,即华大智造美国子公司Complete Genomics发布的Revolocity超高通量测序仪平台一年可完成1万例个人全基因组测序(hWGS,human Whole Genome Sequencing)。现在,一台T20每年可完成5万例hWGS,成为目前世界上通量最高的低成本可量产测序仪。这背后凝聚了众多技术的革新,《测序中国》特邀华大智造高级副总裁倪鸣博士为大家一一揭秘。
倪鸣 博士
华大智造高级副总裁
图1:DNBSEQ-T20×2主要模块构成。
来源:参考资料[1]
首先,我们可以直观地了解一下T20的组成,主要包括试剂模块、生化模块、光学模块(×2)、动力模块、BIT模块(选配)等。与大多数测序平台的组成相比,T20并没有太大出入,但T20打破了封闭式生化液路系统的传统构造,采用开放式系统和模块化结构。拥有一套这样的设备,就相当于拥有了一座“测序工厂”。
其次,在生化原理技术路线的选择上,T20创新性地采用了浸没式的生化反应系统(下文将进行详细介绍),极大地提高了测序效率和测序规模、并进一步降低了测序成本。
当前,T20可以同时支持6张超大尺寸的测序载片上机运行,每张测序载片不仅能够独立运行不同的测序读长和测序应用,还能够支持不同文库的混合测序。T20的整个测序全流程通过2个四轴机械臂和1个六轴机器人实现了自动化串联,单次通量是目前其他超高通量测序平台的4.5倍~10.5倍之高(PE100,42Tb/Run;PE150,72Tb/Run)。
T20的生化模块采用了浸没式生化反应技术。该技术的应用可以大大降低单位数据产出所消耗的测序试剂,提高试剂利用率,从而进一步降低单位数据测序成本。倪鸣博士感慨道:“可以说,T20正是通过浸没式生化反应技术实现了测序读长、测序通量、数据质量以及成本投入之间的最佳平衡。”
图2:浸没式(左)和流道式(右)生化平台流程图。
来源:华大智造
传统测序仪采用的流道式生化反应依赖于复杂的流体和升降温控制系统,这种“样本固定、试剂流动”的生化反应方案对流动槽的加工工艺有着较高的要求,包括流动槽的平整度、在升降温过程中的形变程度、流体高精度控制等。如果固定在芯片平台上的流动槽平整度不够或在升降温过程中变形过度,将直接影响生化反应的均匀性、充分性以及后续光学系统的信号采集。而复杂的流体和温控系统也意味着较高的硬件和维修成本。此外,流道式生化反应方案中的反应试剂均为一次性使用,试剂有效成分利用率极低也限制测序耗材成本的下降。
与之相反,华大智造独创的浸没式生化反应采用了“试剂固定、样本转移”的方案,将无表面覆盖的测序载片依次浸泡在可控温的反应槽中以完成特定的生化反应,试剂槽温度控制可以精密到±0.5摄氏度内,保证生化反应的稳定性。这种浸没式的“无表面覆盖测序载片”避免了传统流动槽试剂流速不均匀的问题,测序载片表面不易产生气泡,生化反应更均匀、充分,载片的利用率进一步提高,且整张浸入反应试剂中的测序载片受热均匀,也不易发生形变等。
倪鸣博士谈道:“浸没式生化反应技术最大的优势在于可以通过在同一反应槽依次浸泡多张测序载片,完成多个测序循环。我们采用自主研制的试剂配方,能够在不发生交叉污染的前提下实现测序试剂的重复利用,大大提高了试剂利用率与数据生产效率,增加了数据产量,降低了测序成本。”
图3:浸没式(左)和流道式(右)生化反应示意图。
来源:参考资料[2]
光学模块:支撑T20超高通量信号识别和算法输出的核心
高质量显微成像系统是超高通量测序仪的核心模块。因此,T20的超高通量对光学成像、图像识别及数据传输速度都提出了更高的要求。倪鸣博士表示:“采用华大智造独有的双色荧光测序专利技术,T20能够高效地进行碱基识别,同时将光学硬件、计算资源大幅度压缩,还具有减轻大数据传输压力等优势,为测序通量的增加奠定了技术基础。”
T20光学模块采用浸没式光学镜头联合TDI线扫相机,以支撑超高通量信号识别。据了解,T20光学模块由光学成像模块和光学控制模块组成,前者负责对测序载片上的荧光信号进行成像,后者负责控制光学成像模块、实时生成原始的碱基序列Cal.(Cal.是由华大智造测序仪碱基识别basecall软件生成的二进制文件格式)文件。
图4:光学模块的光学镜头实物模型。
来源:参考资料[1]
倪鸣博士介绍到,为了支撑高通量信号的采集、传输、识别,T20的成像系统进行了多维度的创新突破。其一,其成像模块采用浸没式光学镜头,镜头端面直接浸没到试剂溶液中,以试剂溶液作为拍照介质,相较空气介质,具有数值孔径高等特点,提高了空间分辨力,支持更高密度的测序载片运行,提高了单位面积的数据产出。此外,T20采用TDI线扫相机,相比于常规面阵式扫描方法,其搭配高性能运动平台,光学图像采集效率可提高2~3倍。更重要地,使用高质量的国产大视场光学物镜,单FOV(Field of View)视场直径超2mm,可捕获更多的荧光信号,能够输出更高信噪比的荧光图像,这为通量的提升和系统优化提供了强有力的硬件基础。
测序算法:匹配T20超强生产规模的数据处理和碱基识别能力
由于单位时间内捕获到的超大量荧光信号,需要准确、快速、实时转化成原始碱基序列信息,对获取到的图像的实时处理、信号转换以及数据传输也提出了更高要求。为了提高数据质量,最大限度缩短数据处理时间,T20引入了硬件计算加速,突破传统CPU架构计算能力和吞吐量的瓶颈,获得了上百倍数据处理能力的提升。
倪鸣博士强调,针对TDI线扫成像的特点,T20研发团队提出了非对称的点光源亮度提取算法。随着测序进程的推进,该算法会综合参考过程参数进行动态调整,显著提高了准确率,同时采用了传统图像处理方法和深度神经网络相结合的方式,能够极大地提高碱基识别算法的精度和适用性。
进一步地,为了满足大人群基因组项目、尤其是百万级别国家基因组项目快速启动的需求,以T20为中心,华大智造提供可选的一站式工具包,包括样本制备系统(MGISTP-7000和MGISP-NE384)及试剂、自动化建库设备(MGISP-960和 MGISP-Smart 8)、建库试剂,以及一系列支撑海量数据处理的工具和模块,例如:具备Pb级数据存储和生信分析加速处理能力的ZTRON Pro一体机,以及可实现样本管理、实验室生产、基因数据管理的ZLIMS Pro+等。
其中,华大智造ZTRON Pro一体机是针对高通量测序仪设计的集实验室信息管理、生信计算和海量基因数据存储为一体的基因数据平台,可以在实验室中直接使用,也可部署于传统的数据中心,满足高达百万级规模的测序极致交付要求。ZTRON Pro支持独立离线部署,也支持横向扩展,获得了欧盟Europrise认证,符合GDPR要求,安全可靠,同时能够最小化IT运维成本。[3]
事实上,这套一站式工具包的理念提出,是基于华大智造对测序全流程的理解与深耕。面对海量基因数据的计算、存储及管理带来的挑战,华大智造提供高性价比、高密度和高扩展的技术和产品。据倪鸣博士介绍,当前,华大智造已实现测序全流程的工具布局,不仅可提供端到端“样本到数据”的高通量自动化解决方案,而且可以提供自己的样本前处理、文库制备及数据分析平台,甚至包含生物样本库的平台,能够真正解决大规模基因组学研究项目、大规模多组学研究项目等大型项目在项目过程中遇到的“工具卡点”问题。
图5:面向大型组学项目的T20一站式工具包。
来源:参考资料[1]
通过对生化、光学、算法及配套工具等多个方面进行的极致创新及应用,T20极大地降低了测序成本,在超高通量数据输出的同时保证了测序数据的高质量,让人过目难忘。更加无法忽略的是,凝聚在这一超强产品背后的中国人、中国企业的自主研发创新能力。
在采访的最后,倪鸣博士总结道:“华大智造围绕‘存读算用’已推出了基因测序仪、自动化产线、生物样本库、BIT产品等生命科技核心工具。在工具的研发上,我们始终坚持追求极致、打破边界,希望通过最先进的技术,为全球用户提供更多工具便利、实现更多创新突破。随着T20的推出,华大智造测序仪产品线完成了‘低通量-中通量-高通量-超高通量’全覆盖矩阵的进一步扩充。未来,我们的三大业务线将以此为标杆,持续为行业提供更多可选择的权利与机会。”
20年,将WGS测序成本从30多亿美元降至100美元以内,这是一个梦想推动科技进步的时代。DNBSEQ-T20×2的诞生是测序工具领域的里程碑事件。相信DNBSEQ-T20×2提供的不止是超高通量测序的一大选择,而是能够激发更多 “敢实现”的科研梦想,让更多的科研创新不再受限于测序工具的极限,为全球基因科技的发展强势赋能,助力我们更快走进“人人基因组”时代。
*备注:DNBSEQ-T20×2可在完成5万例人全基因组测序基础上,将单个人全基因测序成本降低至100美元以内。
DNBSEQ-T20×2(重点应用于大人群基因组测序等大型组学研究项目)DNBSEQ-T7(重点应用于大中型测序项目)MGISEQ-2000(重点应用于全基因组、外显子组、转录组测序等)
MGISEQ-200(重点应用于小型基因组测序,靶向DNA和RNA测序,低深度全基因组测序)
DNBSEQ-G99(重点应用于靶向捕获/多重靶向测序,小型基因组测序,甲基化测序)
DNBSEQ-E25(重点应用于病原快检、小型基因组测序、靶向测序)
1.https://www.mgi-tech.com/products/instruments_info/44/
2.https://zhuanlan.zhihu.com/p/346771767
3.https://www.mgi-tech.com/products/software_info/3/
本文由 SEQ.CN 作者:戴胜 发表,转载请注明来源!