其它

首页 - 全部文章 - 其它 - 蛋白质测序技术革新崭露头角!未来或可如NGS般实现大规模、高通量

蛋白质测序技术革新崭露头角!未来或可如NGS般实现大规模、高通量

蛋白质是生物功能的主要载体。许多无法从基因层面解释的疾病,蛋白质可以给出我们想要的答案,为此,蛋白质组学应运而生。科学家们预测,随着人类基因组测序工作的完成,21世纪生命科学的研究重心或将从基因组学转移到蛋白质组学。蛋白质组学是后基因组时代生命科学研究的核心内容,想要深入了解蛋白质,进一步认识生命活动和疾病发生的分子机制,首先要有合适的蛋白质测序技术做支撑。为完善蛋白质测序技术科学家做出了许多尝试,如Edman降解,荧光染色、质谱测序等。然而已有的测序方法都存在各种技术不足与应用局限性,不利于蛋白质组学在整个生命科学和生物医学研究中的应用推广。

近日,瑞士苏黎世联邦理工学院分子生物学研究所的Ben C Collins博士和Ruedi Aebersold博士在Nature Biotechnology发表了蛋白组学平行测序的评论文章“Proteomics goes parallel”,小编将文章进行了翻译整理分享给大家。

引言:肽的大规模平行测序可能预示着高通量蛋白质组学的新纪元。

目前,蛋白质组测序技术尚不如基因组学和转录组学那么强大。核酸测序技术的表现之所以令人印象深刻,是因为它能利用荧光作为读数进行短寡核苷酸的大规模平行测序。在这个问题上,Swaminathan等证明了肽类也可以进行平行荧光测序。他们的创新方法将经典的蛋白质测序技术与核酸光学测序系统进行了整合。虽然该方法仍需进一步优化,但这让我们看到了一种普遍可行、可靠和真正通用的蛋白组学测序技术的发展前景。

蛋白质对于生命系统来说是必不可少的,它们可以作为化学催化剂、结构成分以及生理过程的媒介,能够准确识别和量化蛋白质的研究技术可极大地促进人们对生物学的理解。如今,蛋白质组已经可以由转录组被预测或推断出来。有充分的研究证据表明,蛋白质与mRNA水平之间的联系是复杂的,通过一种组学来预测另一种是不精确、不可靠的。那么,为什么在许多情况下,人们会优先选择通过mRNA预测蛋白,而不是直接进行蛋白质测序呢?答案在于两种组学测序技术的发展和物质本身的可检测性。目前,生物学家可以通过已有的核心技术和商业公司获得基本完整的转录组信息及分析结果,而蛋白组分析仍只限于专业实验室研究使用,在通量、稳定性和重现性方面还不能达到转录组分析水平。

第一代DNA测序仪绘制了具有突破性意义的基因组图谱,其原理是对分离DNA片段进行连续测序。尽管该仪器采用了自动化技术,但整个测序过程也是缓慢而昂贵的。只有开发可平行测序数百万个核酸片段,能够高通量、高覆盖率、低成本生成完整基因组图谱的方法,才能进行广泛的基因组分析。这些具有商业价值的测序技术已经改变了生物医学研究,并成为实验生物学研究的中流砥柱。

虽然“自上而下”的蛋白质组学研究方法正在逐步发展,但传统的蛋白质定量和测序仍是采用“自下而上”的方法进行。正如基因测序原理一样,这些方法是通过检测酶促反应切割蛋白质产生的肽链,以分析蛋白组成。在20世纪50年代,Pehr Edman发明了一种通过循环化学反应测定肽链氨基酸序列的方法,被称为Edman降解。该方法通过异硫氰酸苯酯与可接近的氨基偶联,然后从肽链的N-末端释放氨基酸并生成新N端,不断重复这一过程,对释放的氨基酸进行鉴定就可以得到肽链的氨基酸序列。Edman降解过程缓慢,需要大量的高纯度肽,尽管如此,直到20世纪90年代早期,所有已知的蛋白质序列都是使用该方法确定的。

20世纪90年代,随着质谱(MS)技术逐渐成为蛋白质测序的首选方法,Edman降解在该领域退居二线。质谱是通过检测质荷比和肽段的断裂模式来推断蛋白质组成和定量。因具有先进、强大和多样化特点,MS已经被广泛应用。仿效基因组学技术的发展路径,MS已经从特定寡聚体的人工测序发展到高通量的肽链自动测序,并发展到通过独立数据分析进行多肽的平行测序,如SWATH-MS。虽然这些方法的通量、准确性和重现性都很出色,但想要与基因组分析一样,实现相似的大样本队列常规、完整的蛋白质组量化目标仍难以实现。

随着当前数据独立采集MS检测系统的不断发展,最终取得与基因组学研究技术相似性能的蛋白测序技术也有可能实现。此外,要深入了解蛋白质组的复杂性,也需要颠覆性的新技术。虽然蛋白质的纳米孔测序技术显示了很好的发展前景,但StimaaNet等研发的肽荧光测序方法有着明确的常规应用途径,可以看作是这类颠覆性技术最先进的一个例子。肽荧光测序方法堪称跨越时代的结合,它将几乎被遗忘的Edman降解,与为下一代DNA测序开发的大规模平行荧光成像技术进行了整合(图1)。

图1. Swaminathan等人所描述的肽荧光测序。复合肽混合物,最有可能来源于酶或化学切割的蛋白质提取物,每种氨基酸残基都有不同的荧光标记(左)。在这种情况下,我们描述了一种双色方案,其中赖氨酸和半胱氨酸残基用不同的荧光标记。利用氨基硅烷的的酰胺键将标记肽的C末端固定在玻璃板。然后通过Edman降解和荧光成像(中)对肽进行N-末端氨基酸残基切割的迭代循环。在每个位置(即肽)的荧光强度被跟踪为Edman循环的函数。荧光强度下降模式为肽的部分序列提供了注释,得到的荧光信号可以与蛋白质序列数据库进行匹配和评分,推断样本中最有可能存在的一组蛋白质(右)。

肽荧光测序的第一步是在特定的氨基酸侧链上进行荧光标记,并将其C端固定在测序系统的流通槽中,以生成测序底物阵列。然后将固定化肽平行地进行Edman降解,在每一步降解后对固定化底物的集合进行成像。与经典的Edman降解不同,该方法在每个步骤对消除的苯硫代内酰脲-氨基酸结合物进行了鉴定,降解步骤仅用于测定由消除标记氨基酸引起的荧光强度下降。基于该原理开发的软件工具,可以将观察到的荧光信号与蛋白序列数据库结合起来,进而推导出每种固定化底物的序列,也就是肽链的序列。

该研究已经证明肽荧光测序的可行性。具体而言,作者(i)描述了在严格条件下,与Edman降解兼容的成像系统;(ii)测定了模型肽中荧光标记的赖氨酸或半胱氨酸残基的精确位置;(iii)描述了该系统中误差和低效的来源;(iv)研究了从更复杂蛋白质组鉴别蛋白质的潜力,并提供了一种从观察到的荧光信号推断肽序列的计算框架;(v)从含有多个丝氨酸残基的肽中定位特定的磷酸化丝氨酸残基。

Swaminathan等人开发的肽荧光测序方法是令人兴奋的,因为它开辟了一条通向肽的新研究路径,并使高通量、高重现性和潜在低成本的蛋白质组测序成为可能。该方法的一个显著优点是,它整合了其他研究方法的优势,如Edman降解、大规模DNA平行测序和基于MS的蛋白序列数据库检索计算框架。这种策略或有助于加快相关研究方法从证明概念到常规适用的转化速度。此外,该方法产生的数据与基因组学和转录组学的大规模平行先导数据有相似之处。MS蛋白组学技术在技术和计算方面仍存在较大的门槛,应用较为缓慢,与基于MS的蛋白组学技术相比,该方法有助于加速更多的生物体使用肽荧光测序技术。

正如Swaminathan等人所指出的,在新方法发挥其全部潜力之前,还必须克服一些技术和概念上的挑战。这些问题主要源于Edman降解的性质和人类蛋白质组的复杂性,包括以下内容:(i)尽管在研究中每个降解步骤的产率为91-97%,但可检测的肽链长度也是有限的;(ii)由于测序产率与蛋白序列本身有关,具有挑战性的序列,如富含脯氨酸的蛋白序列,可能会影响荧光信号的清晰度;(iii)可被荧光标记的功能基团仅限于肽链中可产生化学反应的基团,主要是氨基、羧基和巯基,因此荧光信号代表的信息量也会受限制;(iv)经修饰的残基通常不能被识别,除非经过特异荧光标记,这种特殊标记仅对氨基酸进行小部分修饰;(v)人类细胞蛋白质组的动态范围较大(~107),每种蛋白质也会通过酶消化产生大量的肽(~102),每个细胞会表达大量的开放阅读框(~104),在不考虑蛋白质多样性的前提下,这已经构成了巨大的分析挑战。对于肽荧光测序来说,满足这些挑战需要提高底物复用(substrate multiplexing)的水平,但目前尚未实现。

虽然作者开发的系统目前仅限于分析相对简单的混合物样本,但发展前景很好,是一种值得尝试的蛋白质测序方法。

参考文献:

1. Swaminathan, J. et al. Nat. Biotechnol. 36, 1076–1082 (2018)

2. Liu, Y., Beyer, A. & Aebersold, R. Cell 165, 535–550 (2016).

3. Goodwin, S., McPherson, J.D. & McCombie, w.R. Nat. Rev. Genet. 17, 333–351 (2016).

4. Toby, T.K., Fornelli, L. & Kelleher, N.L. Annu. Rev. Anal. Chem. 9, 499–519 (2016).

5. edman, P. Acta Chem. Scand. 4, 283–293 (1950).

6. Aebersold, R. & Mann, M. Nature 537, 347–355 (2016).

7. venable, J.D., Dong, M.Q., wohlschlegel, J., Dillin, A. & Yates, J.R. Nat. Methods 1, 39–45 (2004).

8. Purvine, S., eppel, J.T., Yi, e.C. & Goodlett, D.R. Proteomics 3, 847–850 (2003).

9. Gillet, L.C. et al. Mol. Cell. Proteomics 11, O111.016717 (2012).

10. Robertson, J.w.F. & Reiner, J.e. Proteomics 18, e1800026 (2018).

(1)

本文由 SEQ.CN 作者:戴胜 发表,转载请注明来源!

热评文章