科研

首页 - 全部文章 - 科研 - 测序周报丨关注单细胞技术最新进展:海量数据分析工具问世,可视化工具升级

测序周报丨关注单细胞技术最新进展:海量数据分析工具问世,可视化工具升级

自2009年北京大学生命科学学院汤富酬教授等人首次报道单细胞RNA测序技术以来,越来越多的相关成果喷涌而出,使单细胞RNA测序技术在速度、成本、灵敏度、准确性等方面得到了不同程度的提高,单细胞RNA测序技术能够以前所未有的精细程度对罕见样品进行研究。2013年,世界首款单细胞RNA测序自动处理系统上市,再次降低了科研人员进行单细胞研究的技术门槛,使该技术的应用范围进一步得到扩大。

此前,单细胞RNA测序的挑战主要来自灵敏度和准确性方面,相关研究人员也在不断努力改进。2017年12月,Nature Methods发表了一项新型单细胞测序方法MATQ-seq,该方法的灵敏度和准确性较高,可检测相同类型单细胞之间的基因表达差异,并且RNA捕获能力较高。同月,Nature Communications也公布了10X Genomics公司和Fred Hutch团队开发的单细胞测序微流体平台,该平台可进行数千甚至上万的单细胞测序,为单细胞转录组研究提供更具扩展性的平台。

从已有研究报道可以看出,单细胞RNA测序存在的上述问题已经得到部分解决。你以为可以松口气了?

NO,问题远未完全解决!

现在的问题是,虽然许多单细胞RNA测序方法可以同时处理数千个甚至数万个单细胞,灵敏度和准确性也有提高。但已有的分析工具还无法满足海量数据的分析需求,并且在寻找标记基因方面也缺乏敏感性。此外,在单细胞RNA测序的可视化方面还存在很大的缺陷。在近日发表的两项独立研究中,科学家就以上问题进行了探索,并取得了一定的成就。

海量数据分析不再是阻碍

为解决单细胞测序数据分析问题,日前,来自西班牙的科学家开发了一种新型单细胞测序数据分析工具BigScale,该工具除可以对数百万个细胞的测序数据进行分析处理外,其建立的数据模型还能识别特异细胞与细胞群之间的细微表达差异,解决了未来单细胞测序面临的部分挑战。相关研究已发表在Genome Research上。

BigScale架示意图

为验证BigScale的数据分析性能,该研究团队利用神经元祖细胞异常基因表达的生物学模型和模拟数据集进行了评估,包括差异表达分析、细胞亚群和RNA生物标志物鉴定等模块。值得一提的是,该方法能够分析多达100万个细胞的测序数据,还能靶向细胞群进行针对性分析,预测两个细胞之间或细胞亚群之间的差异。

不同数据分析工具灵敏度、特异性和速度比较

研究团队在1920个神经元祖细胞中进行了验证,与传统单细胞RNA测序的性能比较后发现,BigSCale在所有检测的细胞特异性中均显示出高敏感性,表明该方法在生物数据的敏感性方面优于其他单细胞差异表达测序方法。在差异表达分析速度评估中,BigSCale可在3分钟之内产生结果,是速度最快的。与单细胞分析工具MAST的扩展性相比,BigSCale在32000个细胞的40000个基因中进行差异表达分析中,BigSCale分析样品的速度最快。此外,BigSCale可以分析超过8000个细胞的测序数据,而MAST由于自身限制无法做到。

为进一步测试BigSCale对大型数据的分析能力,研究团队对130万个小鼠前脑细胞进行了检测,最终研究人员发现了罕见的细胞亚群,甚至还发现了从未被认知的与细胞特定分化阶段、空间组织和功能相关的RNA异质性。

一次成像单细胞的10421个基因

在西班牙的科学家在单细胞测序数据分析领域取得突破的同时,来自加州理工学院的Long Cai教授则对可视化发起了挑战,早在2014年和2017年,他的研究团队就开发了seqFISH的两个版本,这一技术能用于确定单细胞中超过200个基因的表达水平,还能分析体内原位细胞的基因活性。

在seqFISH基础上,Cai教授的研究团队对该技术进行了升级,成功开发了内含子seqFISH技术。研究人员利用新的内含子seqFISH技术能同时识别数百个不同单细胞的半个完整基因组,可一次成像单细胞内的10421个基因。该技术的成功开发无疑成为单细胞RNA测序可视化的一个重大进展。相关研究已发表在Cell上。

内含子seqFISH示意图

新开发的内含子seqFISH技术,研究范围扩展到了基因组水平,成像范围也扩大到了单细胞内超过10000个基因,约占哺乳动物基因总数的一半。而且每个内含子都被标记上了唯一的荧光条码以便观察。当某个基因被开启时,荧光条码可以指示基因表达的位置和强度。该技术首次对内含子的监测。

转录组的变动周期为2个小时

此外,研究人员还发现,细胞分裂和复制需要12~24个小时,而转录组的变动周期为2个小时,这意味着,体内许多细胞的基因突变周期可能仅为2小时!此前,人们从未发现过这一变动周期,一是不同细胞之间的转录组变动并不是同步进行。二是已有的测序成像技术的噪音问题,研究人员无法准确判断这一现象。三是哺乳动物的mRNA分子寿命为3-4小时,只有直接测量内含子才能发现2小时周期。现在内含子seqFISH技术的高精确度克服了以上问题,向人们揭示了这一生命现象。

同时,研究人员还惊奇的发现,大多数活跃的蛋白质编码基因都位于染色体表面,而不是内部。Cai教授表示,内含子seqFISH可应用与任何组织,除了可视化染色体结构,还能帮助我们定义细胞类型、预测细胞变化。

结  语

目前,单细胞RNA测序主要应用于癌症、遗传性疾病、细胞分类、神经和胚胎发育等的基因表达与调控研究。虽然单细胞测序技术已经有可能解决很多生命科学领域的重大问题,但是技术上的进步还远远没有结束。自动化和规模化是未来单细胞测序的发展方向,因为只有分析足够多的样本才能够充分认识遗传多样性。无论何时,海量的数据分析都需要可靠的工具作为支撑。希望在不久的未来会有更多更好的单细胞测序数据分析工具出现。

参考文献:

1.Effective detection of variation in single-cell tranomes using MATQ-seq.

2.Massively parallel digital transcriptional profiling of single cells

3.Spanish Researchers Develop Single-Cell RNA Sequencing Analysis Tool for Large-Scale Interpretation

4.Dynamics and spatial genomics of the nascent transcriptome in single cells by intron seqFISH

(1)

本文由 SEQ.CN 作者:陈初夏 发表,转载请注明来源!

热评文章