目前,由于缺乏相关多组学图谱,多数现有单细胞数据库仅能基于单细胞RNA测序(scRNA-seq)数据提供简单的细胞概况或特征图谱,迄今尚未有能够同时对几乎所有人体组织的多个单细胞组学数据进行深入、实时和快速查询的数据库,这迫使、人们在绘制多组织和多组学人类图谱的基础上,构建一站式单细胞多组学可查询数据库。
近日,中国医科大学李薛鑫团队与合作者在Genome Biology上发表了题为“Single Cell Atlas: a single-cell multi-omics human cell encyclopedia”的文章。研究团队对来自125个健康成人和胎儿组织的五种单细胞组学、空间转录组学以及两种批量组学数据集中的分子表型变异进行全面表征,构建了人体组织的单细胞多组学图谱及其补充网络平台SCA(www.singlecellatlas.org),可对胎儿和成人组织的深度多组学特征进行广泛交互式数据探索。综上,该图谱资源和数据库查询旨在为各种组学研究提供一站式、全面且高效的资源,帮助人们更深入地理解不同人类组织的复杂性。
文章发表在Genome Biology
研究团队从已发表的资源中对125个成人和胎儿组织的8种组学类型数据进行综合评估,包括单细胞转录组学(scRNA-Seq)、单细胞表观基因组学(scATAC-Seq)、单细胞蛋白质组学(Flow、CyTOF)、单细胞免疫分析以及空间转录组学和传统批量组学(RNA-seq和WGS),构建了一份全面的健康人类单细胞多组学图谱以及配套网站,称为SCA(Single Cell Atlas)(图1)。每种组织至少包含两种组学类型,结肠、血液(全血和PBMCs)、皮肤、骨髓、肺等器官/组织至少包含5种组学层次结构;特别地,结肠具有完整的组学层次结构。
图1:健康人单细胞多组学图谱。
在SCA中,scRNA-seq分子层包含了92个成人和胎儿组织,几乎涵盖人体的所有器官和组织。因此,研究团队对scRNA-seq数据中的所有细胞进行了分析,并对417种细胞类型进行精细粒度注释,将其重新分类为17种主要细胞类型。结果显示,大多数组织包含基质细胞、内皮细胞、单核细胞、上皮细胞和T细胞;上皮细胞占比最高,其次是基质细胞、神经元和免疫细胞。成人组织细胞以上皮细胞、免疫细胞和内皮细胞为主;而胎儿组织中多数为基质细胞、上皮细胞和血细胞。
研究团队对上述92个组织的scRNA-seq数据进行综合评估,以探究不同发育阶段组织中的细胞异质性。对每个组织进行差异表达(DE)分析,以获得每种细胞类型的差异表达基因(DEG)特征,进一步评估了不同组织中细胞类型之间的整体基因表达模式。结果显示,成人和胎儿组织显示出不同的DEG聚类模式:成人组织中,免疫细胞(即B细胞、T细胞、单核细胞和NK细胞)与血细胞、基质细胞、神经元等形成了不同的细胞簇;而胎儿组织中的分离特征相对不明显。
接下来,研究团队确定了每个组织不同细胞类型的活跃转录因子(TFs),以分析了成人和胎儿组织的潜在基因调控网络(GRN)。结果显示,成人组织和胎儿组织中的基因表达和转录调控模式具有一致性,表明这两种分子活动之间存在直接而统一的相互作用;但TF聚类模式不同,成人组织中不同细胞类型表现出更相似的转录活性,而低分化的胎儿细胞类型具有更多共同转录活性。
图2:成人和胎儿组织之间的相似性和异质性。
研究团队对成人和胎儿组织中19个组织的scRNA-seq数据细胞类型进行伪批量整合分析,发现成人细胞类型形成了不同的T细胞、B细胞、血细胞、基质细胞等细胞类型簇,而胎儿细胞类型形成了一个独特的细胞簇。接下来,研究团队对每个细胞簇的最高上调基因进行生物过程(BPs)的GO通路和KEGG通路分析。结果显示,对于GO通路,成人和胎儿组织B细胞和T细胞中的重要BP相似,上皮细胞和神经元中的相关BP不同;对于KEGG通路,成人和胎儿组织在T细胞和上皮细胞中共享共同TOP通路。
图3:成人和胎儿组织之间的组间和组内相似性。
为绘制单细胞免疫分析(scImmune profiling)数据中细胞类型水平的免疫图谱,研究团队结合相应的scRNA-seq数据对其进行综合深入分析,研究了6种组织中T细胞和B细胞的克隆扩增,并揭示了不同细胞类型的差异克隆扩增位点。结果显示,在T细胞谱系中,高比例的大型或高扩增克隆主要存在于再表达CD45RA的终末分化效应记忆细胞(Temra)CD8 T细胞和细胞毒性T细胞中,其中大部分存在于肺中;MAIT细胞在各种组织中也表现出了大量或高度扩增,特别是在血液、结肠和子宫颈中。相反,单个克隆主要存在于幼稚辅助T细胞和幼稚细胞毒性T细胞中,并且在各种组织中均匀分布。对于血液中的B细胞谱系,大多数免疫细胞保持为单个克隆或小克隆,其中一小部分幼稚B细胞和记忆B细胞表现出中等的克隆扩增。
图4:多模态分析显示,通过scRNA-seq与scImmune分析相结合,揭示了6种组织中的克隆型扩增图谱。
为探究表型图谱以及不同组学方法和数据集之间的相互作用,研究团队对结肠组织的5种组学数据集进行分析。转录组图谱显示,成人结肠主要由大量的免疫细胞和上皮细胞组成;胎儿结肠含有大量的间充质干细胞(MSCs)、成纤维细胞、平滑肌细胞、神经元和肠上皮细胞,以及少量免疫细胞。研究团队还分析了成人、胎儿组织之间的MSC谱系细胞类型,进行拟时序转变分析。结果显示,成人和胎儿成纤维细胞在转录和调控模式上都与MSC高度相似,在拟时序上也都更接近MSC,且这种转变比其他细胞早得多。此外,在MSC到成纤维细胞的转变过程中,ARID5B、FOS、FOSB、JUN和JUNB等调控元件(TF)在成人和胎儿成纤维细胞之间显示出几乎相同的轨迹模式。
最后,研究团队对成人和胎儿结肠的scRNA-seq数据进行受体-配体相互作用分析,以研究细胞的相互作用。结果显示,成人结肠中,成纤维细胞组成了与CD8 T细胞(CCL8-ACKR2)、(其他)成纤维细胞(CCL13-CCR9)、杯状细胞(CCL13-CCR3)和肥大细胞(PROC-PROCR)等细胞的主要相互作用。在胎儿结肠中,主要相互作用对主要来自成纤维细胞和巨噬细胞与其他细胞的相互作用,如成纤维细胞(C4BPA)和内皮细胞(CD40)等。此外,在成人和胎儿结肠的scRNA-seq中,基于CCL家族配体-受体相互作用的成纤维细胞与其他细胞的积极相互作用,表明其在结肠中免疫细胞募集中起关键调节作用。
图5:深入的scRNA-seq分析揭示了成人和胎儿结肠之间的明显差异。
SCA提供了用户友好的界面以及直观、简单的导航,旨在促进科研人员对来自125个健康成人和胎儿组织的8个单细胞和批量组学进行无缝导航和高效表型检索,助力探究多组学多组织资源的复杂层次。此外,SCA将实施年度更新,更新包括一年中新发表的研究结果和新收集的表型分析。这些更新有望填补每种组学类型在组织表征方面的空白,并同时扩大每种组织的样本量。
图6:SCA网站。
综上所述,该研究在单细胞水平上对健康人类的多组织和多组学图谱进行全面评估,构建了多组学人类单细胞图谱及其配套的网络平台SCA。这一创新平台简化了多组学分析的交互过程,避免了大量数据的整合,有望降低成本并加速相关研究。SCA的大数据框架有助于探索广泛的表型特征,提供比传统单组学或批量分析更有代表性的研究人群快照。这种多组学方法将有助于揭示多维生物系统的复杂性,并提供了一个整体视角,增强人们对生物现象的理解。
参考文献:
本文由 SEQ.CN 作者:白云 发表,转载请注明来源!