科研

首页 - 全部文章 - 科研 - Nat Commun | 单细胞水平检测染色体外环状DNA多样性及复杂性的新工具scCircle-seq

Nat Commun | 单细胞水平检测染色体外环状DNA多样性及复杂性的新工具scCircle-seq

导读

染色体外环状DNA(eccDNA)是一类游离于染色体外的环状DNA,广泛存在于包括人类的各种真核生物中,参与调控基因的表达、细胞增殖、DNA损伤修复、肿瘤发生等多个生物学过程;其不易被核酸酶降解,结构更加稳定。目前,研究eccDNA主要方法有DNA荧光原位杂交(FISH)、批量全基因组测序(WGS)和Circle-Seq三种。前两种方法只能检测来自相对较大的基因组区域丰富的eccDNA,Circle-Seq能够识别广泛的eccdna但需要较大数量的细胞进行测序分析。

因此,目前亟需开发通用、可扩展的方法来检测从组织活检中提取的单个细胞或细胞核中的eccDNA,以揭示eccDNA的生物学复杂性,并阐明其在患者来源肿瘤样本中的异质性。

近日,瑞典卡罗林斯卡医学院的科研人员在Nature Communications杂志发表了题为“scCircle-seq unveils the diversity and complexity of extrachromosomal circular DNAs in single cells”的文章。研究团队开发并验证了Circle-seq的单细胞应用scCircle-seq,该方法适用于非固定和固定的细胞或细胞核,包括从肿瘤活检组织中提取的细胞核。研究显示,大多数eccdna在同一类型的细胞之间高度可变,且更倾向于在扩增基因组区域形成;将scCircle-seq应用三种不同癌症类型肿瘤样本中,发现肿瘤特异性的ecDNA图谱和具有不同ecDNA基因组模式的亚克隆群。综上,scCircle-Seq是一种易于扩展、直接和通用的方法,有望揭示癌症中eccDNA的生物学复杂性和异质性。

文章发表在Nature Communications

主要研究内容

scCircle-seq的实施和技术验证

为开发scCircle-seq,研究团队在Circle-Seq流程的基础上引入了一个额外的DNA缺口修复步骤,以提高eccDNA的检测效率,并设计了一个通用的工作流程,适用于在多孔板或单管中分选的活细胞和固定细胞或细胞核。为分析scCircle-seq数据,研究团队改编了先前用于分析大规模Circle-Seq数据的生物信息学流程:该流程首先搜索具有高测序覆盖度的基因组区域(即产生eccDNA的基因组区域,CPRs),然后通过搜索映射在CPR内的过度表示的不一致和分裂reads对,确定每个CPR内的所谓嵌合连接。此外,研究团队还检测了scCircle-seq的特异性,结果显示与预期一致。
研究团队将scCircle-seq应用于5个不同的细胞系进行分析,包括4个癌症衍生细胞系(HeLa、K562、Colo320DM和PC3)和1个永生化正常细胞系(293T),鉴定出的CPRs数量和相应基因组覆盖率在单个细胞和细胞系之间各不相同,这与已发表的Circle-Seq数据一致,表明大多数eccDNA在细胞间表现出显著的差异,并且在细胞分裂过程中以随机方式遗传

图1. scCircle-seq工作流程及数据验证。

单细胞中eccDNA的基因组图谱

研究团队分析了scCircle-seq检测到的eccDNA的基因组分布,以确定cccDNA是否存在一种模式,发现eccDNA在单细胞水平上变化极大,但在群体水平上可能检测到更明确的模式。根据同一细胞系所有单细胞中相应CPR的频率以及均匀性评分,研究团队将scCircle-seq鉴定出的eccDNA分成四组进行验证(图2)。结果显示,检测到的eccDNA绝大多数(88-99%)被归类为低频低均匀性(LFLU),少数被归类为高频高均匀性(HFHU),主要存在于Colo320DM、293T细胞中。上述结果表明,eccDNA在本质上是高度异质的,但scCircle-seq能够识别不同eccDNA类型
研究团队将鉴定的CPRs与各种基因组注释相交,进一步探索scCircle-seq检测到的eccDNA的基因组分布。CPRs在组蛋白H3K9me3(构成性异染色质)和H3K27me3(选择性异染色质)标记的染色质区域富集,表明在异染色质区域中eccDNA的形成更为频繁

图2. scCircle-seq鉴定的eccDNA的基因组分布。

接下来,研究团队将scCircle-seq与全长scRNA-seq方法Smart-seq2相结合,应用于三种细胞系(Colo320DM、HeLa 和PC3),检查了scCircle-seq检测到的eccDNA拷贝数与其所含基因表达之间的关系。分析显示,基因表达水平与 eccDNA拷贝数之间的相关性较低,但在含有已知致癌基因(如MYC)的大型ecDNA中,其拷贝数与单细胞中相同基因的表达水平呈正相关。

基于eccDNA的细胞类型分类

进一步,研究团队探究了细胞的eccDNA序列是否随机,或者是否可以使用scCircle-seq识别不同细胞类型的eccDNA特征(图3)。首先,研究团队将scCircle-seq检测到的CPRs基因组分布表示为cells×bins矩阵,其中cells是通过scCircle-seq分析的单个细胞的数量,bins是定义长度的连续基因组窗口;然后,使用cisTopic(计算框架)对细胞进行聚类,并使用可用的基因组轨迹对每个聚类进行注释。
结果显示,该方法能够成功地将属于同一细胞类型的所有细胞聚集在一起。此外,分析结果还表明,虽然相同类型细胞之间eccDNA的数量和起源区域存在很大差异,但不同细胞类型具有部分反映其表观基因组的特定eccDNA特征

图3. eccDNA的细胞特异性。

scCircle-seq应用于患者来源肿瘤样本

研究团队将scCircle-seq应用于从三个回顾性收集的冷冻肿瘤样本中提取的细胞核(1例前列腺腺癌,PRAD;1例三阴性乳腺癌,TNBC;1例管腔B型乳腺癌,LumB),证明了scCircle-seq对患者来源肿瘤样本的适用性。最终,共获得55个PRAD细胞核、87个TNBC细胞核和33个LumB细胞核的高质量测序数据,所有细胞中的环形DNA与线性DNA的比值接近100%,这与从永生化细胞系中获得的结果一致,表明即使在肿瘤活检中提取的细胞核,scCircle-seq也表现良好
结果显示,PRAD细胞中发现的CPRs数量最多,且CPR覆盖的基因组比例最高,其次是TNBC和LumB,表明这些肿瘤细胞具有不同的eccDNA图谱。此外,研究团队对单细胞CPRs基因组图谱进行UMAP降维分析和差异主题分析,发现PRAD与TNBC、LumB形成两个不同的簇,表明两类肿瘤携带不同的eccDNA基因组,这与其不同的起源组织一致。

研究团队还将LumB细胞和TNBC细胞中鉴定的CPRs与癌症基因组图谱(TCGA)数据库乳腺癌中鉴定的体细胞拷贝数改变(SCNAs)进行交叉分析。结果显示,与TNBC簇2细胞的CPRs相比,扩增区域在TNBC簇1 和LumB细胞的CPRs中显著富集。研究团队还分析了鉴定的eccDNA数量与给定基因组区域的拷贝数关系,发现CPRs的数量在二倍体和中等扩增区域没有显著差异,在扩增水平较高的区域明显更多。上述结果表明,肿瘤细胞的eccDNA分布情况反映出其SCNA情况,并且高度扩增的基因组区域可产生更多eccDNA。

图4. scCircle-seq在患者来源肿瘤样本中的应用。

结 语

综上所述,研究团队开发了scCircle-Seq方法,可以在单细胞水平上分析eccDNA的多样性和复杂性。scCircle-seq利用滚环扩增(RCA)和DNA缺口修复步骤来实现高检测灵敏度,不仅可以检测丰富的、包含癌基因的eccDNA,还可以检测罕见的eccDNA。特别地,scCircle-seq还简化了工作流程,降低了丢失低丰度eccDNA的风险。总之,scCircle-seq是一种可扩展的工具,可用于分析不同细胞和组织类型中eccDNA的复杂性,并有望进一步扩大eccDNA用于癌症诊断的潜力。

参考文献

Chen, J.P., Diekmann, C., Wu, H. et al. scCircle-seq unveils the diversity and complexity of extrachromosomal circular DNAs in single cells. Nat Commun 15, 1768 (2024). https://doi.org/10.1038/s41467-024-45972-y.

(0)

本文由 SEQ.CN 作者:白云 发表,转载请注明来源!

关键词:,

热评文章