科研

首页 - 全部文章 - 科研 - Science | 谢晓亮团队首次破译人类单细胞基因组3D结构,第一作者将亲临解读

Science | 谢晓亮团队首次破译人类单细胞基因组3D结构,第一作者将亲临解读

对于人类二倍体细胞中的46条染色体,其中23条来自母本,23条来自父本,共携带了包含30亿对碱基的基因组DNA, 全长近2米。看似繁杂的DNA链却能规律地折叠在直径约5微米的细胞核内,并完成所有的基因组“编码”功能。基因组三维(3D)结构对于基因表达调控和细胞功能具有重要作用。此外,基因组3D结构研究是国家重大需求和国际科学前沿,但我们对人类基因组3D结构的认识才刚刚起步。

随着测序技术的发展,染色质构象捕获技术,例如3C和Hi-C等,可以通过相邻DNA之间的互作(contact)来研究其基因组的3D结构。不同细胞间的差异只能通过单细胞测定才能检测到。然而,从单细胞层面破译人类二倍体细胞基因组的3D结构一直未能实现。

2018年8月31日,国际顶级学术期刊Science发表了人类细胞基因组3D结构研究的最新成果。谢晓亮教授的哈佛大学团队利用新开发的Dip-C方法,包括全新的单细胞基因组扩增方法META和适用于解释二倍体结构的软件,在高分辨率下,重建了来自淋巴母细胞系和原代血细胞的人类二倍体单细胞基因组的3D结构,定位了细胞核中特定单核苷酸变异和拷贝数变异。这是国际上首次成功破译人类二倍体单细胞基因组的3D结构,并发现不同细胞类型之间存在系统差异。8月31日,Science杂志还特别推出技术转化生物学(Technologies Transforming Biology)特刊,其中便对谢晓亮教授开发的这种革命性的基因组三维结构重建技术Dip-C进行了报道。谢晓亮教授已于今年7月全职回北京大学工作,任北京大学李兆基教授和北京未来基因诊断高精尖创新中心(ICG)主任。

研究通讯作者谢晓亮教授表示:“人类每个细胞的细胞核中都包裹着长达2米的DNA,基因组3D结构对于细胞的很多功能都非常关键。然而到目前为止二倍体细胞的3D结构一直未被破译,这主要是因为来自于母本的23条染色体与来自父本的23条染色体几乎无法区分。利用Dip-C的方法,我们首次获得了单个二倍体人类细胞基因组的3D结构,并且发现了不同细胞类型存在的系统差异这是针对细胞核的一种结构生物学新方法,将在生物医学很多领域有重要的应用。

想要成功重建高分辨率的基因组3D结构,就要解析染色质中大量的DNA互作位点。为此,研究团队开发了一种新的单细胞染色质构象捕获方法Dip-C,与现有方法相比,该方法能够检测出更多的染色质互作,且假阳性率极小。此外,研究团队舍弃了生物素捕获这一操作,而是利用多重末端标记扩增技术(META)进行高覆盖率的全基因组扩增,避免了人工嵌合体的引入。Dip-C捕获单细胞染色质构象流程见图1。

图1. Dip-C捕获单细胞染色质构象示意图

利用上述方法,在GM12878细胞系(一种女性淋巴母细胞细胞系)检测试验中,研究人员在每个单细胞中检测到104万个染色质互作。在来源于男性的外周血单核细胞(PBMCs)中,平均互作数为84万个,是现有方法所能达到的平均数的5倍。此外,该研究在10kb的分辨率下,检测了拷贝数变异(CNVs)、杂合缺失(LOHs)、DNA复制以及V(D)J重组等事件。

重建二倍体单细胞基因组3D结构的另一难题是确定每个染色质互作中包含的单倍型有哪些。为此,谢晓亮研究团队开发了一种基因型填补算法,该方法可以通过填补每个互作的单倍型来权衡邻近互作点的单倍型。经交叉验证,每一种单倍型的基因型填补准确率约为96%,并能够在结构重建过程中排除某些受损细胞。

图2. GM12878细胞系二倍体单细胞基因组3D结构图

在解决了技术难题后,研究团队利用Dip-C方法,首次成功重建了人类二倍体单细胞基因组3D结构,分辨率为20kb。结果显示,94%的GM12878细胞(16个中有15个)构建成功,(见图2)67%的PBMC细胞构建成功,并移除了一小部分问题细胞,包括6%(16个中有1个)的GM12878细胞和22%(18个中有4个)的PBMC细胞。

由于染色质构象捕获存在内部损失和噪音,该研究重建的基因组3D结构包含一些不确定因素,包括实验中染色质结构的干扰、3D建模过程中能量函数的误差、细胞核容积原因导致无法进行DNA测序(例如着丝粒、核仁、核散斑体)。这些不确定因素在所有的3C/Hi-C研究中都很常见,而且难以评估。当两个同源染色体十分靠近或者具有相似性状时,基因型填补方法可能就没有那么成功了,因此,其他问题区域可能在人工排除后仍然存在。

图3. 母体和父体等位基因的3D结构不同

通过进一步检测母本和父本等位基因间的结构关系,该研究在单细胞水平证实,基因组印记引起的两个等位基因有着不同的基因组结构,两个等位基因在转录活性上存在较大差异(见图3)。此外,该研究还发现不同细胞类型的整体染色质混合范围存在差异。尽管细胞间存在异质性,但来自母本的等位基因会更频繁的将IGF2和H19以及邻近的HIDAD位点进行分离,破坏IGF2-HIDAD CTCF loop结构,而来自父本的等位基因则更多的维持完全混合状态。

此外,该研究发现不同类型的细胞有着不同的基因组结构,这种结构分型对研究细胞功能有着至关重要的作用。癌症、遗传病的相关基因突变也可能破坏邻近区域的染色质结构。空间定位基因组变异的能力对于研究癌症和遗传病至关重要。借助该研究获得的基因组3D结构,研究人员可以精确描述基因组改变在细胞核中的精确位置

值得一提的是,该研究利用Dip-C方法以全面视角分析了不同基因组尺度下染色质随机、分形组成。虽然大量Hi-C研究发现染色质形成具有区室和结构域的“分形小球”,例如拓扑缔合结构域(TAD)和CCCTC结合因子(CTCF)环结构域,但迄今为止还没有一种全基因组技术能检测人类单细胞中的这类分型。该研究利用新开发的Dip-C技术,发现了每个染色体上连续的染色质颗粒的空间聚类和分隔,并发现这种分形可以通过每个染色体上所有可能子链的旋转半径矩阵进行量化。

人类二倍体单细胞基因组3D结构的成功破译有助于揭示细胞群体差异和细胞的进化路线,帮助科学家预测突变元件与靶基因之间的关系,也将帮助人类进一步探索细胞分化、癌变、记忆以及衰老等问题。

参考文献:

1. Tan L, Xing D, Chang C, Li H, Xie XS. (2018). Three-dimensional genome structures of single diploid human cells. Science,361: 924-8.

直播预告:一作亲临解读

近期,本文第一作者谭隆志博士将亲临探基学院“开讲啦,一作!栏目,对本篇Science力作进行深度解读!扫描下方二维码,添加探基妹妹微信(GeneTV100),即可加入探基学习群,随时关注基因测序行业第一作者最新技术动态!

 

(0)

本文由 SEQ.CN 作者:戴胜 发表,转载请注明来源!

热评文章