科研

首页 - 全部文章 - 科研 - Nature Methods | 自由探索4D核组数据——马坚团队发布Nucleome Browser平台

Nature Methods | 自由探索4D核组数据——马坚团队发布Nucleome Browser平台

导读

人类基因组包含超过20000个基因和更多的调控元件,在过去十年中,大规模测序计划和国际联盟对基因组及活跃的细胞类型进行了系统研究,例如ENCODE、Roadmap Epigenome、国际人类表观基因组联盟等。虽然这些研究已经注释了数千个基因和数百万个候选调控元件,但这些元件对远距离特定靶基因发挥调节作用的机制仍不清晰。
染色体的空间折叠及其在细胞核中的结构对基因表达有深远的影响。例如,增强子调节靶基因转录需要空间可及性,核层附近染色质的聚集与基因沉默和复制时间相关等。此外,全基因组关联研究确定了大量与疾病相关的基因座,这些基因座中的大多数位于远端潜在的调控非编码区域。以上研究强调了远端元件对基因调控的重要性,并提出了一个令人兴奋的可能:通过绘制远端染色质相互作用和三维基因组能够为揭示疾病基本机制提供新的证据。
要确定基因组如何运作,不仅需要了解信息沿染色体的线性编码,还需要了解其三维组织及其随时间的动态变化,即“4D核组”(4D nucleome)。同时,决定基因组结构的生物物理和分子因素,以及这种组织如何促进基因调控等也值得深入探索。为此,2017年,霍华德·休斯医学研究所、加州理工学院等六个研究中心组成了交叉学科联盟并发起了“4D核组计划”(The 4D nucleome project, http://www.4dnucleome.org/ )。

4D核组计划启动

该联盟计划开发基因组和成像技术,并搭建计算模型了解4D核组,相关研究将与表型和研究对象的结构和功能验证相结合,开发一套方法来绘制基因组的结构和动力学,并将这些特征与其生物活动联系起来,最终提供可用于生成4D核组模型的综合方法。为了解正常和疾病状态下基因组如何组织、维护、表达和复制机制提供新的见解。

图1. 4D核组计划由三部分组成,来源:Nature

近日,美国卡内基梅隆大学计算机科学学院马坚团队Nature Methods发表了题为“Nucleome Browser: an integrative and multimodal data navigation platform for 4D Nucleome”的文章,介绍了Nucleome Browser平台(http://www.nucleome.org)。Nucleome Browser是一个集成和交互式多模态数据可视化和探索平台,可加速4D核组数据的访问、利用和共享。该平台有两个独特的优势:多组数据集、成像数据集和3D基因组结构模型的整合和同步可视化;可以自定义数据集与现有数据库门户,例如UCSC Genome Browser,在统一的交互式平台中的可扩展集成,最终实现广泛的数据共享社区。

文章发表在Nature Methods

据文章介绍,Nucleome Browser由一系列Web组件组成,这些组件可以由用户灵活排列和定制,并为异构数据集或来自同一数据模态的不同视图的集成可视化提供同步操作。Nucleome Browser的Web组件包括:(1) 基因组浏览器,用于可视化1D和2D基因组数据;(2) 显示组件用于3D基因组结构模型;(3) 针对特定数据类型定制的可扩展Web 应用程序。每个Web组件都通过自适应通信机制封装到面板中,用户可以组合多个链接面板进行多组学比较或多模式数据探索。更重要的是,面板的布局可以保存到会话中,方便管理和共享浏览器的视图。
自适应通信设计的核心组件是一个多通道分层事件调度中心,可自动识别用户在任何Web 组件中触发的操作,然后同步更新来自不同域门户的Web组件或数据状态。例如,当用户在基因组浏览器面板中导航到或突出显示感兴趣区域时,所有其他面板或门户,包括UCSC基因组浏览器和Python Jupyter,会同步更新以显示和突出显示相应的区域,这种多路通信是通过Nucleome Bridge网络浏览器扩展实现的。
此外,用户也可以将面板划分为特定通道,以便同步仅限于同一通道内的面板。因此,用户可以在不同的细胞环境中有效地进行核组织结构的综合比较。截至目前,Nucleome Browser是第一个支持这种多领域、多通道交互式可视化的平台,极大地增强了异构和多模态数据的探索。

图2. Nucleome Browser及基于此的多模态4D核组数据交互式探索,来源:Nature Methods

新开发的多重免疫FISH(荧光原位杂交)成像方法提供了基因组图谱无法提供的3D染色质定位的直接全基因组可视化。研究团队还构建了定制的Web应用程序,以证明用户可以将Nucleome Browser上托管的基因组数据与原位基因组测序(IGS)成像数据、单细胞3D基因组结构模型进行交互比较。
对于IGS数据,用户可以浏览单细胞图像数据集,并在图像上突出显示FISH探针的标记。同时,基因组浏览器中突出显示基因组区域,也会突出显示图像中与这些基因组区域重叠的FISH探针,从而允许基于测序的基因组特征与其3D空间核定位进行交互式比较。因此,这种设计支持跨多个域多模式数据集的集成可视化,同时也促进未来的扩展以支持新的数据类型。

图3. Nucleome Browser可将原位基因组测序数据连接在图像资源,来源:Nature Methods

总而言之,Nucleome Browser代表了用于多尺度核组织的集成和多模式数据可视化的新一代平台。Nucleome Browser可为用户充分利用不同类型的4D核组数据和不同的3D表观基因组学数据集在广泛的生物环境中融合多尺度核结构和功能提供重要门户,从而实现模型整合和广泛的数据共享社区。
该研究是4D核组计划的一个重要组成部分,能够帮助科学家自由探索多组学、多模式下的细胞核结构和功能,为最终确定基因组结构和染色质构象如何调节健康和疾病中的基因组功能提供有力的工具。
参考文献:
1. Zhu, X., Zhang, Y., Wang, Y. et al. Nucleome Browser: an integrative and multimodal data navigation platform for 4D Nucleome. Nat Methods (2022).
2. Dekker, J., Belmont, A., Guttman, M. et al. The 4D nucleome project. Nature 549, 219–226 (2017).
3. Payne A C, Chiang Z D, Reginato P L, et al. In situ genome sequencing resolves DNA sequence and structure in intact biological samples[J]. Science, 2021, 371(6532): eaay3446.
(0)

本文由 SEQ.CN 作者:白云 发表,转载请注明来源!

热评文章