近日,哈尔滨工业大学的王亚东、赵天意、国宏哲团队面向细胞水平的多组学遗传调控关系,构建了当前最全面、最系统的综合资源xQTLatlas (http://www.hitxqtl.org.cn/)。该研究成果已发表在国际权威期刊Nucleic Acids Research,文章题为“xQTLatlas: a comprehensive resource for human cellular-resolution multi-omics genetic regulatory landscape”。
xQTLatlas基于标准化的数据处理流程,整合了来自不同细胞分辨率xQTL映射策略和生物条件(如治疗、病态或其他刺激条件)的汇总统计。当前版本的xQTLatlas收录了来自55种人体组织的151种细胞类型和339种细胞状态的796个数据集,覆盖了20种xQTL类型。该平台支持功能变异、分子表型和基因组区域的多尺度遗传调控景观探索,设计了多层次交互式可视化工具,使研究人员能够系统地研究风险变异的调控机制,并支持跨细胞类型、表型与遗传变异的关联分析。
xQTLatlas概览
xQTLatlas为研究人员提供了从多个维度全面探索细胞xQTL(cd-xQTL)的能力。通过数据探索界面,用户可以有效地深入研究功能变异及其与表型的关联,并按xQTL类型系统地组织(图1)。
当用户利用基因组位置或dbSNP ID搜索遗传变异时,首先呈现的是一个整洁的数据概览,功能变异按照xQTL类型和组织类型进行分类组织。当用户选择了特定的xQTL类型,平台将以交互式热图的方式展示特定组织中不同细胞类型的遗传关联概览。该热图的横纵轴分别对应不同的细胞类型和表型,热图中每个特定区域表示该细胞类型与特定表型之间的变异关联统计,其中颜色的深浅由关联数量决定。点击任一热图单元后将跳转到选定细胞类型中不同表型与功能变异间的关联强度和效应大小的统计信息。这些信息通过柱状图的形式展示,柱状图的高度由表型-变异关联的-log10 p值中位数决定,颜色由效应大小的绝对值决定。此外,跨细胞类型共享视图提供了不同细胞类型间特定表型-变异的关联程度,各数据点根据原始出版物的信息进行着色。在跨细胞类型共享视图的下方,汇总统计表会根据用户的选择动态更新,提供细胞背景和表型的详细注释,以及每个xQTL的关联p值、效应大小和标准误等关键统计指标。
图1. 变异探索模式的可视化分析结构
在表型模式中,用户从类似于变异模式的概述开始(图2)。在交互式热图中,纵轴代表不同的功能变异。每个数据单元格中的颜色强度由-log10 p值中位数决定,支持用户启用放大和缩小选项以进行定制的区域查询。点击热图中的特定细胞类型则展示所选细胞类型的locus图,最显著的xQTL被特别标记,数据点的颜色由发布源决定。此外,xQTLatlas还支持对特定基因组区域内的调控景观进行定制探索。为了确保最佳性能,研究团队建议将搜索范围限制在200kb以内。在基因组区域模式中,数据被组织成交互式热图、locus图和点图,遵循与表型模式相同的用户友好格式。
图2. 表型及基因组浏览器的可视化分析结构
xQTLatlas包括一个交互式基因组浏览器(图2D)。在“Browser”页面中,数据集按组织、细胞类型、细胞状态、cd-xQTL映射策略和发布来源进行分类。用户可以通过添加多个轨道比较多组学cd-xQTL数据集来定制他们的分析。此外,xQTLatlas支持基因组区域、表型或变异的精确定位,并突出显示特定的cd-xQTL数据,以更好地满足用户需求。单击数据点将显示关于每个cd-xQTL的详细信息,包括dbSNP ID和关联p值等信息。
论文链接:https://doi.org/10.1093/nar/gkae837
本文由 SEQ.CN 作者:陈初夏 发表,转载请注明来源!