其它

首页 - 全部文章 - 其它 - 测序周报 · 科研篇:《自然》鸿篇巨制,6篇文章描绘基因调控密码

测序周报 · 科研篇:《自然》鸿篇巨制,6篇文章描绘基因调控密码

近日,Nature公布了多篇文章详细介绍了健康组织的基因突变和基因表达之间的各种关联,是迄今为止最大规模的此类分析——堪称人体Google地图。

芝加哥大学医学系的Michelle C. Ward和Yoav Gilad共同发表题为“Human genomics: Cracking the regulatory code”文章对本期“鸿篇巨制”做出综合点评:

序言

身体里每个细胞都携带相同的DNA,但不同组织细胞却可以拥有不同功能。“基因型-组织表达(Genotype-Tissue Expression,GTEx)”项目试图找到隐藏着的答案。

通过表达定量性状遗传位点(expression quantitative trait loci,eQTL)绘图策略,研究人员生成了遗传变异和基因表达关联的综合性目录,范围覆盖许多组织和人群。

了解GTEx

20年来,人类在理解动态基因组调控程序基础上取得了相当大的进展。最突出的挑战是理解和预测个体之间的遗传差异对特定性状的直接后果,包括疾病的易感性等。

大量工作表明,驱动疾病等复杂性状个体差异的遗传变异,往往集中在决定基因何时何地表达的基因组非蛋白质编码区。

因此,2010年成立GTEx项目旨在1.建立存储、编目、检索、共享合集数据的在线GTEx门户;2.建立用于人类eQTL分析的新统计方法;3. 建立获取和分析多人体组织DNA和RNA的“实验室、数据分析和协调中心(LDACC)”;4. 增强版的GTEx项目还涉及除了基因表达以外的其他维度的GTEx数据收集和处理。

上图 从人类多组织中采集DNA和RNA,每个供体都携带不同遗传变异,这里以G/G、A/G、A/A单碱基差异为例。首先测量与基因型相关的RNA(基因表达水平),每位捐赠者的RNA水平并不相同。RNA表达水平被视为eQTLs,当eQTLs与遗传变异存在相关性和潜在因果关系时,新的遗传变异-基因表达关系就被确立。图中例子G/G变体与大脑基因高表达相关,A/A变体与低表达相关,A/G与中表达相关。健康和不健康个体之间的eQTLs比对,有助于疾病基因发现。

2015年,GTEx项目顺利触达半程里程碑。截止到当年10月,预期960个遗体捐赠者中449人的51个组织位点、9600个RNA-seq样本、2条细胞系、以及44个组织的eQTL的基因型数据公开发布,全基因和亚型的表达数据集可通过GTEx门户下载,基因型和RNA-seq的bam文件可通过dbGap数据库下载。

克服大规模获取人类验尸样本所涉及的伦理、法律和技术挑战,来自7个国家的13个研究机构协调一致,攻下这项对全人类健康生存意义重大的生命科学研究。

研究人员正在收集冷冻人体标本

四篇《Nature》文章介绍

在这4篇文章中,联盟提交了第二阶段研究报告,也是目前最大范围的此类调查。

  • 第一篇题为“Genetic effects on gene expression across human tissues”的文章(题名作者分别来自斯坦福大学、普林斯顿大学、宾夕法尼亚大学和约翰霍普金斯大学)利用GTEx的庞大数据集,对人类基因组中几乎所有受遗传变异影响的基因表达进行批注。大部分影响基因表达的变异坐落于被影响基因序列内的数千碱基,被命名为顺式-eQTL(cis-eQTL)。这种变异类型通常处于修改被影响基因二选一拷贝的调控基因序列区——例如,基因的启动子、增强子、抑制子等调控元件。

另外,本文还介绍了数百个反式-eQTL(Trans-eQTL),它们影响基因表达,但身处较远区域,甚至在不同染色体上。这类变异通常改变基因的全部两个拷贝的调控,例如它们通常能够编码转录因子或小RNA。

作者介绍,大部分组织倾向于使用顺式-eQTL改变基因表达,相反,1个或极少数的几个组织的基因表达受反式-eQTL影响。大约一半疾病相关遗传变异与基因表达改变相关。这一数据证明,鉴定受疾病相关遗传变异影响的基因和各种通路,采用大规模eQTL研究事半功倍。

  • 第二篇文章(题为The impact of rare variation on gene expression across tissues)的第一顺位共同一作是斯坦福大学的华人学者Xin LI,本文和第一篇文章属于同一位通讯作者(斯坦福大学的Stephen B. Montgomery)。

他们进一步扩展了罕见变异的基因表达。每个个体都有数千万的罕见非编码变异体,这些变异常常被临床和疾病研究忽视,而且它们也不属于典型的eQTL分析。作者们开发了整合部分独立个体的DNA序列和基因表达的统计分析方法,通过该方法确定了罕见变异对基因表达的重要性,最终可实现预测个体基因组内DNA变异对细胞、乃至疾病的影响。

  • 第三篇和第四篇文章,利用GTEx和其他数据集分别探讨了影响基因表达的变异如何调节RNA编辑进程和X染色体失活。

GTEx更深层次的影响

除了已发表的文章,GTEx为整个科学界提供了一个资源宝库,包括可调用的原始数据(www.ncbi.nlm.nih.gov/gap)和处理好的数据(www.gtexportal.org)。尽管联盟所采用的样本收集、质量控制、数据标准化和组织化工作方式可能不是最尖端的(因为已经开展好几年了),但因其工作的彻底化和结果的透明公开化,这些数据可以很容易地被其他研究人员查询和重新审视。

研究趋势

随着项目的向前推进,GTEx将面临以下三个主要挑战。

首先,已发现的将近100万种与不同基因表达有关的遗传变异,大多数遗传变异并不能直接导致基因表达差异。DNA变异通常在基因组中相互关联,批量向下一代传递。这意味着,除特定性状的因果变异之外,还可以找到许多相关的非因果关联。一些因果变量GTEx联盟可能还没有完全定义。一个完整的独立个体的全基因组测序需要鉴定所有存在相关性的变体,因此,应该开发新方法来预测这些因果变异。利用CRISPR–Cas9基因组编辑技术操纵遗传变异,然后分析基因表达上的差异或许可使研究人员能够确定具有因果关联的遗传变异。

其次,目前的结果侧重于覆盖面广和样本量大,未来使用高分辨率的单细胞处理技术将有助于提升个体细胞遗传变化对基因表达的影响。

第三,在现有的描述性工作基础上,今后的目标应逐渐向了解构成基因调控程序、多功能基因组试验(例如染色体的可接触性、转录因子结合、DNA甲基化修饰)等实际工作机制研究转变,而且多种检测方法应在同一细胞中进行。遗传变异不仅可影响RNA水平,亦可能与其他基因-调节级联的各个方面有关,例如基因转录率、RNA加工机制、翻译速率等。这些内容将在“增强版的GTEx”项目中得以实现。Nature子刊《Nature Genetics》发表题为“Enhancing GTEx by bridging the gaps between genotype, gene expression, and disease”综述,对此进行了更详细的讨论。

最后,目前所采用的冷冻组织标本对许多动态实验可能并非最佳选择。未来研究应使用干细胞模型、体外分化细胞等活标本来生成数据作为现有冷冻标本数据的补充。

总的来说,GTEx联盟举足轻重的大规模研究使我们距离解码基因组调控密码的旅程更近一步,基因变异对基因表达的影响正在逐渐明朗化。

参考资料:

Nature 550, 190–191 (12 October 2017) doi:10.1038/550190a

Nature 550, 204–213 (12 October 2017) doi:10.1038/nature24277

Nature 550, 239–243 (12 October 2017) doi:10.1038/nature24267

Nature 550, 244–248 (12 October 2017) doi:10.1038/nature24265

Nature 550, 249–254 (12 October 2017) doi:10.1038/nature24041

Nature Genetics (2017) doi:10.1038/ng.3969

(0)

本文由来源 生物通,由 戴胜 整理编辑!

热评文章