小鼠肝脏甲基化模式和复杂代谢特征的全表观基因组结合

DNA甲基化影响多个生物进程,但是通常没有被考虑到全基因组相关的研究中。表观遗传因素可能是复杂疾病的致病源, 加利福尼亚大学、清华大学等处研究人员合作,对90个小鼠近交品系的肝脏进行了亚硫酸盐测序、全基因组表达水平、蛋白质代谢组学和68个临床特征以及全表观基因组关联分析(EWAS)。研究表明DNA甲基化在个体间是高度变异的,并和分子以及心脏病先兆、糖尿病和骨质疏松症的临床特征相关。该成果发表在2015年4月《Cell Metabolism》杂志上。

在过去的十多年时间里,全基因组相关研究(GWAS)已经确定数百个基因变异影响的临床特征。DNA甲基化也被认为和基因表达以及包括癌症、衰老、多发性硬化、风湿性关节炎、肥胖的复杂性状相关。研究人员研究的集成系统基因数据包括SNP基因分型、DNA甲基化酸性亚硫酸盐测序数据、全基因组基因表达、蛋白质组学、代谢组学和临床表型。CpG甲基化狭义遗传的平均水平为27%,60%是高变异的CpGs。研究人员也为常见的遗传变异影响DNA甲基化提供了证据,并且实验也验证了Mtrr在调节基因组中CpGs甲基化水平的地位。

该研究用Illumina HiSeq 平台对文库进行测序,每个样本包含90±11百万那个的reads,然后用BS-Seeker2将数据比对到小鼠基因组。研究人员只集中研究在GC上。对同样的小鼠菌株,研究人员测量了68个临床性状,用质谱法描述了260个肝脏和血浆代谢物。

DNA甲基化在Cis中比在SNPs中有更低的相关性

染色体彼此靠近的双等位基因之间或连锁不平衡(LD)之间的相关性会导致大量的包含多个基因的基因块。研究人员感兴趣的是确定成对CpG甲基化水平的相关性。在全基因组水平上,研究人员发现CpGs之间依赖距离的相关性比SNPs低。

DNA甲基化中的自然变异和复杂性状相关

研究人员使用线性混合模型确定性状和CpGs之间的相关性,发现CpG甲基化的自然变化和大量复杂的临床和分子特征相关。

EWAS确定已知的和新奇的联想

研究人员观察到EWAS和GWAS之间的重叠高于表达ciseQTL(77%)、蛋白质(37%)cis-pQTL。临床性状通常比分子特征更复杂,例如基因表达或蛋白质水平。研究人员也观察到EWAS和GWAS相关性之间表达cis-eQTL(77%)比临床性状(15%)有更多的重叠。

有条件的相关性研究

研究人员用CpG作为预测因子,SNP作为共同变量。如果EWAS冲击仍然是有意义的,就表明重叠EWAS和GWAS之间的关系是相互独立但是局部共同作用。相反,如果EWAS冲击消失,就可认为EWAS和GWAS重复相关来自相同的信号。最后的实验结果都表明了多数的相关性,研究人员发现EWAS和GWAS在相关位点可能来自同样的信号。

因果推理测试

为了确定EWAS和GWAS的相关性确认差异甲基化水平来调节的,研究人员用R统计包执行了因果推理测试(CITs)。CIT运行了一系列可能的条件测试去确定基因位点(L)和性状(T)是通过DNA甲基化(M)来调节的。测试情况如下:

(1)性状和位点之间的联系;

(2)性状和甲基化调节的位点;

(3)甲基化调节和位点性状的相关性;

(4)位点和介质以及性状介质都是相互独立的。最后的实验结果表明剩下的EWAS冲击可能是次要的遗传关联。

主成分分析

与二级主要成分和研究特征的相关性一致,研究人员发现CpGs和该位点的一些基因相关。此外,研究人员确定了8号染色体的CpGs和二级主成分以及Mtor的表达水平相关,Mtor在代谢调节中起着应对营养、胰岛素和糖尿病的作用。

DNA甲基化可以用来推测表现性

遗传学和基因组学数据可以被用做疾病易感性和风险模型,是一个高价值资源。表观基因组在不同的组织中是变化的,并且被转录模式影响。

自然遗传变异影响全基因组DNA甲基化水平

Mtrr影响全基因组CpG甲基化水平

基于研究人员的GWAS结果,研究人员在HMDP mapping到13号染色体上观察到471个CpGs,这些CpGs贯穿小鼠基因组物理热点,研究人员假设它们的甲基化水平被Mtrr影响。

由于DNA甲基化模式是特定的发育阶段和细胞类型,可以应对不同环境或疾病,他们可以捕获细胞的状态,并提供一个比静态基因组细胞行为更详细的动态图片。研究表明CpG甲基化模式受自身的遗传控制,但是由于对生物体的状态更敏感,所以可以提供不能只从基因组序列获得的额外信息。

参考文献:

Epigenome-Wide Association of Liver Methylation Patterns and Complex Metabolic Traits in Mice.Orozco LD, et al.Cell Metab. 2015 Jun 

作者简介:

张奇伟:清华大学信息学院与医学院双聘教授,清华信息国家实验室合成与系统生物实验室主任,首批千人计划教授。清华973国家重点基础研究发展计划项目《基于新一代测序的生物信息学理论与方法》第三课题组负责人。主要科研领域与方向:计算生物学与生物信息学;合成生物与系统生物学。