基于多种疾病基因网络的目标基因的选择

揭示人类遗传性疾病的因果基因,如对理解这些疾病发病机理中的主要步骤,需要遗传和基因组数据的综合分析。虽然生物信息学方法已经被设计成选择目标基因,但因为连锁分析或关联研究,疾病和基因在现有方法的覆盖度是相当有限的,从而阻止在全基因组水平上一个显著比例疾病的因果基因的扫描。

为了克服这一局限性,清华大学自动化系江瑞副教授提出了新方法pgWalk,通过整合多个表型组和基因组数据来选择目标基因。该研究中取7719种疾病中表型相似性的三种类型和20327个基因中功能相似性的九种类型。基于表型和基因相似性,研究人员构造了一个疾病基因网络,然后模拟一个随机异构网络,对目标基因和查询疾病之间的关联强度进行量化。用费舍尔方法的加权版本得出27分,和一个最终的校正q值去优先候选基因。一系列的验证实验,以证明这种方法的优越性能。该研究还表明,该方法在自闭症和癫痫性脑病的外显子组测序研究的有效性。在线服务及pgWalk软件详见http://bioinfo.au.tsinghua.edu.cn/jianglab/pgwalk。该研究发表在2015年《Journal of Molecular Cell Biology》杂志上。

参考文献:

Walking on multiple disease-gene networks to prioritize candidate genes.Rui Jiang,et al.Journal of Molecular Cell Biology .2015

作者简介:

江瑞:北京清华大学自动化系副教授。清华973国家重点基础研究发展计划项目《基于新一代测序的生物信息学理论与方法》第四课题组学术骨干。研究领域生物信息学、系统生物学、模式识别、机器学习、统计推断。