外显子组测序研究揭示由非同义单核苷酸变异引起的疾病

外显子测序已被广泛用于检测人类遗传疾病的致病非同义单核苷酸变异(SNVs)。然而传统的统计遗传学方法对于分析外显子测序数据是无效的,由于大量测序变异,致病性的罕见变异或从头突变是不可忽略的,还有规模有限的影响和正常人群。事实上外显子测序的广泛应用已经呼吁用于识别从大量测序变体的致病非同义SNVs的有效计算方法。

清华大学自动化系江瑞副教授与清华大学生物信息实验室等处的研究人员提出用生物信息学方法——SPRING(通过基因组数据整合SNV优先级),对给定的查询疾病识别致病非同义SNVs。根据计算现有方法(SIFTPolyPhen2LRTMutationTasterGERPPhyloP)得到六大功能的影响得分,和来自各种基因组数据源(基因本,蛋白间的相互作用,蛋白质序列,蛋白结构域注释和基因通路注释)的五个相关性分值,SPRING计算得出一个SNV是查询疾病的致病原因的统计显著性,因此提供了优先候选SNVs一种方法。随着一系列的综合验证实验,研究人员证明SPRING对于遗传碱基是部分已知或完全未知的疾病和多种遗传类型的疾病是有效的。对于真实的外显子组测序数据集应用该方法,显示了SPRING在检测孤独症,癫痫和智力残疾从头突变的能力。研究人员还提供了一个在线服务,独立软件和5,080种疾病致病SNVs的全基因组预测,网址是http//bioinfo.au.tsinghua.edu.cn/spring.该文章发表在2014年《PLoS Genetics》杂志上。

参考文献:

Integrating Multiple Genomic Data to Predict Disease- Causing Nonsynonymous Single Nucleotide Variants in Exome Sequencing Studies

作者简介:

江瑞:北京清华大学自动化系副教授。清华973国家重点基础研究发展计划项目《基于新一代测序的生物信息学理论与方法》第四课题组学术骨干。研究领域生物信息学、系统生物学、模式识别、机器学习、统计推断。