通过整合人类组学数据对候选基因进行排序

在计算系统生物学的领域中,鉴定与人类复杂疾病有关的基因一直以来都是一大挑战。虽然现有的方法能够利用疾病表型相似网络和蛋白质相互作用网络对候选基因进行排序,但是这些方法却忽略了其他有价值的组学数据。

清华大学自动化系江瑞副教授团队等处的研究人员研发了一种名为BRIDGE的计算方法,它可以通过整合疾病表型相似性和组学数据,比如蛋白质的相互作用,基因序列的相似性,基因表达模式,基因本体注释,基因通路成员等,来对候选基因进行排序。BRIDGE采用Lasso Penalty多元回归模型自动加权不同的数据源,它也能够对那些遗传基础还不为研究人员了解的疾病进行有效预测。通过大规模的交叉验证实验,研究人员发现BRIDGE对超过60%的已知致病基因的疾病进行候选致病基因排序,表明该方法性能优良。此外,研究人员以肥胖病和II型糖尿病为例,应用BRIDGE预测了这两种疾病的新基因和转录网络。BRIDGE是一种高效、可扩展的方法,它能够通过整合多种组学数据推断出致病基因。未来,BRIDGE将在发掘新的致病基因和研究人类致病机制方面有更深层次的应用。该研究刊登在20136月的《BMC Medical Genomics》杂志上。

参考文献:

Integrating human omics data to prioritize candidate genes. Yong Chen,et al .BMC medical genomics, 2013 Jun

作者简介:

江瑞:北京清华大学自动化系副教授。清华973国家重点基础研究发展计划项目《基于新一代测序的生物信息学理论与方法》第四课题组学术骨干。研究领域生物信息学、系统生物学、模式识别、机器学习、统计推断。