利用基因集共表达特征推断通路串扰网络

构建细胞中的分子相互作用的网络在了解生物过程基本机制中很重要的。除了单一的基因分析,已经提出了几种基于基因集的方法来推断通过分析大规模的基因表达数据的途径串扰。但其中大多数都把所有的通路基因作为一个整体来推断出串扰。生物学证据表明,通路串扰通常发生在一些子集,而不是整个集合的通路基因。在这项研究中,清华大学生物信息学部的研究人员提出了一种新的方法:sgsca(信号基因集共表达分析)可以使用子集通路基因之间的共表达的相关性对网络通路的串扰进行推断。该方法适用于少量的典型相关分析(sCCA)测量通路水平共同表达和同时得到的子集或信号基因,有助于共表达的通路。对模拟数据集来说,sGSCA 可以有效检测通路的串扰和相应的相关性高的特征基因。研究人员对两个癌基因表达数据集(肝癌及肺癌)应用sgsca。在推断的网络中,研究人员发现了几个重要的癌症相关通路的串扰。癌症相关基因中确定的信号基因也显示高富集性。sgsca可以使用大规模的基因表达数据推断通路串扰网络,系统地研究复杂疾病在同一时间的分子机制通路和基因水平一个有用的工具。本文发表在20137月《Molecular bioSystems》上。

参考文献:  

Inferring pathway crosstalk networks using gene set co-expression signatures.Jin Gu ,et al. Molecular bioSystems. 2013 Jul

作者简介:

古槿:清华大学自动化系讲师,清华973国家重点基础研究发展计划项目《基于新一代测序的生物信息学理论与方法》第四课题组学术骨干。研究方向为microRNA及其调控网络,复杂生物网络的信息理论与计算分析,计算平台与数据库开发。

李梢:清华信息科技国家实验室()生物信息学部副主任,研究方向:利用生物医学大数据,以信息与系统的观点,分析肿瘤等疾病的复杂生物网络及其调控规律等方面。