基于网络的差异基因表达分析表明吸烟者和非吸烟者肺癌间,通过E2F1分子差异调控细胞周期相关基因的调控

差异基因表达(Differential gene expression, DGE)分析是揭示复杂疾病分子管控机制的常用手段。然而传统的DGE分析(如t检验或秩和检验)检验常常认为每个基因独立且不考虑彼此间相互作用。 差异表达基因分析筛选的基因可能并不直接与复杂疾病的分子改变相关。共表达和DGE联合分析已用于揭示复杂疾病下分子管制模式。此类方法多为单步组成:首先,研究表型确认基因-基因间关系;然后,在基因表达变化下整合基因关系以标记筛选基因。此方法同时考虑基因-基因共表达强度和相应表达水平变化,以使两种表型信息可以兼顾利用。

清华大学自动化系和信息国家实验室张学工教授带领科研人员开发了一个基于差异基因表达分析的基因模块,并命名为“基于网络的差异基因表达分析”(network-based differential gene expressionnDGE),其整合方法为筛选管控基因并分类于基因模块内。并证明了nDGE优于现有基于模拟数据集筛选管控基因和发现管控基因模块的方法。在测试吸烟者和非吸烟者肺癌数据集时,我们发现在不同数据集中,秩和检验鉴定的高差异调控基因是不一致,而nDGE鉴别的高排名基因重复存在不同数据集。nDGE分析揭示了一个差异表达基因模型,即在吸烟者和非吸烟者肺癌间的分子差异中,细胞周期相关基因和E2F1靶向基因的富集扮演重要角色。

科研人员通过兼顾考虑基因表达水平变化和基因-基因共调控信息,发展了nDGE用于筛选管控基因并将它们列入基因模块的方法。在模拟数据和经验数据中,nDGE优于传统DGE方法。更具体地说,研究吸烟者和非吸烟者肺癌数据集,nDGE结果表明吸烟者和非吸烟者肺癌之间存在分子差异。该文章发表在2013年《BMC Bioinformatics》杂志上。

参考文献:

Network-based differential gene expression analysis suggests cell cycle related genes regulated by E2F1 underlie the molecular difference between smoker and non-smoker lung adenocarcinoma.Chao Wu, et al.BMC Bioinformatics.2013

作者简介:

张学工:清华大学自动化系和信息国家实验室教授,清华信息科学与技术国家实验室(筹)生物信息学部主任,生物信息学教育部重点实验室副主任。清华973国家重点基础研究发展计划项目《基于新一代测序的生物信息学理论与方法》首席科学家,第四课题组负责人。主要科研领域方向机器学习与模式识别的理论、方法与应用。