基于高通量测序研究的肝、肾组织基因表达比较分析

在过去的十年中,高通量测序技术被广泛地运用于细胞和组织表达谱的研究。公共数据库和大量已发表论文提供了海量的基因表达数据。上海生物信息技术研究中心 郝沛研究员合作中国科学院上海生命科学院植物生理生态研究所李轩研究员带领研究人员运用多种分析方法来分析人类肝脏和肾脏组织的基因表达数据。这些数据来自于五种不同技术:EST, SAGE, MPSS, microarray, and RNA-Seq,其中RNA-seq对于检测基因数据是最为敏感的,而SAGE和 MPSS则最不敏感。这五种平台检测的基因表达水平有着很好的相关性。我们更进一步对比检测了来自Human Protein Atlas的基因到肝脏(肾脏)蛋白组的数据,发现蛋白组数据证实的960个基因(来自于8764个基因)仅被RNA-seq所检测到。总之,RNA-Seq相比于其他四种高通量测序平台有着更好的敏感性和持续性,尽管这五种平台的数据通常都是被认可的。平均覆盖率在努力成为代表RNA-Seq数据基因表达水平的首选测量指标并将用于未来的研究工作中。该研究发表在20128月的《Chinese Scinece Bulletin》杂志上。

参考文献:

A comparative analysis of tissue gene expression data fromhigh-throughput studies.Jie Ping, et al.Chinese Science Bulletin.2012 Aug.

作者简介:

郝沛:上海生物信息技术研究中心 研究员/课题组长。长期从事生物信息学研究和数据挖掘应用工具的研发。

李轩:中国科学院上海生命科学院植物生理生态研究所研究员,博士生导师。清华973国家重点基础研究发展计划项目《基于新一代测序的生物信息学理论与方法》第一课题组负责人。主要从事生物信息学和系统生物学的应用研究。