鉴定RNA测序样本中差异剪接基因

近期研究显示大多数人类基因都存在可变剪接并可产生多个转录产物亚型。基因亚型的相对丰度差异具有重要的生物学意义。转录组样品间可变剪接的鉴别是二代测序技术的重要应用之一。

清华大学自动化系和信息国家实验室张学工教授领导的科研团队利用负二项分布模拟外显子上的测序reads,并开发出新方法通过比较所有外显子上reads数量的负二项统计去检测两组样品中存在的可变剪切差异基因。该方法开辟了一个基于外显子而非基因亚型的差异剪切基因鉴定的方法。既不需要同型组成信息也不需要亚型表达量的估值。人体肾脏和肝脏样品的模拟实验数据和真实转录组数据,验证了这一方法的可行性和适用性。该方法同样也可以检测出未知的可变剪接,并对两个样本中大多数差异剪接的外显子区进行突出显示。

研究人员开发的负二项统计方法可以检测两组样本之间的差异剪接基因,代替了原来可变剪接注释的方法。该方法不需要推断出同型结构也不用估计同型表达式。对于比较两组转录组样品,是一种非常有用的方法。除了识别差异剪切基因,该方法还能有助于突出显示大多数差异剪切的外显子。研究人员基于该方法开发出应用软件 DSGseq,获取地址: http://bioinfo.au.tsinghua.edu.cn/software/DSGseq.该研究发表在2013年《Gene》杂志上。

参考文献:

Identifying differentially spliced genes from two groups of RNA-seq samples.Weichen Wang,et al.Gene. 2013

作者简介:

张学工:清华大学自动化系和信息国家实验室教授,清华信息科学与技术国家实验室(筹)生物信息学部主任,生物信息学教育部重点实验室副主任。清华973国家重点基础研究发展计划项目《基于新一代测序的生物信息学理论与方法》首席科学家,第四课题组负责人。主要科研领域方向机器学习与模式识别的理论、方法与应用。