PyroHMMvar:一种适用于 Ion Torrent和454序列数据的short indels 和SNPs检测方法

检测Ion Torrent454序列数据的短插入/缺失(short indels)以及单核苷酸多态性(SNPs)颇具难度,因为这两种测序方法容易在Homopolymers出现错误,因而还会增加indels。目前还没有能模拟Homopolymer错误的方法。这种测序错误的出现,会使得比对结果不正确,而且还有indels存在。为解决这些问题,清华大学自动化系江瑞副教授带领研究团队合作美国南加州大学生物科学和计算机科学系陈挺副教授基于加权比对图和HMM提出了一个名为PyroHMMvar的计算方法,能同时检测人类重测序数据中的short indelsSNPs。特别是在模拟二倍体的序列数据时,研究人员发现PyroHMMvar的检测结果比其他先进检测方法(比如SamtoolsGATK)更准确。研究人员也用PyroHMMvar对一个人类全基因组重测序数据进行分析,结果表明PyroHMMvar能够准确地检测SNPsindels。该研究刊登在20138月的《Bioinformatics》杂志上。

参考文献:

PyroHMMvar: a sensitive and accurate method to call short indels and SNPs for Ion Torrent and 454 data .Zeng F,et al.  Bioinformatics (Oxford, England), 2013 Aug

作者简介:

江瑞:北京清华大学自动化系副教授。清华973国家重点基础研究发展计划项目《基于新一代测序的生物信息学理论与方法》第四课题组学术骨干。研究领域生物信息学、系统生物学、模式识别、机器学习、统计推断。

陈挺:美国南加州大学生物科学和计算机科学系副教授。同时就任于清华大学自动化系清华信息科学与技术国家实验室生物信息学研究部。主要研究领域为计算生物学和生物信息学。