在FPGA的异构体系结构上加速数百万的短序列比对

高通量测序(NGS)的数据每天以超过十亿的数量爆炸式增长,这对当前的计算系统的性能提出来巨大的挑战。中国科学院计算技术研究所孙凝晖研究员,张佩珩高工领导的研究小组基于哈希索引的概念,提出了一种加速短序列比对算法的CPU-FPGA异构体系结构。尤其值得注意的是,其中PE(处理单元)专门负责提取和比对序列信息这样最耗时的基础操作,新算法能够支持在PFGA上的高效加速。研究人员在一个包含Xilinx Virtex5 LX330 FPGA的加速卡上实行评估了这个体系结构。受有效数据传输的宽度限制,我NGS序列比对加速器实现了多达100个处理单元的并行计算,它的工作频率是175MHz。与因特尔六核处理器相比,新加速器有22.2-42.9倍的优势。

参考文献:

Accelerating Millions of Short Reads Mapping on a Heterogeneous Architecture with FPGA Accelerator.Wen Tang, et al.IEEE 20th International Symposium on Field-Programmable Custom Computing Machines2012

作者简介:

孙凝晖:中国科学院计算技术研究所研究员,所长。主要从事计算机体系结构方面研究。孙凝晖研究员先后参加并领导了曙光一号并行计算机,曙光1000大规模并行机、曙光2000-I、曙光2000-II超级服务器等高性能计算机的研制。

张佩珩:中国科学院计算技术研究所正高工。清华973国家重点基础研究发展计划项目《基于新一代测序的生物信息学理论与方法》第二课题组负责人。主要从事高性能计算机硬件系统的研究,研究方向包括大规模并行计算机体系结构、可重构计算技术、硬件系统逻辑设计的应用开发等。

谭光明,中国科学院计算技术研究所副研究员。清华973国家重点基础研究发展计划项目《基于新一代测序的生物信息学理论与方法》第二课题组学术骨干。主要研究方向为并行算法、编程与体系结构,负责计算机体系结构国家重点实验室和曙光团队的并行算法小组的研究工作。