SeqSite:精确定位ChIP测序数据中转录因子结合位点

染色质免疫沉淀与二代测序技术(ChIP-seq)的结合成为检测全基因组的关键方法,例如转录因子(TFs)。一些方法和开元的工具被开发用来分析ChIP-seq数据。然而,大多数工具是用来检测转录因子结合区域而不是准确的定位转录因子结合的位点(TFBSs)。对于直接从ChIP-seq数据中精确定位TFBSs位点,尤其是靠近绑定间隔区的位点仍然是一个很大的挑战。

清华大学自动化系和信息国家实验室张学工教授领导的科研团队开发了一个叫SeqSite的计算软件,以期精确定位转录因子结合位点。该软件先检测标签富集区并且在检测去精确定位结合位点,接着通过建模标记密度轮廓,用最小二乘模型拟合的策略定位每一条链上的转录因子结合位点,并合并两条链上的检测信息.模拟数据的实验显示SeqSite可以定位大多数超过40bp的结合位点。与现有的方法相比该方法已被验证了能在精确定位结合位点上的高分辨率的优点。该研究发表在2011年《BMC Systems Biology》杂志上。

参考文献:

Pinpointing transcription factor binding sites from ChIP-seq data with SeqSite.Xi Wang,et al.BMC Systems Biology.2011

作者简介:

张学工:清华大学自动化系和信息国家实验室教授,清华信息科学与技术国家实验室(筹)生物信息学部主任,生物信息学教育部重点实验室副主任。清华973国家重点基础研究发展计划项目《基于新一代测序的生物信息学理论与方法》首席科学家,第四课题组负责人。主要科研领域方向机器学习与模式识别的理论、方法与应用。