实现可靠的自动化蛋白质结构比对

结构生物学的共同任务是评估蛋白质结构的相似性和差异性。目前已经提出了多种计算蛋白质结构相似性的方法,有结构比对法和结构叠加法。但是目前仍然期望能有有效准确的方法来优化两种结构的比对和叠加。

现有的蛋白质结构比对算法最大的缺陷是它们固有的设计是基于局部结构相似性原理。换句话说,对于整体结构的相似性考虑是在后期阶段通过动态规划评估进行的。加拿大滑铁卢大学李明(音译)教授与中国科学院计算技术研究所的卜东波课题组合作提出了一个整合整体信息来获得最佳比对和叠加的方法。当运用该方法来优化TM分值和GDT分值时,得到的结果比现在蛋白质结构比对工具得到的结果更好。具体的说,如果运用TMalign工具得到的最高TM分值低于0.6,而本文所用方法得到的最高TM分值高于0.5,那么有42%的可能TMalign工具未能发现高于0.5TM分值,但是如果使用该方法那么相同的可能性会降低到2%。当TM分值为0.5时,那么这种方法将会大大提高检测的准确度。

此外,现有的结构比对算法只注重结构的相似性,而忽略了诸如序列相似性这样的其他重要的相似性。该方法能将众多的相似性都整合到打分函数中。实验证明序列相似性有助于找到与在HOMSTRAD数据库中看到的更一致的高质量蛋白质结构比对。即使当结构相似性本身不能找到与所见一致的比对时,该方法也能找到与所见比对高度相似甚至相同的比对。

参考文献:

Towards Reliable Automatic Protein Structure Alignment.Xuefeng Cuiet al.13th Workshop on Algorithms in Bioinformatics2013

作者简介:

李明:加拿大滑铁卢大学计算机系教授

卜东波:中国科学院计算技术研究所研究员。清华973国家重点基础研究发展计划项目《基于新一代测序的生物信息学理论与方法》第二课题组学术骨干。,承担科研项目:863课题“功能基因组” NSFC课题“基于随机场的蛋白质结构预测新算法” NSFC重大课题“非规范知识处理”子课题 973生物信息学课题等。