还记得那位“围棋大师”AlphaGo吗?说起由谷歌旗下DeepMind团队所开发的人工智能AlphaGo,你肯定能想到去年5月的围棋大战:尽管顶尖围棋高手柯洁拼劲全力,但仍未在AlphaGo那里讨到便宜,最后连负三局输掉了比赛。在这场猛烈的人工智能风暴席卷全球后,研究团队并没有因此停下脚步,随后又发布了AlphaGo的“孪生兄弟”——AlphaGo Zero。
正当人们兴奋地猜测AlphaGo Zero到底有多强大时,DeepMind今日宣布,AlphaGo和AlphaZero家族又添了新成员——AlphaFold。与此前发布的两款人工智能系统不同,AlphaFold将致力于加速科学发现,帮助科学家快速找到复杂问题的解决方案。上周日,在墨西哥坎昆举办的国际蛋白质结构预测竞赛(CASP)中,AlphaFold力压其他97位参赛者,通过基因序列精准预测了蛋白质的3D结构。
蛋白质的3D形态取决于它所含氨基酸的数量和类型。蛋白质的结构也决定了它在机体中的作用。生命体的功能基本是由正确折叠的蛋白质来执行的。蛋白质的错误折叠不仅会使其失去原有生物学功能,也会引起一系列重大疾病,如阿尔茨海默病、帕金森病等神经退行性疾病。了解蛋白质的3D结构可以为人类理解这些疾病提供重要的基础,进而帮助科学家设计出新的蛋白质来对抗疾病。除此之外,科学家还可以对细菌进行工程改造,使其分泌特殊的蛋白质帮助塑料等污染物或废物的生物降解等。
蛋白质3D结构的重要性,使其成为近50年来众多科学家争先研究的领域。已有技术,如低温电子显微镜和核磁共振等,都依赖于大量试验与误差反馈,并且耗时长,成本高昂。随着基因测序成本快速降低,海量基因数据获取并非难事。在过去几年中,依赖于基因组数据的预测问题正越来越多地借助深度学习方法。
为了构建AlphaFold,DeepMind在数千种已知蛋白质上训练了一个神经网络,直到它可以通过氨基酸预测蛋白质3D结构。鉴于要预测新的蛋白质,AlphaFold使用神经网络预测氨基酸对之间的距离,以及连接它们的化学键之间的角度。然后,AlphaFold调整初步结构以找到能效最高排列方式。此外,DeepMind 还训练了另一个独立的神经网络,该网络能利用集群中的所有距离来估计预测结构与实际结构间的差距。据悉,该计划花费了2周时间来预测第一个蛋白结构,但现在它可以在几个小时内完成预测。
DeepMind将AlphaFold提交到了CASP。比赛中,AlphaFold表现强劲。在第一次比赛中,AlphaFold在98名参赛者中排名第一,从43个蛋白质中预测了25个蛋白质的精确结构。与之相比,第二名预测了3个精确结构。
Demis Hassabis
正如 DeepMind 联合创始人兼首席执行官 Demis Hassabis 表示,“对我们来说,这是一个非常关键的时刻。这是一个灯塔项目,是我们在人力和资源方面的第一个重大投资。这也是非常重要的、现实世界的科学问题。”
AlphaFold 是DeepMind公司首个证明人工智能研究可以驱动和加速科学新发现的重要里程碑。Hassabis认为:“我们还有很多工作要做,蛋白质折叠问题还没有解决,这只是第一步。虽然这个问题极具挑战性,但我们有一个很好的系统,我们还有一些尚未实施的想法。”
参加该比赛的英国科学家Liam McGuffin表示,预测蛋白质结构的能力非常重要,它能帮助解决21世纪的许多问题,对健康、生态、环境和生物多样性修复都有重大意义。多年来,很多研究团队一直在使用基于机器学习的方法,深度学习和人工智能的改进似乎正在产生越来越重要的影响。也许2020年左右,人们就可以基本解决蛋白结构预测问题。
AlphaFold对于蛋白质3D结构的精准预测,使DeepMind再次向人们证明了深度学习在全新场景中的巨大应用潜力。近年来,人工智能在生物医药研究领域的应用已经屡见不鲜,在基因组突变检测、疾病辅助诊断、药物研发、个体化用药、临床试验、疾病风险评估等诸多领域都取得了耀眼的成绩,甚至超过了人类的水平。虽然还有很多问题需要解决,但相信随着技术的进步,终有一天人工智能的应用将成为常态。到那时,科学家或将迎来一个科学和医学进步的新时代。
参考资料:
1.Google's DeepMind predicts 3D shapes of proteins
2.AlphaFold: Using AI for scientific discovery
本文由 SEQ.CN 作者:王迪 发表,转载请注明来源!