卷死自己(12)——关于AlphaFold的思考
写在前面
怎么说呢,这个系列就是把自己的homework拿出来晒一晒,也就是图一乐丢人现眼一下,因为本人能力和知识范围有限,难免会有错误,请谅解一下,也就是仅供参考。引文都有标注,如果有侵权的可以联系我。欢迎各位大佬多交流,提问题、指错误。要是能关注一波那就更好了!
关于AlphaFold的思考
——What's next for AlphaFold and the AI protein-folding revolution阅读心得
1 AlphaFold
AlphaFold ,是DeepMind公司开发的人工智能程序,其部署了深度学习神经网络,并在PDB和其他数据库中对数十万个已通过实验确定的蛋白质结构和序列进行学习训练。AlphaFold在尝试建立氨基酸的三维位置模型时,会根据其氨基酸序列先预测出一个大概的空间图,再通过在数据库中利用进化相关序列、多序列比对、氨基酸残基对表示等数据来细化空间图,然后来回迭代这些线索,不断更新其估计,最终获得精细的预测空间图。[1]2020年11月30日,该人工智能程序在蛋白质结构预测大赛CASP 14中,对大部分蛋白质结构的预测与真实结构只差一个原子的程度,达到了人类利用冷冻电子显微镜等复杂仪器观察预测的水平。[2]2021年7月,AlphaFold预测出了98.5%人类蛋白质结构,2022年7月,AlphaFold预测了超过100万种生物超过2亿个蛋白质空间结构,近乎完全预测了UniProt中的所有蛋白质,而在这2亿个蛋白质中,大约35%的结构与实验结果一致,还有45%的结构也具有高可信度。[1-3]
1.1 AlphaFold的意义
几十年来,科学家们一直试图找到一种方法:仅根据蛋白质的氨基酸序列中便能可靠地预测蛋白质的结构,这一重大的科学挑战被称为蛋白质折叠问题,在2005年被《science》列为125个最具挑战性的科学问题之一。但是,弄清楚蛋白质的确切结构是一个昂贵且通常耗时的过程,大多数情况下只能依靠核磁共振、X射线、冷冻电镜等技术进行重复实验,截至目前,我们只知道已知的一小部分蛋白质的确切3D结构。[3]
但AlphaFold却可以仅通过其遗传密码计算便可预测蛋白质形状,利用这些预测数据,可以显著加速蛋白质结构的研究进程,同时也能推动药物、疫苗开发、塑料降解等领域的研究。此外,利用AlphaFold的预测结构还可以应用于对生命演化的研究,通过将其预测结构与明确了解空间结构的蛋白进行比对,可以帮助探究各物种之间的亲缘关系。同时,如果反向利用AlphaFold,还可以用极短的时间设计出新的蛋白质。[2]
1.2 AlphaFold的缺陷
因为AlphaFold的学习网络依赖于相关蛋白质序列的信息,这意味着AlphaFold仍然具有一些局限性,例如:AlphaFold无法预测不能折叠成稳定构象的蛋白质,对于一些缺乏相关信息的罕见蛋白质,其预测质量往往不高,同时它也无法预测基因突变对蛋白质形状的影响,也没无法确定蛋白质在其他相互作用的蛋白质或药物等分子存在时如何改变形状。但随着算法的迭代与更多功能的开发,以上问题应该也会被AlphaFold一一解决。[3]
2 对于AlphaFold的思考与展望
正如中国科学院院士施一公先生所说:“依我之见,这是人工智能(AI)对科学领域最大的一次贡献,也是人类在21世纪取得的最重要的科学突破之一,是人类在认识自然界的科学探索征程中一个非常了不起的历史性成就。” AlphaFold的出现是颠覆性的,是结构生物学的发展的一个里程碑。我相信,正如每一次科技革命那样, AlphaFold可能仅仅是一个开端,它表明了人工智能与生命科学结合是未来生命科学发展的必然趋势,人工智能或许会带给生物学研究一个全新的视角,使生命科学的部分领域的发展走向快车道。
但同时,我们也要清楚地意识到,再精确的预测模型也仅仅只能作为参考,要得知蛋白真正确切的结构一定只能通过实验现象与数据,如果盲目依赖于预测模型,往往只能让研究进展停滞不前,更何况 AlphaFold仅仅只能依靠过往的蛋白质序列预测结构,还存在着大量的问题留待解决。在不断应用发展人工智能预测技术的同时,也不能忽略结构检测技术的发展,只有当预测技术与检测技术都得到良好发展,并驾齐驱之时,我们才能说真正解决了蛋白质折叠问题。
参考文献:
[1]Jumper, J., Evans, R., Pritzel, A. et al. Highly accurate protein structure prediction with AlphaFold. Nature 596, 583–589 (2021). https://doi.org/10.1038/s41586-021-03819-2
[2] Callaway E. What's next for AlphaFold and the AI protein-folding revolution. Nature. 2022 Apr;604(7905):234-238. doi: 10.1038/d41586-022-00997-5. PMID: 35418629.
[3]https://www.alphafold.ebi.ac.uk