DeepMind的蛋白质折叠人工智能破解了生物学的最大问题
我是斜杠青年,一个热爱前沿科学的“杂食性”学者!
人工智能公司DeepMind在短短18个月内预测了几乎所有科学已知蛋白质的结构,从而改变了生物学,这一突破将加快药物开发并彻底改变基础科学

DeepMind预测了迄今为止科学编目的几乎所有蛋白质的结构,由于一种名为AlphaFold的人工智能,在短短18个月内就打破了生物学的巨大挑战之一。研究人员表示,这项工作已经导致了进展的抗击疟疾、抗生素耐药性和塑料废物,并可能加快新药的发现。
几十年来,根据蛋白质的成分氨基酸序列确定蛋白质的皱巴巴的形状一直是生物学中一个持续存在的问题。其中一些氨基酸被另一些氨基酸吸引,一些被水排斥,链条形成复杂的形状,很难准确确定。
总部位于英国的人工智能公司DeepMind于2020年底首次宣布,它已经开发了一种准确预测折叠蛋白质结构的方法,到中期,它显示,它已经绘制了人体使用98.5%的蛋白质。
今天,公司宣布,它正在发布超过2亿种蛋白质结构——几乎所有被编入全球公认的蛋白质研究库UniProt的蛋白质结构。
DeepMind与欧洲生物信息学研究所(EMBL-EBI)的欧洲分子生物学实验室合作,创建了所有这些信息的可搜索存储库,可供世界各地的研究人员轻松免费访问。EMBL-EBI的Ewan Birney称AlphaFold蛋白质结构数据库是“给人类的礼物”。
Ewan Birney是“一个自20世纪90年代以来一直从事基因组学和计算生物学的人。
已经交付了结果
DeepMind首席执行官Demis Hassabis表示,数据库使查找蛋白质结构(以前通常需要数年时间)“几乎与谷歌搜索一样容易”。DeepMind由谷歌的母公司Alphabet拥有。
科学家已经使用该档案来推进一些领域的研究。牛津大学的Matt Higgins和他的同事正在研究一种蛋白质,他们认为这种蛋白质是中断疟疾寄生虫生命周期的关键,但正在努力绘制其结构图。
Higgins表示:“他们使用的实验方法之一是X射线晶体学。”他们让蛋白质形成晶格,发射X射线,并从这些X射线衍射模式中获得信息,看看分子是什么样子。但是,尽管进行了多年的工作,他们一直无法足够详细地看到这种分子的样子。”
但当AlphaFold发布时,它清楚地预测了蛋白质的结构,与研究人员能够收集的信息相匹配。他们现在能够设计出新的蛋白质,他们希望这些蛋白质可以作为有效的疟疾疫苗。
使用X射线晶体学绘制蛋白质结构图既昂贵又耗时。“这意味着实验者必须对他们做什么做出选择,而AlphaFold不必做出选择。”我们完全可以相信,由于AlphaFold,将产生新的实验和新的见解,例如,这将影响“这种特定寄生虫的工作原理”或“为什么这种特定疾病发生在人类身上”。
研究人员还使用AlphaFold来设计新的酶来分解塑料废物,并了解更多关于使细菌对抗生素产生抗药性的蛋白质。
工作仍有待完成
伦敦帝国理工学院的Keith Willison表示,AlphaFold无疑“改变了”生物研究的世界,但在蛋白质折叠方面仍有问题需要解决。
“AlphaFold出来后,你现在只需服用你最喜欢的蛋白质并查找它们,而不必制作晶体。”Keith Willison做了蛋白质复合物的晶体结构,花了他大约八年的时间。很多人开玩笑说晶体学家会失业。”
但Willison指出,AlphaFold无法接受任意的氨基酸串,并精确模拟它们的折叠方式。相反,它只能使用经过实验确定的的部分蛋白质及其结构来预测新蛋白质将如何折叠。
虽然该工具通常都非常准确,但其结构总是预测,而不是明确计算的结果。AlphaFold也没有解决复杂相互作用的蛋白质,甚至留下了凹痕的一小部分结构,这些结构被称为本质无序的蛋白质,这些结构似乎具有不稳定和不可预测的折叠模式。
一旦你发现了一件事,就会有更多的问题。事实上,生物学很复杂,这相当可怕。
伦敦大学学院的Tomek Wlodarski表示,AlphaFold对生物学的许多领域产生了巨大影响,但在准确性方面还有改进,开发蛋白质如何折叠模型——而不仅仅是预测其最终结构——是DeepMind尚未解决的问题。
AlphaFold并不完美,尽管它确实表明预测哪些部分具有很高的准确性,哪些部分缺乏信心。
“当你引入了一种突变,你知道它在实验上完全展开了蛋白质,但AlphaFold给了你相同的结构,没有这种突变。”Wlodarski做了另一个测试:他正在从蛋白质的一端去除残留物,因为我们知道,用我们的蛋白质,如果你从其中一端切下九个残留物,它将完全展开蛋白质。Wlodarski设法砍掉了一半的蛋白质序列,算法仍然预测为完全相同结构的完全折叠的蛋白质。所以有这些问题。”
DeepMind科学团队负责人Pushmeet Kohli表示,公司尚未使用蛋白质,并正在努力提高AlphaFold的准确性和功能。
“我们知道蛋白质的静态结构,但这不是游戏的结束。”我们希望了解这些蛋白质的行为方式,它们的动力学是什么,它们如何相互作用。然后是基因组学的另一个领域,我们想了解生命的配方如何转化为蛋白质的产生,它们何时被创造出来,以及细胞的工作原理。”
如果你喜欢前沿科学,关注我就是你最好的选择!
拓展阅读:
谷歌地球、谷歌地图和谷歌天空之后,也许有一天我们会有一个谷歌身体搜索的工具!