欢迎光临散文网 会员登陆 & 注册

不懂AlaphaFold?不,你懂!

2021-09-06 21:22 作者:FLOWHUB  | 我要投稿

强悍的蛋白结构预测软件AlphaFold2已经开源,目前,AlphaFold2的源代码已经在GitHub上公开,利用AlphaFold2人们可以进行高通量的蛋白结构预测,进行生物学研究以及药物开发等。对于AlphaFold2相信对于大多数学者来说都是非常感兴趣的,那么今天,我们就简单介绍一下蛋白质结构预测的前世今生。

蛋白质结构预测背景介绍

在1972年诺贝尔化学奖得主克里斯蒂安·安芬森(Christian Anfinsen)提出了一个著名的假设”自组装学说”,主要内容如下:

1. 蛋白折叠成所需信息都被编码在了氨基酸序中。

2. 蛋白质趋向于折叠到最小的能量状态。

3. 大多数蛋白质会折叠成一个独特的构象。

这一假设引发了一个长达50年的探索,即仅根据蛋白质的氨基酸序列来计算预测蛋白质的三维结构。然而,将要面对的一个主要的挑战是,理论上一种蛋白质在形成最终的三维结构之前可以折叠的方式是天文数字。1969年,赛勒斯·莱文塔尔(Cyrus Levinthal)指出,用强力计算法计算出一种典型蛋白质的所有可能的构型需要消耗比已知宇宙年龄更长的时间。蛋白质的结构是什么样的呢?如下图所示,蛋白质的分子结构可划分为四级。而 蛋白质结构预测 是指通过蛋白质的氨基酸序列预测蛋白质的三维结构。也就是说,从蛋白质一级结构预测它的折叠和二级,三级和四级的蛋白质结构。

 图片来源于网络,如有侵权请联系删除

蛋白质结构预测产业价值

分析蛋白质结构、功能及其关系是蛋白质组计划中的一个重要组成部分。研究蛋白质结构,有助于了解蛋白质的作用,了解蛋白质如何行使其生物功能,认识蛋白质与蛋白质(或其它分子)之间的相互作用,这无论是对于生物学还是对于医学和药学,都是非常重要的。对于未知功能或者新发现的蛋白质分子,通过结构分析,可以进行功能注释,指导设计进行功能确认的生物学实验。通过分析蛋白质的结构,确认功能单位或者结构域,可以为遗传操作提供目标为设计新的蛋白质或改造已有蛋白质提供可靠的依据,同时为新的药物分子设计提供合理的靶分子及结构

图片来源于网络,如有侵权请联系删除

图片来源于网络,如有侵权请联系删除

蛋白质结构预测目前现状

在过去的50年里,蛋白质如何折叠,这是多年来科学研究的一个焦点,人们使用各种实验技术来检验和确定蛋白质结构,如核磁共振和X射线晶体学,低温电子显微镜,而这些都依赖于广泛的实验,每种结构可能需要数年艰苦的工作,并且需要使用价值数百万美元的专门设备。

最近,谷歌旗下人工智能技术公司 DeepMind 提出深度学习算法 AlphaFold,破解了这一难题。已经被两年一度的CASP蛋白结构预测赛事组织方认可为蛋白质结构预测领域的重要解决方案。由于涉及大量的生物,物理,化学以及深度学习相关知识,在这里我们仅仅简答介绍一下AlphaFold的算法原理,AlphaFold 构建的模型都依赖深度神经网络,这些经过训练的神经网络可以从基因序列中预测蛋白质的属性。DeepMind 的研究人员表示,神经网络预测的蛋白质属性主要有:

1. 氨基酸对之间的距离。

2. 连接这些氨基酸的化学键及它们之间的角度。

为了构建 AlphaFold,DeepMind 在大量已知的蛋白质上训练了一个神经网络,直到它可以仅凭氨基酸预测蛋白质的 3D 结构。当输入一段未知的蛋白质序列时,AlphaFold 利用神经网络来预测氨基酸对之间的距离,以及连接它们的化学键之间的角度。接着,AlphaFold 逐步优化初始的结构以找到最优的折叠结果。该项目花了两周时间来预测其第一个蛋白质结构,但现在几小时内就可以完成蛋白结构的预测了


图片来源于网络,如有侵权请联系删除

如何运行AlphaFold2

目前从Github公开的AlphaFold2项目中我们可以了解到最低的官方运行配置,从项目目前的使用反馈情况来看,也暴露了一些AlphaFold2的小问题,如下图:

图片来源于网络,如有侵权请联系删除

由于存在上述问题,碳聚生物有限责任公司 Flowhub平台 推出了针对 国内用户 使用的 AlphaFold2在线云计算分析服务

在线云计算分析服务

FlowHub 是一个流程托管平台,我们知道随着代码对应的应用不断发布,越来越多的基础功能被实现出来,我们往往不需要再从头开发,仅基于这些公开的应用就可以完成简单的分析任务,而对这些应用的组合或许能够帮助我们完成更加复杂且庞大的分析项目。但由于采用的语言和依赖千差万别,如何兼容不同应用,运行和部署这些应用成为了很多人的难题。FlowHub 应运而生,它基于docker技术完成了对所有应用的封装,使得不同应用之间完全独立,互不影响,同时它可以兼容不同云平台,依托各大云厂商的算力,解决资源瓶颈问题。更为重要的是,独立的应用之间通过暴露的接口可以相互连接,嵌套分析,如此即可快速搭建复杂分析流程。我们的目标是希望构建这样的服务,帮助更多的人快速解决问题,降低项目的复杂度,避免不必要的开发。 

Flowhub 平台部署了大量生物分析标准流程,以及分析和可视化工具。所有的工具和流程都统一做了封装,方便用户一键使用。我们也为用户提供了无限的计算资源,用户可以批量运行各类任务,无需担心机器配置的问题。

针对AlphaFold2我们可以提供以下服务:

- 运行文档 -

- 数据下载 -

- 一键部署 -

- 批量计算 -

最多可同时运行几百到几千个分析任务,视具体输入数据而定

平台优势

如果您正在进行相关研究,需要搭建AlphaFold服务,那么我们平台一定是您最好的选择。无限资源,一键部署,正式实现高通量和计算自由。


平台其他服务

商务合作

邮箱:flowhub_team@flowhub.com.cn

电话:17399981010



不懂AlaphaFold?不,你懂!的评论 (共 条)

分享到微博请遵守国家法律