欢迎光临散文网 会员登陆 & 注册

深度学习将蛋白质设计改进了10倍

2023-09-06 15:47 作者:AtaGenix-普健生物  | 我要投稿

理解蛋白质(如控制癌症、COVID-19和其他疾病的蛋白质)的关键非常简单。鉴定它们的化学结构,并找出能与它们结合的其他蛋白质。

 

设计具有高亲和力和特异性结合蛋白的方法在生物医学中对于产生候选治疗药物、诊断和成像试剂具有相当重要的意义。目前应用最广泛的方法包括用靶点免疫动物以诱导产生抗体,或者筛选高度复杂的随机抗体库或其他支架材料来结合活性。近年仅根据靶结构信息从头设计高亲和力蛋白结合蛋白已成为可能。然而,由于总体设计成功率较低,因此有相当大的改进空间。最近发表于《自然》子刊《Nature Communications》上题为“Improving de novo protein binder design with deep learning”的研究使用深度学习方法在“从头开始”或从头开始计算蛋白质设计中增强现有的基于能量的物理模型,导致实验室验证的设计蛋白质与其靶蛋白结合的成功率提高了10倍。


深度学习使用计算机算法来分析数据中的模式并从中得出推论,对算法进行分层,以逐步从原始输入中提取更高级别的特征。在这项研究中,深度学习方法被用来学习蛋白质序列和可能结构的表示的迭代变换,这些迭代变换非常快速地收敛到结果非常准确的模型上。研究人员开发的深度学习增强从头蛋白质结合剂设计协议包括机器学习软件工具AlphaFold 2和RoseTTA fold。

 


研究人员使用RifDock对接程序生成了600万个蛋白质“docks”,或者潜在结合蛋白质结构之间的相互作用,将它们分成大约10万个块,并使用Linux实用程序将每个块分配给Frontera的8000多个计算节点之一。

这10万个码头中的每一个都将被分成100个工作岗位,每个岗位包含1000种蛋白质。1000个蛋白质进入计算设计软件Rosetta,其中1000个首先以秒的十分之一的规模进行筛选,而存活下来的蛋白质则以几分钟的规模进行筛选。


然后将DNA与酵母组合,使得每个酵母细胞在其表面上表达一种设计的蛋白质。然后将酵母细胞分选为结合的细胞和不结合的细胞。反过来,他们使用人类基因组测序项目的工具来找出哪些DNA起作用,哪些DNA不起作用。

研究人员认为,尽管研究结果显示,设计结构与目标蛋白结合的成功率提高了10倍,但仍有很长的路要走。这项研究的未来是要进一步提高成功率,并转移到一个更难的目标的新阶层。病毒和癌症 T 细胞受体就是最好的例子。

改进计算设计的蛋白质的方法是使软件工具更加优化,或者更多地采样。


深度学习将蛋白质设计改进了10倍的评论 (共 条)

分享到微博请遵守国家法律