RCSB 数据库
蛋白质结构数据库(RCSB Protein Data Bank)
PDB蛋白质结构数据库(全称Protein Data Bank,简称PDB数据库)是美国Brookhaven国家实验室于1971年创建的,由结构生物信息学研究合作组织(Research Collaboratory for Structural Bioinformatics,简称RCSB)维护。PDB数据库以文本文件形式存储分子数据,每个分子形用一个独立的文件。早期的分子文件的文件名后缀为“.pdb”,1997年以后每1种生物大分子对应1组(3个)相关文件分别是:全文文件(后缀为“.full”相当于原来的“.pdb”文件)、书目文件(后缀为“.biblio”)和图形文件(后缀为“.gif”)。
PDB数据库是生物大分子的原子坐标和描述蛋白质和其他重要生物大分子相关信息的存储库。结构生物学家使用x 射线晶体学、核磁共振光谱和冷冻电子显微镜等方法来确定分子中每个原子相对于彼此的位置,然后存储这些信息,并由PDB数据库注释并公开发布到档案中。
不断增长的
pdb文件反映了世界各地实验室正在进行的研究结构,可用于许多相关的蛋白质和核酸生命的中心过程研究,因此您可以访问
PDB数据库以查找核糖体、致癌基因、药物靶标甚至整个病毒的结构,具体网址:www.rcsb.org
,免费在线访问。网站主页展示本月的特色蛋白质分子,但本篇文章主要介绍溶菌酶。
首页搜索框,搜索溶菌酶(LYSOZYME),结果如下图。溶菌酶作为水解酶,是一种普遍存在于许多不同生物体中的蛋白质。在页面左侧,显示跨越不同的分类学层次的不同的结构,以及这些结构首次发布位置的文章的引用,下滑还可以看到有大量的溶菌酶结构页面,基本上所有的溶菌酶结构信息都在这里体现。
PDB数据库中的蛋白质按四字母代码分类,我们将重点关注天然人类溶菌酶的晶体结构,你可以通过它们的代码轻松搜索。点击每个晶体结构可以跳转至具体页面,看到作者的原始引文和pubmed 中原始论文的链接。以1REX为例,它是通过 X 射线衍射确定的,分辨率为 1.5 A。
如果您想明确此结构的序列,您可以在序列选项卡下查看氨基酸的序列以及这些氨基酸对二级结构的贡献。下图显示了一个 alpha 螺旋,一个beta 表。
如果你只想要纯文本格式的纯氨基酸序列你可以去显示文件,然后fast a sequence。这里是氨基酸从 n 端到c 端的顺序。
你也可以去 3d 视图查看,这里是一个卡通版本显示。你可以将颜色设置更改为序列,色带颜色从蓝色变为红色,类似于彩虹色;如果将颜色更改为二级结构,蓝色表示 in 终端,红色表示 c 终端,你可以看到 alpha螺旋、beta 折叠和蛋白质的随机线圈。
如果你想看一下 pdb文件,你可以直接显示它,它是一个文本文件。每个 pdb 文件开篇都会介绍所有原子坐标对分子的描述,来源于解决分析的结构和实验细节的作者。
接下来文件列出了蛋白质的氨基酸序列。pdb 文件的一部分定义了每个原子的精确位置、三维空间中的结构,每个原子在单独的行中描述,前几列将原子定义为序列中特定氨基酸的一部分,后面的列列出一组 x y 和 z,坐标以精确定位结构中的原子。