带有重金属离子的DNA锚定蛋白——锌指蛋白(ZF)
今天介绍的是锌指蛋白(Zinc Finger Protein),简称锌指(Zinc Finger,ZF)。
简介

锌指(Zinc Finger)是一种小的蛋白质结构基序,其特征是一个或多个锌离子(Zn2+)配合以稳定折叠。它最初是用来描述非洲爪蛙(非洲爪蟾)转录因子IIIA的手指状结构的。然而,在真核细胞中发现它包含多种不同的蛋白质结构1983年,非洲爪蟾(Xenopus laevis)TFIIIA最初被证明含有锌,并需要锌来维持其功能,首次报道了嗜锌基因调节蛋白,随后不久,果蝇的Krüppel因子也出现了它通常作为金属结合域出现在多结构域蛋白中。
含有锌指的蛋白质——锌指蛋白被分为几个不同的结构家族。与许多其他明确定义的超二级结构(如α螺旋或β发夹)不同,锌指有多种类型,每一种都有独特的三维结构。一个特定的锌指蛋白的类别是由这个三维结构决定的,但它也可以根据蛋白质的一级结构或配体的身份来识别锌离子。然而,尽管这些蛋白质种类繁多,但绝大多数通常作为相互作用模块,与DNA、RNA、蛋白质或其他小而有用的分子结合,结构的变化主要是改变特定蛋白质的结合特异性。
自它们最初的发现和结构的阐明以来,这些相互作用模块已被证明在生物界普遍存在,可能存在于人类基因组的3%的基因中此外,锌指已经成为非常有用的各种治疗和研究能力。通过基因工程使锌指与特定序列具有亲和关系是目前研究的热点,而锌指核酸酶和锌指转录因子是目前研究的两个重要应用。
历史

锌指是在Aaron Klug实验室对非洲爪蟾(Xenopus laevis)的转录研究中首次发现的。一项对特定RNA序列的转录研究表明,一个小转录因子(转录因子IIIA,TFIIIA)是由于锌配位指状结构的存在TFIIIA的氨基酸测序显示了30个氨基酸的9个串联序列,包括2对半胱氨酸和组氨酸不变残基。扩展x射线吸收精细结构证实了锌配体的同一性:两个半胱氨酸和两个组氨酸这些配体与锌配合形成的DNA结合环被认为类似于手指,因此被命名为。此后不久,Schuh团队于1986年在果蝇中发现了Krüppel因子最近在不同生物体中蛋白质特性方面的工作揭示了锌离子在多肽稳定中的重要性
1991年和1993年研究的锌指-DNA复合物的晶体结构揭示了锌指与DNA相互作用的典型模式。锌指的结合不同于许多其他的DNA结合蛋白,它们是通过双螺旋结构的2倍对称来结合DNA,而锌指是线性串联结合不同长度的核酸序列锌指通常与DNA序列结合,称为GC box锌指基序的模块化特性允许大量DNA和RNA序列的结合具有高度的亲和性和特异性,因此非常适合用于可以靶向和结合特定DNA序列的工程蛋白。1994年,一种人工构建的三指蛋白可以阻断小鼠细胞系中致癌基因的表达。锌指融合到其他各种效应域,其中一些具有治疗意义,已经被构建,成为一种成熟的体系。
功能域
锌指结构域(Zinc Finger, ZnF)是一种相对较小的蛋白质基序,它包含多个指状突起,可与靶分子串联接触。其中一些区域与锌结合,但也有许多不结合,而是与铁等其他金属结合,或者根本不与金属结合。例如,一些家庭成员形成盐桥来稳定手指状褶皱。它们最初被识别为非洲爪蟾(Xenopus laevis)转录因子TFIIIA中的DNA结合基序,但现在发现它们可以结合DNA、RNA、蛋白质或脂质底物。它们的结合特性取决于手指结构域的氨基酸序列、手指间的连接子以及手指的高阶结构和数量。ZnF域通常在簇状结构中发现,在簇状结构中手指具有不同的结合特异性。ZnF基序出现在几个不相关的蛋白超家族中,其序列和结构各不相同。它们在结合模式上显示出相当多的多样性,甚至在同一类群的成员之间(例如,一些结合DNA,另一些结合蛋白质),这表明ZnF基元是稳定的支架,已经进化出专门的功能。例如,含znf的蛋白质在基因转录、翻译、mRNA运输、细胞骨架组织、上皮细胞发育、细胞粘附、蛋白质折叠、染色质重塑和锌感知等方面发挥作用锌结合基序是一种稳定的结构,在与靶结合时很少发生构象变化。
分类
最初,锌指一词仅用于描述爪蟾DNA结合基序;然而,它现在被用来指任何数量的与锌离子配位有关的结构。一般来说,锌指配合锌离子与半胱氨酸和组氨酸残基的组合。最初,这些残基的数量和顺序被用来分类不同类型的锌指(例如,Cys2His2、Cys4和Cys6)。最近,一种更系统的方法被用来分类锌指蛋白。该方法根据锌指蛋白折叠区域主干的整体形状,将锌指蛋白分类为“折叠组”。锌指最常见的“折叠组”是Cys2His2-like(“经典锌指”)、Treble clef和锌绶带蛋白(Zinc Ribbon)。
应用

多种蛋白质工程技术可用于改变锌指的DNA结合特异性,这种工程锌指的串联重复序列可用于靶向所需的基因组DNA序列将第二个蛋白结构域(如转录激活子或抑制子)与一组结合在给定基因启动子附近的工程锌指结合,可以用来改变该基因的转录基因工程锌指阵列与可切割或修饰DNA的蛋白质结构域之间的融合也可用于将这些活性靶向到所需的基因组位点工程锌指阵列最常见的应用包括锌指转录因子(Zinc Finger Transcription Factors)和锌指核酸酶(Zinc Finger Nucleases),但也有其他应用的描述。典型的工程锌指阵列有3到6个独立的锌指结构,结合的靶位点长度从9个碱基对到18个碱基对不等。具有6个锌指图案的阵列特别有吸引力,因为它们结合的目标位点足够长,有很好的机会在哺乳动物基因组中是唯一的。
锌指核酸酶
基因工程锌指阵列通常与DNA裂解结构域(通常是FokI的裂解结构域)融合,生成锌指核酸酶。这种锌指-FokI融合已经成为操纵许多高等生物基因组的有用试剂,包括黑腹果蝇、秀丽隐杆线虫、烟草、玉米、斑马鱼、各种哺乳动物细胞和大鼠。由于非同源DNA修复途径的易错特性,将双链断裂定位到所需的基因组位点可用于将框架移位突变引入基因编码序列。如果同源DNA“供体序列”也被使用,那么基因组位点可以通过同源定向修复途径转化为一个确定的序列。一项正在进行的临床试验正在评估锌指核酸酶破坏CD4+T细胞中的CCR5基因,作为一种潜在的AIDS治疗方法。
如何设计
DNA序列合成顺序为5'→3',蛋白质合成顺序为N→C,而锌指模块锚定DNA碱基序列方向则是与DNA合成顺序相反。
例如:锚定序列为GGGGCCGGAGCCGCAGTG。由于每个锌指模块只能锚定3个连续碱基,因此将锚定序列每三个碱基分为一组:GGG/GCC/GGA/GCC/GCA/GTG。然后调整顺序,得GTG/GCA/GCC/GGA/GCC/GGG。
锌指模块标准格式为YKCPECGKSFSnnnnnnnHQRTH。其中,nnnnnnn为锌指模块的锚定决定单元。




查表,得GTG=RSDELVR,GCA=QSGDLRR,GCC=DCRDLAR,GGA=QRAHLER,GCC=DCRDLAR,GGG=RSDKLVR。
构建锌指模块:
1.YKCPECGKSFSRSDELVRHQRTH
2.YKCPECGKSFSQSGDLRRHQRTH
3.YKCPECGKSFSDCRDLARHQRTH
4.YKCPECGKSFSQRAHLERHQRTH
5.YKCPECGKSFSDCRDLARHQRTH
6.YKCPECGKSFSRSDKLVRHQRTH
用锌指连接肽TGEKP,在锌指与锌指之间建立连接:YKCPECGKSFSRSDELVRHQRTHTGEKPYKCPECGKSFSQSGDLRRHQRTHTGEKPYKCPECGKSFSDCRDLARHQRTHTGEKPYKCPECGKSFSQRAHLERHQRTHTGEKPYKCPECGKSFSDCRDLARHQRTHTGEKPYKCPECGKSFSRSDKLVRHQRTH。
在N端引入LEPGEKP,在C端引入TGKKTS:LEPGEKPYKCPECGKSFSRSDELVRHQRTHTGEKPYKCPECGKSFSQSGDLRRHQRTHTGEKPYKCPECGKSFSDCRDLARHQRTHTGEKPYKCPECGKSFSQRAHLERHQRTHTGEKPYKCPECGKSFSDCRDLARHQRTHTGEKPYKCPECGKSFSRSDKLVRHQRTHTGKKTS。
根据所需功能,在N端或C端加入所需的目标蛋白。例如,在N端连接HIV整合酶,将慢病毒载体定向整合至该位点。或者在C端连接带有细胞核定位信号(NLS)的绿色荧光蛋白,显示该位点在细胞内的分布。
优点与缺点
锌指蛋白的优点是,可以进入线粒体内标记基因。或在C末端引入FokI核酸酶后,在线粒体内进行基因编辑。
锌指蛋白的缺点是,只能锚定9、12、15、18这些数目的碱基,因为它们都是3的倍数。少数锚定序列脱靶概率高。此外,锌指蛋白得设计非常复杂。