来自黄单胞菌的“故事”——转录激活因子类效应因子(TALE)
今天介绍的是来自黄单胞菌(Xanthomonas)的“故事”——转录激活因子类效应因子(Transcription Activator-Like Effector,TALE)
简介

转录激活因子类效应因子(Transcription Activator-Like Effector,通常被称为TALEs,但不要与三氨基酸环扩展同源框类蛋白质混淆)是由一些β-和γ-变形菌纲分泌的蛋白质。其中大部分是黄单胞菌。植物致病性黄单胞菌尤其以TALEs蛋白而闻名,TALEs是通过它们的III型分泌系统产生的。这些蛋白质可以结合宿主植物的启动子序列,并激活植物基因的表达,以帮助细菌感染。它们通过一个由34个氨基酸重复组成的中心重复域识别植物的DNA序列。在每个重复序列中,两个关键氨基酸的同一性与目标序列中的每个DNA碱基之间似乎存在一一对应关系。研究人员对这些蛋白质很感兴趣,因为它们在重要作物疾病中的作用和相对容易重新定位它们以结合新的DNA序列。在青枯雷氏菌(Ralstonia solanacearum)和根瘤菌伯克霍尔德菌(Burkholderia rhizoxinica)以及尚未查明的海洋微生物中也发现了类似的蛋白质。“TALE-like”一词是用来指假定的蛋白质家族,包括TALEs和这些相关的蛋白质。
黄单胞菌(Xanthomonas)
黄单胞菌是革兰氏阴性细菌,可以感染多种植物,包括辣椒、水稻、柑橘、棉花、番茄和大豆。一些类型的黄单胞菌会引起局部的叶斑病或斑纹病,而另一些则会引起系统性的黑腐病或叶枯病。他们通过III型分泌系统将许多效应蛋白(包括TALE蛋白)注入植物体内。TALE有几个通常与真核生物相关的基序,包括多个核定位信号和一个酸性激活域。当注射到植物体内时,这些蛋白质可以进入植物细胞的细胞核,结合植物启动子序列,并激活植物基因的转录,帮助细菌感染植物已经开发了一种针对III型效应因子的防御机制,包括由这些效应因子触发的R(抗性)基因。其中一些R基因似乎已经进化到包含tal效应结合位点,与预期目标基因的位点相似。这种病原菌和寄主植物之间的竞争被假设为解释TALE DNA结合域的明显延展性。
DNA锚定


TALE最显著的特征是中心重复域,包含1.5到33.5个重复,通常是34个残基长度(C末端重复通常较短,被称为“半重复”)一个典型的重复序列是LTPEQVVAIASXXGGKQALETVQRLLPVLCQAHG,但第12位和第13位的残基是高度可变的(这两个氨基酸也被称为重复变量双残基或RVD)。这两个序列重复序列与TALE靶区序列DNA碱基之间存在着简单的关系与DNA结合的TALE的晶体结构表明,每个重复序列包括两个α螺旋和一个含有RVD的短环,RVD的第二残基与DNA进行序列特异性接触,而RVD的第一残基则稳定含有RVD的环。TALE的靶位点也往往包括第一次重复靶向的5'基侧翼的胸腺嘧啶;这似乎是由于T和中央重复结构域n端保守色氨酸之间的接触然而,这个“零”位置并不总是包含胸腺嘧啶,因为一些支架更容易接受
TAL-DNA在2010年被两个独立的小组破解。由Adam Bogdanove领导的第一个研究小组,从一个由TALEs上调的基因数据库中寻找目标启动子的蛋白质序列比对和DNA序列,通过计算破解了这一密码第二组(Boch)通过对AvrBs3激活的辣椒基因启动子中TAL效应因子AvrBs3及其靶DNA序列的分子分析,推断出该基因的编码实验验证的RVD序列与目标DNA碱基之间的编码表达如下:
NI对应A;HD对应C;NG对应T与5-甲基胞嘧啶(5-M-C);NN对应A与G;NS与任何碱基均可配对;NK对应G,但过多的使用会造成TALE活性的降低;NH对应G。
生物技术
TALE中的氨基酸与其靶位点的DNA碱基之间的简单对应关系,使得它们在蛋白质工程应用中非常有用。许多研究小组已经设计了人工TALE,能够在各种实验系统中识别新的DNA序列。这样的TALE已经被用来创建人工转录因子,可用于靶向、激活或抑制番茄、拟南芥和人类细胞中的内源性基因。
编码TALE蛋白的遗传结构可以使用传统的基因合成或模块组装。质粒试剂盒用于组装定制的TALEN和其他TALE结构,可通过公共的、非盈利的存储库Addgene获得。

设计好的TALE也可以被融合到FokI的剪切域,以产生TAL效应核酸酶(TALEN)或megaTALs。这种融合与锌指核酸酶有一些共同的特性,可能在基因工程和基因治疗应用中有用。
基于TALEN的方法被用于基因编辑和基因组工程等新兴领域。TALEN在酵母、内源性酵母基因、植物报告基因、内源性植物基因、内源性斑马鱼基因、内源性大鼠基因和内源性人类基因中表现出活性。人类HPRT1基因已被检测到,但尚未定量。此外,包含FokI剪切域的TALEN结构体与仍包含DNA结合域的TALE的一小部分融合,已被用于靶向人类细胞内源性NTF3和CCR5基因,效率高达25%。TAL效应核酸酶也被用于工程人类胚胎干细胞和诱导多能干细胞(IPSCs),并敲除秀丽隐杆线虫内源性的ben-1基因。
TALEN诱导的非同源末端连接修饰已被用于水稻产生新的抗病性。
优点与缺点
TALE的优点是模块构建相对简单,可锚定单一碱基,脱靶率比ZF低,也可以进入线粒体内。此外,TALE的方向与DNA序列是相同的——这是ZF做不到的。
TALE的缺点是模块组合复杂,具有一定细胞毒性。但TALE仍然是科研人员用于研究基因功能和潜在基因治疗应用的重要工具。
相对锌指蛋白(Zinc Finger,ZF)而言,TALE能够靶向更长的基因序列,而且也更容易构建。但是直到现在,人们一直都没有一种低成本的而且公开能够获得的方法来快速地产生大量的TALE。

画外音:
Tale在英语里的意思是故事,传说;(对真人真事精彩的或夸张的)描述,讲述;谎言;流言蜚语。巧合的是,转录激活因子类效应因子(Transcription Activator-Like Effector,TALE)的英文缩写也是Tale!