细菌的免疫系统——CRISPR(成簇的有规律间隔的短回文重复)
今天介绍的是CRISPR(Clustered Regularly Interspaced Short Palinmic Repeats)——成簇的有规律间隔的短回文重复。
简介

CRISPR(Clustered Regularly Interspaced Short Palinmic Repeats的首字母缩写)是在细菌和古菌等原核生物的基因组中发现的一个DNA序列家族这些序列来自于先前感染原核生物的噬菌体的DNA片段。在随后的感染中,它们被用来检测和破坏类似噬菌体的DNA。因此,这些序列在原核生物的抗病毒防御系统中发挥关键作用,并提供一种获得性免疫的形式。在大约50%的已测序细菌基因组和近90%的已测序古菌基因组中发现了CRISPR。


Cas9(CRISPR相关蛋白9)是一种酶,它使用CRISPR序列作为向导来识别和切割与CRISPR序列互补的特定DNA链。Cas9和CRISPR序列共同构成了CRISPR-Cas9技术的基础,这种技术可以用来编辑生物体中的基因。这个编辑过程具有广泛的应用,包括基础生物学研究、生物技术产品开发和疾病治疗。CRISPR-Cas9基因编辑技术的发展获得了2020年诺贝尔化学奖的认可,该奖项授予了艾曼纽埃尔·夏彭蒂尔和詹妮弗·杜德纳
历史
重复序列
DNA重复集群的发现分别发生在世界的三个地区。1987年,大阪大学的研究员Yoshizumi Ishino和他的同事首次对后来被称为CRISPR的技术进行了描述。他们意外地从他们的目标大肠杆菌的基因组中克隆了部分CRISPR序列和“iap”基因(碱性磷酸酶的同工酶转换)。重复节目的组织是不同寻常的。重复序列通常是连续排列的,没有不同序列的穿插。他们不知道被打断的集群重复的功能。
1993年,荷兰结核分枝杆菌的研究人员发表了两篇关于该杆菌中一组中断直接重复序列(DR)的文章。他们认识到在结核分枝杆菌不同菌株之间直接重复序列的多样性,并利用这一特性设计了一种名为spoligo分型的分型方法,该方法至今仍在使用
西班牙阿利坎特大学的Francisco Mojica研究了在嗜盐富饶菌(Haloferax)和盐丰产菌(Haloarcula)物种的古生物中观察到的重复,以及它们的功能。Mojica的主管当时推测,在细胞分裂过程中,聚集重复序列在将复制的DNA正确分离到子细胞中发挥了作用,因为具有相同重复序列的质粒和染色体不能在火山沃氏嗜盐富饶菌(Haloferax volcanii)中共存。同时首次记录到中断重复序列的转录;这是对CRISPR的第一个完整的描述。到2000年,莫希卡对科学文献进行了调查,他的一个学生用他自己设计的程序对已发表的基因组进行了搜索。他们确定了20种微生物的中断重复属于同一个家族因为这些序列是间隔的,Mojica最初将这些序列称为“短规则间隔重复序列”(SRSR)2001年,Mojica和Ruud Jansen在寻找更多的中断重复序列时,提出了CRISPR(Clustered Regularly Interspaced Short Palinmic Repeats),以缓解科学文献中用来描述序列的众多首字母缩写所造成的混乱。2002年,Tang等人证明了来自闪烁古生球菌(Archaeoglobus fulgidus)基因组的CRISPR重复区域被转录为长RNA分子,这些长RNA分子随后被加工成单位长度的小RNA,加上一些较长的2、3或更多间隔重复单元形式
2005年,酸奶研究人员Rodolphe Barrangou发现嗜热链球菌在经过噬菌体的反复攻击后,噬菌体抗性增强,而这种增强的抗性是由于加入了额外的CRISPR间隔序列巴朗古当时供职的丹麦食品公司丹尼斯克(Danisco)后来开发出了耐噬菌体嗜热链球菌,用于生产酸奶。丹尼斯克后来被杜邦公司(DuPont)收购,杜邦公司“拥有全球约50%的乳制品文化市场”,该技术也成为主流
CRISPR-相关系统
Jansen观察到原核生物重复簇伴随着一组构成CRISPR相关系统或cas基因的同源基因,这对理解CRISPR有一个重要的增加。初步鉴定出4个cas基因(cas 1-4)。Cas蛋白显示解旋酶和核酸酶基序,表明其在CRISPR基因座的动态结构中发挥作用在本出版物中,CRISPR被用作这种模式的通用名称。然而,CRISPR的功能仍然是个谜。

2005年,三个独立的研究小组表明,一些CRISPR间隔子来自噬菌体DNA和染色体外DNA,如质粒。实际上,这些间隔层是从先前试图攻击细胞的病毒中收集来的DNA片段。这些间隔物的来源标志着CRISPR/cas系统可能在细菌的适应性免疫中发挥作用。提出这一想法的三项研究最初都被一些知名期刊拒绝,但最终都出现在了其他期刊上
Mojica和阿利坎特大学的合作者发表的第一篇论文提出了CRISPR-Cas在微生物免疫中的作用,预测了间隔子的RNA转录本在目标识别中的作用,其机制可能类似于真核细胞使用的RNA干扰系统。Koonin和他的同事扩展了这一RNA干扰假说,他们根据不同CRISPR-Cas亚型蛋白的预测功能提出了它们的作用机制
几个小组的实验工作揭示了CRISPR-Cas免疫的基本机制。2007年,首次发表了CRISPR是适应性免疫系统的实验证据。嗜热链球菌的CRISPR区从感染噬菌体的DNA获得间隔层。研究人员通过添加和删除序列与被测试噬菌体中发现的序列相匹配的间隔子,来控制嗜热链球菌对不同类型噬菌体的抗性。2008年,Brouns和Van der Oost发现了一个Cas蛋白复合体(称为Cascade),该复合体在大肠杆菌中将重复序列中的CRISPR RNA前体切割成成熟的含有间隔层的RNA分子,称为CRISPR RNA(crRNA),该RNA分子仍然与蛋白质复合体结合此外,还发现级联、crRNA和解旋酶/核酸酶(Cas3)是提供细菌宿主对DNA病毒感染免疫所必需的。通过设计一种抗病毒CRISPR,他们证明了crRNA的两个方向(正义/反义)提供了免疫,这表明crRNA向导以dsDNA为靶点。那一年,Marraffini和Sontheimer证实表皮葡萄球菌(Staphylococcus Epidermidis)的CRISPR序列是靶向DNA而不是RNA,以防止整合。这一发现与提出的CRISPR-Cas免疫的RNA干扰样机制不一致,尽管后来在炽热球菌(Pyrococcus furiosus)中发现了一种靶向外源RNA的CRISPR-Cas系统。2010年的一项研究表明,CRISPR-Cas同时切断了嗜热链球菌的噬菌体和质粒DNA链。
Cas9
研究人员从化脓性链球菌(Streptococcus pyogenes)中研究了一种更简单的CRISPR系统,这种系统依赖于Cas9蛋白。Cas9核酸内切酶是一个四成分系统,包括两个小分子:crRNA和反式激活CRISPR RNA(tracrRNA)。Jennifer Doudna和Emmanuelle Charpentier通过将两个RNA分子融合成“sgRNA”,将Cas9核酸内切酶重新设计成一个更易于管理的双组分系统。当Cas9与Cas9结合时,可以找到并切断引导RNA指定的DNA靶标。这一贡献非常重要,因此在2020年获得了诺贝尔化学奖。通过操纵引导RNA的核苷酸序列,人工Cas9系统可以被编程为针对任何DNA序列进行切割另一组合作者包括Virginijus Šikšnys、Gasiūnas、Barrangou和Horvath,他们表明,来自嗜热链球菌CRISPR系统的Cas9也可以通过改变其crRNA的序列来对他们选择的位点进行重新编程。这些进展推动了用改良的CRISPR-Cas9系统编辑基因组的努力。
由张峰和乔治·丘奇领导的团队首次同时发表了使用CRISPR-Cas9对人类细胞进行基因组编辑的描述。自那以后,它被广泛应用于各种生物体中,包括面包酵母(Saccharomyces cerevisiae)、白色念珠菌(Candida albicans)、斑马鱼(Danio rerio)、果蝇(Drosophila melanogaster)、蚂蚁(Harpegnathos saltator与Ooceraea biroi)、蚊子(埃及伊蚊)、线虫(Caenorhabditis elegans)、植物、小鼠(Mus musus domesticus)、猴子和人类胚胎。
CRISPR已经被修饰成可编程的转录因子,允许科学家锁定、激活或沉默特定的基因。
CRISPR-Cas9系统已被证明可以在人类三原核合子中进行有效的基因编辑,这一发现最早是在2015年由中国科学家梁平和徐勇发表的一篇论文中提出的。该系统成功地对54个胚胎中的28个进行了突变体-血红蛋白(HBB)的切割。28个胚胎中有4个使用科学家提供的供体模板成功重组。科学家们发现,在被切割的DNA链重组过程中,同源内源性序列HBD与外源性供体模板竞争。与干细胞相比,人类胚胎中的DNA修复更为复杂和特殊。
Cas12a
2015年,核酸酶Cas12a(原名Cpf1)在新凶手弗朗西斯菌(Francisella novicida)的CRISPR/Cpf1系统中被鉴定出来。其最初的名字来自于2012年建立的tigrfam蛋白家族定义,反映了其CRISPR-Cas亚型在普雷沃菌和弗朗西斯菌谱系中的流行程度。Cas12a与Cas9有几个关键的区别,包括:在双链DNA中引起“交错”切割,而不是由Cas9产生的“钝”切割,依赖于“T rich”PAM(为Cas9提供替代的靶向位点),只需要CRISPR RNA (crRNA)就可以成功靶向。相比之下,Cas9需要crRNA和转录激活crRNA(tracrRNA)。
这些差异可能使Cas12a比Cas9有一些优势。例如,Cas12a的小crRNA是多路基因组编辑的理想选择,因为与Cas9的sgRNAs相比,它们可以在一个载体中封装更多的crRNA。此外,Cas12a留下的粘稠的5 '悬垂物可以用于DNA组装,这比传统的限制性内切酶克隆更具有靶向性。最后,Cas12a从PAM位点下游切割DNA 18-23个碱基对。这意味着在修复后,识别序列不会受到破坏,因此Cas12a能够进行多轮DNA剪切。相比之下,由于Cas9只剪切了PAM位点上游的3个碱基对,NHEJ途径导致了indel突变,破坏了识别序列,从而防止了进一步的剪切。从理论上讲,重复的DNA切割应该会增加所需基因组编辑发生的机会。与Cas9相比,Cas12a的一个显著特征是,在切割靶分子后,Cas12a仍然与靶分子结合,然后不区分地切割其他ssDNA分子。这种特性被称为“侧向剪切”或“反向剪切”活动,并已被各种诊断技术的发展所利用。
Cas13
2016年,从沙氏纤毛菌(Leptotrichia shahii)中鉴定出核酸酶Cas13a(以前称为C2c2)。Cas13是一种RNA引导的RNA核酸内切酶,这意味着它不能切割DNA,而只能切割单链RNA。Cas13被其crRNA引导到一个ssRNA靶点,并结合和切割靶点。与Cas12a类似,Cas13仍然与靶蛋白结合,然后不加区别地切割其他ssRNA分子。这种间接切割特性已被用于各种诊断技术的发展。
基因工程应用
CRISPR的主要应用就是基因编辑。
CRISPR技术已被应用于食品和农业行业,以设计益生菌,并使工业培养物(如酸奶)免疫,防止感染。它也被用于农作物,以提高产量、抗旱性和营养价值。
常用的CRISPR/Cas系统中,SpCas9来自化脓链球菌(Streptococcus Pyogenes),SaCas9来自金黄色葡萄球菌(Staphylococcus Aureus),而BhCas12b V4来自外村尚芽孢杆菌(Bacillus Hisashii)。
到2014年底,已经发表了大约1000篇提到CRISPR的研究论文。该技术已被用于使人类细胞系和细胞中的基因功能失活,研究白色念珠菌,修改用于制造生物燃料的酵母和转基因作物菌株。Hsu和他的同事说,操纵基因序列的能力允许进行反向工程,这可以对生物燃料的生产产生积极的影响。CRISPR还可以用来改变蚊子,使它们不能传播疟疾等疾病。基于CRISPR的利用Cas12a的方法最近已经成功地应用于大量植物的修饰。
2019年7月,CRISPR被用于实验性治疗一名患有遗传疾病的患者。患者为一名34岁的镰状细胞病患者。
2020年2月,在HIV治疗方面取得了进展,小鼠体内整合病毒DNA的60-80%被移除,在经过涉及激光抗逆转录病毒疗法和CRISPR的编辑后,一些病毒完全失去了感染性。
2020年3月,为了治疗莱伯先天性黑内障,科学家将CRISPR修饰病毒注射到一位患者的眼睛中。

2021年04月25日,CRISPR-Cas基因修正系统的前驱之一张锋教授在《自然》子刊《Nature Communications》发布一项重要开展,报告了第三个可以修正人类细胞基因组的CRISPR-Cas系统:CRISPR-Cas12b。
Cas12b(CasC2c1)比Cas9和Cas12a更小,因此更容易经过病毒载体完成细胞间投递。
虽然Cas12b有这样的优势,Cas12b的开发却遇到了一个阻挠。功用最佳的Cas12b来自一种嗜酸耐热菌(Alicyclobacillus acidoterrestris),但它作为DNA裂解酶的最佳活性需求高达48℃。也就是说,假设放进哺乳动物细胞内,达不到这种Cas12b的温度要求,酶活性就不能发挥。怎样“解锁”这种Cas蛋白呢?
为了适用于人类基因组基因编辑,张锋教授和伙伴们首先在Cas12b蛋白家族中寻找喜欢常温的成员。毕竟,根据同源序列比对,他们从一种叫作外村尚芽孢杆菌(Bacillus Hisashii)的细菌中断定出了在人体体温(37℃时)能坚持核酸酶活性的BhCas12b。并且,研讨人员还重新设计sgRNA的结构,让Cas12b如虎添翼。
体外实验发现,原始结构的Cas12b在DNA双链断裂时会切开非靶标单链,并且温度越低,这种差错发生得越多。为了处理这个问题,研讨者对Cas12b进行了工程改造。根据蛋白质晶体结构的条理,研讨人员经过4个点突变,得到了重新设计的新Cas12b,让酶的活性位点更简略和DNA靶序列靠近。
经过重新设计的Cas12b,在细胞培养实验中,研讨人员针对多个基因的多个靶序列查询了Cas12b的编辑成功率。对随机引入刺进缺失的分析效果闪现,重新设计的Cas12b的编辑成功率与Cas9和Cas12a恰当、甚至更高,足以在人体细胞中作为新一代基因编辑工具。
除了有效性,特异性关于一款健壮的基因组修正东西来说也非常重要。这一点,研讨团队也在人类细胞中运用GUIDE-seq技术对全基因组规划内的脱靶效应进行了检测。效果标明,比较常用的Cas9,Cas12b导致的差错刺进缺失都要少得多,脱靶性显着下降。
未来,CRISPR基因编辑可能被用于创造新物种,或从近亲中复活已灭绝的物种。
基于CRISPR的对基因与疾病关系主张的重新评估,发现了潜在的重要异常。
CRISPR诊断

CRISPR相关核酸酶已被证明是一种有用的分子检测工具,因为它们能够在高背景的非目标序列中特异性地靶向核酸序列。2016年,Cas9核酸酶被用于清除下一代测序文库中不需要的核苷酸序列,而只需要250皮克的初始RNA输入。从2017年开始,CRISPR相关核酸酶也被用于核酸的直接诊断测试,甚至单分子敏感性。
通过将基于CRISPR的诊断技术与其他酶促过程相结合,检测核酸以外的分子成为可能。这种耦合技术的一个例子是基于sherlock的IN体外转录分析(SPRINT)。SPRINT可用于检测多种物质,如患者样本中的代谢物或环境样本中的污染物,具有高通量或便携式即时护理设备。CRISPR/Cas平台也正在探索用于检测和灭活导致COVID-19的病原体SARS冠状病毒2。 真核细胞是由革兰氏阳性菌进化而来,但是为什么属于革兰氏阳性菌的葡萄球菌有CRISPR,而真核细胞没有CRISPR。
附带一提,少数病毒,例如米米病毒,也拥有类似CRISPR的免疫系统——MIMIVIRE。它可以切割噬病毒体(Virophage)的DNA,进而保护自己不受伤害。

