近年来火热的CRISPR基因编辑系统打开了人类研究和操纵基因的“潘多拉魔盒”,让人类从此踏上了神奇的更高效率的基因编辑之旅,2020年,在这一领域做出卓越贡献的Emmanuelle Charpentier教授和Jennifer Doudna教授摘得诺贝尔化学奖。那么CRISPR到底是什么呢?
图 1  2020年度诺贝尔化学奖得主
(图片来源:参考资料[1])
1
CRISPR的诞生
CRISPR基因编辑系统的飞速发展离不开众多先驱,其中来自西班牙阿利坎特大学的微生物学家Francisco Mojica在古细菌的基因组中,发现存在许多重复的且长度为30个碱基的奇怪的“回文”片段。
此外在两段重复之间,则是长约36个碱基的间隔。
Mojica最早将这种具有规律性的重复命名为规律间隔成簇短回文重复序列Clustered RegularlyInter-Spaced Palindromic Repeats它的首字母缩略词便是大名鼎鼎的CRISPR。
此外CRISPR相关蛋白(CRISPR-associated)的简称Cas,与CRISPR共同组成我们熟知的CRIPSR/Cas系统。
CRISPR/Cas系统是很多细菌与大部分古生细菌的一种天然免疫系统,通过对入侵的病毒和核酸进行特异性的识别,利用Cas蛋白进行切割,从而实现对自身的保护。
某些细菌在遭到病毒入侵后,能够把病毒基因的一小段存储到自身的 DNA里,被称之为CRISPR的存储空间。
当病毒二次入侵时,细菌能够凭借CRIPSR系统里存写的片段来识别病毒,将病毒的DNA切断,沉默外源基因的表达,从而抵抗病毒的干扰。
CRISPR/Cas这项技术自被发掘以来,其精确的靶向功能使之被开发成一种高效的基因编辑工具,成为了生物科学领域最炙手可热的研究工具。
2
CRISPR/Cas系统的基本结构
图4 CRISPR/Cas系统基因组中的CRISPR位点
(图片来源:参考资料[3])
CRISPR/Cas系统的基本结构由四部分组成,如图4所示:
(1)Cas基因
Cas基因编码Cas相关蛋白质,是一种双链DNA核酸酶,能在向导RNA(guide RNA, gRNA)引导下对靶位点进行切割,是一类较大的多态性家族,编码的蛋白具有核酸相关的功能域。
(2)CRISPR array
这个部分中包含了重复序列(Repeat)和间隔序列(Spacer)。不连续的重复序列与长度相似的间隔序列间隔排列而成的CRISPR簇(CRISPR array)。这个间隔序列是由Cas系统识别外来基因后存储下来的序列,当有着与系统里储存序列相同基因的病毒入侵时,免疫系统就会被启动;
(3)前导序列(Leader
前导序列(Leader)作为启动子,启动CRISPR簇转录为非编码RNA(Pre-crRNA);
(4)反式激活RNA (trans-activating crRNA, tracrRNA)
重复序列区转录为反式激活RNA,非编码RNA(Pre-crRNA)和反式激活RNA(tracrRNA)通过碱基配对作用结合,酶加工后与Cas蛋白形成复合物。
3
CRISPR/Cas系统的进化分类
2011年和2015年,《自然评论微生物学》报道了CRISPR/Cas系统的分类方法,基于CRISPR/Cas系统的基因组成和位点结构,结合其与保守Cas蛋白(如Cas1)的序列相似性以及系统发育信息,将CRISPR/Cas系统主要划分为两类,这两类在涉及crRNA处理和干扰的效应模块的架构方面存在根本差异。
图 2 第Ⅰ类和第Ⅱ类CRISPR/Cas基因座的一般组织
(图片来源:参考资料[2])
如图2所示,Ⅰ类CRISPR/Cas系统具有由多个Cas蛋白组成的效应模块,这些效应模块形成crRNA结合复合体(如I类系统中的级联复合体),共同作用于靶蛋白的结合和加工。
Ⅱ类系统有一个单一的、多结构域的crRNA结合蛋白(如II类系统中的Cas9),其功能类似于第Ⅰ类的整个效应复合体。
在第一类CRISPR/Cas系统中,根据类型和亚型的不同组合,效应子模块由多个Cas蛋白组成,即Cas3(有时与Cas2融合)、Cas5、Cas8、Cas10和Cas11。
相比之下,在第Ⅱ类系统中,效应器模块由单个大蛋白Cas9、Cas12或Cas13表示。
更精细地,CRISPR/Cas系统被分为6种类型(I型-VI型),图3展示了六类CRISPR/Cas系统的遗传组织、结构组织和功能组织之间的典型关系。
其中II-A型(CRISPR/cas9)、V-A型(CRISPR/cas12a或Cpf1和CRISPR/cas12b或C2c1)是研究最广泛的类型。
图 3 CRISPR/Cas系统的功能模块
(图片来源:参考资料[2])
4
CRISPR/Cas系统的作用机制
图5 CRISPR/Cas系统作用的三个阶段
(图片来源:参考资料[4])
CRISPR/Cas系统的作用分为三个阶段:适应(adaptation)、表达(expression)和干扰(interference),如图5所示。
(1)Adaptationspacer的产生
当噬菌体或外源基因侵入到细菌体内后, CRISPR/Cas系统识别入侵的核酸和扫描外源DNA潜在的PAM(Protospacer adjacent motif)序列,其基因组中的protospacer会被CRISPR/Cas系统中的cas相关基因进行识别而剪切,并插入到leader序列和相邻的repeat的中间形成新的spacer,从而使细菌拥有“记忆”。
这样, 下次同样的外源基因入侵时, 就可以对其基因组进行剪切了。
(2)ExpressionCRISPR序列的加工
在表达阶段,包含间隔序列的CRISPR Array会被转录为前体RNA序列(Pre-crRNA),之后被Cas蛋白剪切成更小的crRNA,即成熟的crRNA,包含1个间隔序列和部分重复序列。
以II型系统为例,反式编码的小RNA ( tracrRNA)与crRNA的重复片段配对,形成一种双链的RNA结构,再与Cas9蛋白组成具有DNA内切酶活性的复合物。
3Interference:干扰入侵核酸
在干扰步骤中,入侵的核酸被裂解。
在I型系统中,crRNA引导级联复合物到达含有互补DNA的靶点,Cas3亚基可能负责切割入侵的DNA;
在II型系统中,首先RNA/Cas9复合体沿外源入侵DNA进行扫描,当识别到PAM序列且DNA序列可与crRNA互补配对形成一个R环时,Cas9蛋白将分别利用HNH和RuvC结构域对DNA的互补链与非互补链进行切割,从而形成DNA的双链断裂;
在III型系统中,一个染色体CRISPR位点和一个入侵的DNA片段通过与5个重复片段的碱基配对来区分,其中Cas6蛋白起重要作用。
随着基因编辑技术的快速发展和进步,CRISPR系统已成为各个领域中功能强大、效率高的基因编辑工具。
针不戳😏,一起看到这里啦!那你对CRISPR/Cas系统的初印象如何呢?有没有想和我们一起深挖细究的崽崽,那请继续关注我们吧😝!
附表1 中英文缩略词表
参考文献
[1] The Nobel Prize in Chemistry 2020, Retrieved October 7, 2020, from https://www.nobelprize.org/prizes/chemistry/.
[2] Makarova Kira S,Wolf Yuri I,Iranzo Jaime et al. Evolutionary classification of CRISPR-Cas systems: a burst of class 2 and derived variants.[J] .Nat Rev Microbiol, 2020, 18: 67-83.
[3] Chaudhuri Abira,Halder Koushik,Datta Asis,Classification of CRISPR/Cas system and its application in tomato breeding.[J] .Theor Appl Genet, 2022, 135: 367-387.
[4] Makarova Kira S,Haft Daniel H,Barrangou Rodolphe et al. Evolution and classification of the CRISPR-Cas systems.[J] .Nat Rev Microbiol, 2011, 9: 467-77.
END

撰文lucky
审核丨小Q老师
责编丨小张老师
往期推荐
继续阅读
阅读原文