2020年3月5日,《自然》(nature)杂志官网刊登了这样一条新闻:CRISPR treatment inserted directly into the body for first time
图1 首次将CRISPR疗法直接植入人体(图片来源:《自然》杂志官网)
该试验是由基因编辑大神张锋等人创立的Editas Medicine和Allergan联合,旨在测试利用CRISPR/Cas9基因编辑技术治疗先天性黑矇症(LCA10)。LCA10又称为遗传性先天性视网膜病,是导致儿童失明的主要原因,目前尚无治疗方法。
医生可以用手术刀为病人缝合伤口,那么科学家也可以利用“手术刀”来改造基因,而科学家的“手术刀”——CRISPR/Cas9基因编辑技术,可被用于删除与LCA10相关的CEP290基因突变,去除由CEP290基因中的IVS26突变产生的异常剪接供体,使CEP290基因正常表达,从而成功恢复患者视力。
如此神奇又火热的CRISPR/Cas9基因编辑技术,你也一定充满了好奇吧!
有看过我们前期的文章高分文章标配的CRISPR编辑系统,到底为何物?的崽崽会知道,文中我们有讲到CRISPR/Cas基因编辑系统被归类为两大类,并进一步细化为I-VI型。而今天我们要讲的CRISPR/Cas9技术属于第2大类中的第II型,也就是常被提到的II型CRISPR/Cas9技术。
接下来,首先让我们了解一下II型CRISPR/Cas9技术的发展史吧!
CRISPR/Cas9技术的来龙去脉
(1)重复间隔序列的发现
图1 大肠杆菌中基因组中重复序列的比较(图片来源:参考资料[1])
1987年,Ishino Y等人在大肠杆菌的iap基因的3’端侧翼区域发现了一个不寻常的结构,29个核苷酸组成的5个高度同源序列以32个核苷酸为间隔,直接重复排列。
(2)重复间隔序列被正式命名为CRISPR
图2 重复间隔序列的命名(图片来源:参考资料[2])
2002年,Jansen等人利用硅分析,研究了存在于原核生物(古菌和细菌)中的一个新的DNA重复序列家族,大小从21到37 bp不等,间隔有大小相似的非重复序列。为了更好地理解它们的特征结构,他们将这个家族称为聚类规则间隔短回文重复序列(clustered regularly interspaced short palindromic repeats, CRISPR)。
(3)CRISPR可能参与微生物的免疫防御
图3 CRISPR间隔序列与微生物基因的同源性(图片来源:参考资料[3])
2005年,Bolotin等人对24株嗜热链球菌和前庭链球菌的CRISPR结构进行序列分析,发现这些CRISPR序列和噬菌体的基因序列匹配度很高,嗜热链球菌的噬菌体敏感性似乎与该菌株携带的CRISPR位点间隔序列的数量有关,说明CRISPR 可能参与了微生物的免疫防御。
(4)CRISPR/Cas系统的分子机制被揭示
图4 RNase III和Csn1参与tracrRNA介导的crRNA成熟(图片来源:参考资料[4])
2011年,Charpentier等人通过对人类化脓链球菌的差异RNA测序发现了tracrRNA,是一种反式编码的小RNA,与crRNA前体转录本的重复区域有24个核苷酸互补。研究表明tracrRNA通过广泛保守的内源性RNase III和CRISPR相关的Csn1蛋白的活性来指导crRNA的成熟。
CRISPR/Cas9技术的五脏六腑
大致清楚了CRISPR/Cas9技术的身世背景, 是时候深入了解一下CRISPR/Cas9系统的工作机制了,其发挥基因编辑的功能离不开核酸内切酶(Cas9)、原间隔序列临近基序(PAM)、CRISPR RNA (crRNA)和反式激活crRNA (trans-activating crRNA, tracrRNA)等,是目前应用最广泛的基因编辑方法。接下来让我一起剖析它的五脏六腑吧!
(1)Cas9核酸内切酶
图5 化脓性链球菌Cas9蛋白的结构(图片来源:参考资料[5)
CRISPR/Cas9技术的核心组分之一就是化脓性链球菌Cas9 (Streptococcus pyogenes Cas9, SpCas9)蛋白,以下简称Cas9。Cas9是II型核酸酶,由7个结构域组成:REC I、REC II、REC III、HNH、RuvC、PAM-interacting(PAM相互作用域)和bridge helix(桥螺旋)(图2)。
①REC I域(蓝色)负责与gRNA连接;
②反过来,REC III结构域(青色)被用来感知RNP复合物(Cas9-sgRNA复合物)的形成;
③PAM-interacting(红色)识别目标DNA上的PAM序列;
④富含精氨酸的桥螺旋(粉红色)在结合靶DNA和调节Cas9蛋白的切割活性方面起着关键作用;
⑤和⑥HNH(绿色)和RuvC(黄色)区域负责裂解,它们每个都能在PAM上游3 nt处分裂出一条DNA单链,从而导致双链断裂;
⑦REC II结构域(灰色)的作用尚未完全阐明,但它似乎对DNA裂解不是关键的。
那么问题一来了:Cas9蛋白中具有切割活性的结构域是啥呢?
答:是由两个标志性的核酸酶结构域HNH和RuvC组成,其中HNH结构域负责剪切与crRNA互补的DNA链,而RucV结构域负责剪切双链DNA的另一条链,从而导致DNA双链断裂。
最近网络热议,布洛芬可以缓解那么多地方的疼痛,但它如何知道哪里疼?有网友神评论:布洛芬吃进去以后,它就在神经内疯狂奔走,挨个问你痛不痛啊你痛不痛啊?!属实是有些可爱了
那么同理,我们的Cas9蛋白在体内是如何选择DNA双链进行切割呢?它也是需要挨个问你要不要切割要不要切割吗?NO!因为它有专职导航——PAM,请接着往下看!
(2)PAM(原间隔序列临近基序)
图6 CRISPR PAM的功能示意图(图片来源:参考资料[6])
CRISPR/Cas9系统会在病毒初次侵入时截取一段序列作为原间隔序列(protospacer),每次序列截取就伴随着重复序列的复制,从而形成一个个新的重复-间隔单元(Repeat-spacer)。
并且间隔序列主要发挥识别外源DNA的作用,而在间隔序列临近的地方有一段保守序列(2-5bp),在基因组中被称为原间隔序列临近基序(protospacer adjacent motif),即PAM。
而当病毒再次入侵时,Cas9蛋白通常依赖于PAM作为目标识别的第一步,一旦PAM基因被结合,找到正确的靶向DNA序列,Cas9蛋白就能开始执行切割功能。而在没有PAM(Non-PAM)的CRISPR阵列中,位于间隔序列两侧的重复序列则不会被切割。
那么问题二来了:PAM序列是什么?
答:不同种类的Cas蛋白识别不同的PAM序列。现阶段,被广泛认可的化脓性链球菌SpCas9仅识别比较短的PAM序列为NGG (N为任意碱基,G为鸟嘌呤)。
Cas9蛋白要发挥切割作用,除了它的“专职导航”PAM以外,还需要一名“老司机”将它全称护送至目的地,这名“老司机”就是向导RNA(single guide RNA, sgRNA)。
(3)crRNA和tracRNA
我们现在耳熟能详的sgRNA的前体,即crRNA和tracRNA,是 CRISPR/Cas9技术的第三大关键组分。
病毒再次入侵时,Cas9蛋白通过PAM序列定位到靶点上游的同时,CRISPR 也转录产生前体crRNA(Pre-CRISPR RNA, Pre-crRNA),Pre-crRNA经过加工后形成成熟的crRNA。
成熟的crRNA 的5'端区域能够与靶位点互补配对,其3'端能够与反式激活crRNA (tracrRNA)通过碱基配对形成了一个双RNA结构(crRNA:tracrRNA 复合体),Cas9蛋白能够识别该复合体并与之结合,从而在靶位点进行特异性地切割。
图7 crRNA:tracrRNA复合体与sgRNA结构对比图(图片来源:参考资料[7])
那么问题三来了:目前我们常见的CRISPR/Cas9系统已经被精简为两大组分,分别为Cas9蛋白和向导RNA,那么是如何从两种RNA进化为一种RNA呢?
答:这要归功于诺贝尔化学奖得主之一的Jennifer博士,她的最突出的贡献如图7所示,根据crRNA:tracrRNA 复合体的结构特征设计出了单个RNA嵌合体--sgRNA,sgRNA 具备crRNA:tracrRNA 复合体的功能,能够被Cas9 蛋白识别并引导Cas9 蛋白结合于靶位点,进一步简化操作过程。
目前我们常用的是96nt的sgRNA序列,包括20nt的靶点序列76nt的sgRNA骨架。
结语
七七八八了解了这么多,最后让我们通过下边这张图一起概括一下CRISPR/Cas9技术!
图8 CRISPR/Cas9技术示意图(图片来源:参考资料[8])
简而言之,在“老司机”sgRNA的熟练操控下,Cas9蛋白通过“专职导航”PAM顺利到达靶点上游,导致DNA的双螺旋结构解开。
此时,Cas9蛋白的两个特定结构域切割DNA,其中HNH结构域负责剪切与sgRNA互补的DNA链,而RucV结构域负责剪切双链DNA的另一条链,从而造成DNA双链断裂。
双链DNA发生断裂后,触发细胞自身的DNA修复机制,如图8所示,包括非同源末端连接(Non-Homologous End Joining, NHEJ)和同源定向修复 (Homology-Directed repair, HDR)。
利用这两种修复机制可以迫使细胞在特定位置进行基因敲除和插入新的DNA片段(实现点突变、筛选标记、荧光标签和重写基因组等)。
今天很荣幸我们又一起学习了新的知识,但进步不止于此。棒棒的崽崽们,关注我们吧!下期手把手教你如何轻而易举设计sgRNA,随心所欲干掉你想干掉的任何基因!精彩从不间断,下期不见不散哦!
参考文献

[1]Ishino Y,Shinagawa H,Makino K et al. Nucleotide sequence of the iap gene, responsible for alkaline phosphatase isozyme conversion in Escherichia coli, and identification of the gene product.[J] .J Bacteriol, 1987, 169: 5429-33.
[2]Jansen Ruud,Embden Jan D A van,Gaastra Wim et al. Identification of genes that are associated with DNA repeats in prokaryotes.[J] .Mol Microbiol, 2002, 43: 1565-75.
[3]Bolotin Alexander,Quinquis Benoit,Sorokin Alexei et al. Clustered regularly interspaced short palindrome repeats (CRISPRs) have spacers of extrachromosomal origin.[J] .Microbiology (Reading), 2005, 151: 2551-2561.
[4]Deltcheva Elitza,Chylinski Krzysztof,Sharma Cynthia M et al. CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III.[J] .Nature, 2011, 471: 602-7.
[5]Halat Monika,Klimek-Chodacka Magdalena,Orleanska Jagoda et al. Electronic Circular Dichroism of the Cas9 Protein and gRNA:Cas9 Ribonucleoprotein Complex.[J] .Int J Mol Sci, 2021, 22: undefined.
[6]Leenay Ryan T,Beisel Chase L,Deciphering, Communicating, and Engineering the CRISPR PAM.[J] .J Mol Biol, 2017, 429: 177-191.
[7]Jinek Martin,Chylinski Krzysztof,Fonfara Ines et al. A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity.[J] .Science, 2012, 337: 816-21.
[8]Doetschman Thomas,Georgieva Teodora,Gene Editing With CRISPR/Cas9 RNA-Directed Nuclease.[J] .Circ Res, 2017, 120: 876-894.
END
撰文lucky
审核丨小Q老师
责编丨小张老师
往期推荐
继续阅读
阅读原文