编者按
病毒突变不是什么新鲜事,尤其是RNA病毒,突变更是常见,这也是为什么流感病毒疫苗相对于乙肝病毒疫苗来说难以研发的因素之一,因为前者是RNA病毒,后者是DNA病毒。对于每一个接触过分子生物学实验、有着基本科学素养的人来说,“突变”更像是一种中性词,有好的一面,也有坏的一面。然而,对于大多数非专业领域的人员来说,则谈“突变”色变。当然,一方面需要科研人员带来更权威、更专业的解释(需要提一句的是,我们都知道科研更多的是一种“提出假说-验证假说-否定假说-再提出新假说”的过程,因此我们也应该给科研人员更多的宽容,因为本来科研就是不断完善和发展的),另一方面,在这个人人都是媒体的年代,如何能坚持底线,不盲目解读科学结论、不传播不责任的内容,也是每一个在传播链节点上的个体要思考的。
责编 | 兮
2020年3月2日,加州大学洛杉矶分校程根宏、中国CDC谭文杰、苏州系统医学研究所蒋太交、中国CDC武桂珍等合作在预印版平台bioRxiv发表文章Mutations, Recombination and Insertion in the Evolution of 2019-nCoV提供了一个对于新冠状病毒传播和进化路径的全面的展示。
摘要
背景:新型冠状病毒(SARS-COV-2)的传播速度远远超过了导致非典型肺炎的冠状病毒(SARS冠状病毒)和导致中东呼吸综合征的冠状病毒(MERS-CoV)。然而,该病毒的传染和分子进化机制仍然有待研究。
方法:我们收集并分析了包含11株新收集于中国病人的病毒序列在内的120条新冠状病毒基因组序列。通过对这些序列进行综合分析,我们追踪了多个继承性单核苷酸多态性位点(SNPs),并确定了新冠状病毒与其他冠状病毒之间的简化关系。
结果:在对新冠状病毒的120个基因组序列进行系统分析后,我们发现了两个具有不同SNPs标记的遗传亚群的共流行,这一发现可用于追踪新冠状病毒在不同地区和国家的传播途径。尽管新冠状病毒、人SARS病毒和蝙蝠SARS病毒在基因组结构上具有高度同源性,但它们通过受体结合区的潜在重组,进化成具有不同受体进入特性的两个不同群体。此外,新冠状病毒在spike蛋白的S1和S2结构域之间有一个独特的4个氨基酸插入,这创造了一个潜在的furin或TMPRSS2裂解位点。
结论我们的研究提供了一个对于新冠状病毒传播和进化路径的全面的展示。我们的结果暗示新型冠状病毒可能通过受体结合区重组和furin或TMPRSS2裂解位点插入增加其感染性。
简介
新型冠状病毒(2019 nCoV或SARS-COV-2)已经出现并流行于人群众。这一源自中国武汉的疫情始于2019年12月,截至2020年2月23日,全球已确诊病例超过77000例,死亡人数超过2400人。目前的病毒已扩散至韩国、日本、泰国、新加坡、越南、台湾、尼泊尔和美国等29个国家或地区。武汉地区的一系列肺炎病例均与该病毒有关,表现为发热、干咳和呼吸困难。大多数患者没有明显的上呼吸道症状,提示靶细胞位于下呼吸道。目前也已有相关研究从下呼吸道表皮细胞中分离并鉴定出该病毒。
冠状病毒是包膜、单股正链RNA病毒,它们在适应新物种的过程中,通常会发生受体结合域(RBD)的快速突变和重组。对新型冠状病毒的系统发生分析表明,它是一种新的β冠状病毒,隶属于B系(亚属:sarbecovirus),同属于该系的还包括严重急性呼吸综合征冠状病毒(SARS冠状病毒)。目前的新型冠状病毒基因组与2013年在中国云南首次分离的Bat/SARS/RaTG13/云南株在遗传关系上最为相似。近期的一些研究暗示穿山甲可能是新型冠状病毒的中间宿主。最近,这种新的冠状病毒被证实使用了与SARS冠状病毒相同的细胞进入受体ACE2。冠状病毒(coronavirus,CoV)能够改变嗜性或受体靶向性在不同宿主之间传播。这些特征是由棘突表面糖蛋白受体结合域(RBD)的变化介导的。与其他已知的包膜病毒相似,冠状病毒通过这种棘突蛋白与宿主细胞膜融合而引发感染。它们的棘突蛋白由分别负责宿主受体识别和膜融合的S1和S2亚基组成。新型冠状病毒最近被证实使用人ACE2作为受体。
尽管新型冠状病毒的病死率较低,症状较SARS轻,但新型冠状病毒的传播率似乎更高。导致新型冠状病毒如此快速传播和扩散的分子机制目前仍未被揭示。在这里,我们分析了120组新型冠状病毒的基因组序列,以确定病毒的进化和分化。我们的研究表明,新型冠状病毒可能通过受体结合区重组和furin或TMPRSS2裂解位点插入增加其感染性。
结果
第一例人与人之间的感染发生在2019年12月中旬,迄今为止,确诊病例总数和确诊死亡人数在较短时间内超过SARS病毒导致的疫情规模1个数量级。为了将新型冠状病毒的病理特性与特异性毒力因子联系起来,我们将流行病学信息与从WHO获得的序列数据进行了比较。我们比较了新型冠状病毒的感染率与近年来爆发的β冠状病毒包括2002年11月的SARS和2012年9月的MERS感染率(图1A)。新型冠状病毒的传播速度似乎比SARS和MERS快得多。到目前为止,已确诊的新型冠状病毒病例比2002年SARS爆发的病例还要多。冠状病毒序列在过去18年中频繁、一致地被公开,其中包括2002年SARS爆发期间从不同国家分离的SARS株、主要在中国报告的散发性冠状病毒株、从沙特阿拉伯和阿拉伯联合酋长国等中东国家分离的MERS株(图1B)。为了进一步了解β冠状病毒的进化和追踪新型冠状病毒的突变,我们收集了11个来自武汉等多个中国城市新发现患者的新型冠状病毒全长基因组序列并进行了测序(图1C)。系统发育分析表明,这11株序列与其他新型冠状病毒在进化树中能够聚集在一起,与bat-CoV-RaTG13株的同源性高于人类SARS、MERS和其他冠状病毒(图S1A)。在氨基酸水平上,它们只在与人类和蝙蝠SARS中相应氨基酸序列相同的一致序列的位置上有少量随机替换(图S1B)
为了识别新的遗传突变,我们以SARS-COV-2株(EPI_ISL_402125)为根构建了GISAID(更新于2020年2月18日)中所有120个新冠状病毒完整基因组的系统发生树。根据核苷酸读码区位点8517和27641,新型冠状病毒可分为两大类,即G1和G2(图2A和S2)。所有G1毒株在8517和27641位点分别具有胸腺嘧啶和胞嘧啶,而G2毒株的8517和27641位点的核苷酸分别为胞嘧啶和胸腺嘧啶(图2A和S3)。流行病学资料显示,最早的G1株(EPI_ISL_406801)于2020年1月5日在武汉分离,最早的G2株于2019年12月24日在武汉分离(图2A)。两个基因群在同一城市的存在表明了共流行。在每一组中,我们还观察到多个毒株中附加的共同突变。基于这些潜在的可遗传突变和毒株分离的时间及位置,我们生成了一个突变树图来跟踪个体共同突变并显示不同分离株之间的关系(图2A和S2)。例如,1月10日至15日在广东鉴定的5株毒株在G1背景下的28578核苷酸位置均具有相同的突变,可能由同一人传播。具有类似突变的毒株也分离于1月29日至31日在日本发现的3例患者,不同的是,这些毒株在核苷酸位置2397处具有另外附加突变,而于1月22日分离自美国的毒株则在核苷酸位置10818处具有附加突变。G10818T的突变是一个非常值得关注的位点,因为它被G1和G2中的几个独立毒株共享,这将导致orf1ab多聚蛋白内的L3606F氨基酸替换(图S3)。目前尚不清楚10818位点在G1和G2毒株中的共同突变是否具使其具有增殖优势,但穿山甲和蝙蝠冠状病毒在同一位置有L3606V替代(图S3)。当将G1和G2毒株展示在地图上(图2B)时,似乎这两组毒株都已传播到大多数国家和地区。
与新型冠状病毒最密切相关的β冠状病毒是RaTG13,该病毒与2013年分离自云南的蝙蝠中(图3A)。我们用核苷酸序列对特定病毒蛋白如orf1a、spike、matrix和核衣壳进行了额外的系统发育分析(图3B),发现RaTG13株与其他蝙蝠SARS样冠状病毒株有同样的密切关系。我们进一步估计,新型冠状病毒和RaTG13之间的大多数蛋白质差异发生在2005年和2012年,而人类SARS和蝙蝠SARS样冠状病毒之间的差异发生在1990-2002年(图3B)。比较全长spike蛋白序列时,新型冠状病毒与人和蝙蝠SARS的序列同源性为39%,与MERS或其他冠状病毒的序列同源性为29%。值得注意的是,我们发现新型冠状病毒和穿山甲冠状病毒在棘突蛋白的RBD(aa 315-550区域)中共享几乎相同的氨基酸序列,但在RaTG13中不共享(图3A和3D)。为了证实这一发现,我们将Liu等人报告的穿山甲冠状病毒序列与先前分离但未发表的穿山甲冠状病毒序列进行了比较(图S4)。根据比对和系统发育分析,我们发现新型冠状病毒的一致序列与BetaCoV/ pangolin / Guangdong /P2S/2019(EPI_ISL_410544)的同源性最高,而在广西分离的穿山甲CoV株中发现了额外的突变和插入缺失。BetaCoV/pangolin/Guangdong/P2S/2019和pangolin-CoV均于2019年从中国广东省分离。接下来,我们用ML方法检测了新型冠状病毒与25株具有代表性的CoV株(包括Hu-CoV、SARS和MERS)和5株新穿山甲CoV株的一致性spike蛋白序列的系统发育关系(图S4)结果表明,新型冠状病毒的棘突蛋白可能来源于穿山甲CoV,而不是RaTG13,它们可能与BAT_SARS冠状病毒/BAT-SL-CoVZC542同源。虽然2019-nCoV在整个基因组结构中与RaTG13最同源,但棘突蛋白的RBD与穿山甲冠状病毒最同源,这表明在2019-nCoV的进化过程中,RaTG13样株和穿山甲冠状病毒样株之间可能发生重组。我们已经手动检查了基因组中所有的氨基酸突变。由于穿山甲冠状病毒序列中存在非序列区域,我们没有包括这些区域的任何位置。我们发现,当比较穿山甲冠状病毒和新型冠状病毒时,除了RBD,非结构蛋白14和非结构蛋白15中的区域也共享连续序列(图3D)
为了进一步评估新型冠状病毒与其他SARS冠状病毒的关系,我们分析了新型冠状病毒和不同的人/蝙蝠SARS病毒的RBM,发现它们可以清楚地分为两个不同的类群(图4A)。I类病毒包括新型冠状病毒、穿山甲冠状病毒、12种蝙蝠类SARS病毒(蝙蝠SARS冠状病毒I),包括RaTG13,以及人类SARS病毒(表S1)。分支II中的病毒包括49种蝙蝠SARS病毒(蝙蝠SARS CoV II),如ZXC21和ZC45,它们与新型冠状病毒的核苷酸和氨基酸同源性约为90%(表S2)。这两个分支的主要区别在于,分支I病毒的RBM具有比分支I病毒短5和13-14氨基酸的区域(图4B)。以往的结构分析表明,SARS病毒RBM中的13-14氨基酸区形成了一个明显的环状结构,在两个半胱氨酸残基之间形成了一个二硫键。尽管这一环区内新型冠状病毒的氨基酸序列与人类SARS病毒的氨基酸序列有很大不同,但这两个半胱氨酸残基是保守的(图4B)。值得注意的是,所有已知使用ACE2作为进入受体的冠状病毒都在I类中,包括新型冠状病毒,根据最近的研究,它也可以通过ACE2受体感染细胞(图S5)。另一方面,尽管ACE2与新型冠状病毒的全基因组序列同源,但目前还没有报道使用ACE2作为分支II中病毒的进入受体。因此,我们的研究不仅强调了RBM在确定进入受体特异性方面的关键作用,而且还提出了一个问题,即同源的β冠状病毒毒株如何通过RBM中的插入删除或重组等突变来改变嗜性的?
我们的研究还表明,新型冠状病毒在荆棘蛋白内或在核苷酸位置23619-23632内具有独特的四个氨基酸插入(681-PRRA-684)(图4C)。需要说明的是,这种插入(PRRA)在新型冠状病毒的spike蛋白中为哺乳动物furin蛋白创建了一个潜在的裂解位点RRAR,其一致序列为RXXR。潜在的furin裂解位点插入到spike蛋白的S1和S2结构域之间的边界,PRRA插入的第一个脯氨酸残基可能将β转化引入到多肽链中。为了了解这种插入的唯一性,我们使用来自人类、果子狸和蝙蝠的SARS冠状病毒代表株进行了序列比较。我们的研究表明,这种插入是新型冠状病毒独有的(图4C和S6)与其他冠状病毒家族成员相比,我们发现类似的插入已经被识别,并且位于荆棘蛋白的S1和S2结构域之间的结构边界(图4C)
讨论
新型冠状病毒仍在从武汉迅速传播到中国和其他国家的不同城市,传播速度超过了非典和MERS。我们对新型冠状病毒的120个不同株系的基因组突变进行了系统的分析和追踪。尽管大多数替换是de-novo突变,我们已经鉴定了新型冠状病毒不同毒株间所共同拥有的多个单核苷酸多态性位点(SNP)。由于低突变率和大的基因组构成,我们假设这些共享的SNP位点是从大群体中遗传的。基于这个假设,我们生成了SNP树来跟踪新型冠状病毒的突变和传播。值得注意的是,我们发现新型冠状病毒基因分为两个不同的组,在8517和27641位点具有不同的核苷酸多态性尽管这目前尚不知这两组不同的新型冠状病毒是动物传给人类之前或之后进化形成的,但这两组新型冠状病毒都能够在疫情早期在武汉的样本中检测到,之后不同的基因型的新型冠状病毒又在其他地区被分别获同时检测到。通过结合新型冠状病毒后代中额外的可遗传突变与患者样本收集的时间和地点,我们可以追踪可能的病毒传播途径。
值得一提的是,BioArt今日推出的另一篇文章《莫被误导!准确理解SARS-CoV-2可能分为两种类型》也支持当前病毒分为两个类型的结论,同样表明两个类型在病毒爆发的早期共存。
新型冠状病毒作为β冠状病毒的成员,与蝙蝠SARS病毒、人SARS病毒、MERS病毒的基因组结构相似,核苷酸同源性分别超过88%、79%、和约50%。它最接近的亲缘体是2013年从中国云南省蝙蝠中分离的β冠状病毒RaTG13,它在30kb的基因组中拥有96%以上的相同核苷酸。我们的进化时钟分析估计,新型冠状病毒分别在12年和30年前从RaTG13和人类SARS冠状病毒中分离出来。除了点突变,还有一个潜在的证据表明重组是新型冠状病毒进化的机制。我们发现除了棘突蛋白的受体结合区更接近于广东17年分离的穿山甲冠状病毒外,新型冠状病毒与RaTG13在整个基因组中具有高度的同源性。基于这些发现,我们假设在新型冠状病毒的进化过程中,RaTG13和穿山甲冠状病毒株之间可能发生棘突蛋白RBD重组。
蝙蝠被认为是新型冠状病毒的原始宿主,但它在传播给人类之前的中间宿主尚不清楚,而果子狸和骆驼分别被广泛认为是人类SARS病毒和MERS病毒的中间宿主。已知人类SARS病毒使用ACE2,而MERS使用DPP4作为受体感染宿主细胞。最近的研究表明ACE2是新型冠状病毒的进入受体,尽管其他宿主细胞因子如TMPRSS2也可能涉及(Cell | 蛋白酶抑制剂可有效抑制SARS-CoV-2感染)。当我们使用受体结合基序进行系统发育分析时,我们可以将新型冠状病毒、人类和蝙蝠SARS分离成两个不同的分支。值得注意的是,所有已知使用ACE2作为进入受体的病毒都在分支Ⅰ中,而所有不使用ACE2进入受体的蝙蝠SARS病毒都属于分支Ⅱ。因此,我们预测分支Ⅰ冠状病毒(包括新型冠状病毒可以通过ACE2感染宿主细胞,而分支Ⅱ冠状不能通过ACE2感染宿主细胞。根据现有的基因组序列,分支Ⅱ蝙蝠冠状病毒(超过49个染色点)比分支Ⅰ蝙蝠冠状病毒(大约12个毒株)多。一些分支蝙蝠冠状病毒如ZXC21和ZC45与新型冠状病毒的同源性高于分支Ⅰ蝙蝠冠状病毒和人类SARS病毒。同源β冠状病毒是否能通过RBM组来改变嗜性将是一个值得探讨的问题。
我们还发现了一个独特的由4个氨基酸(PRRA)组成的在棘突蛋白的S1和S2结构域之间的插入,这可能是一个furin裂解位点。已有研究表明,冠状病毒可能通过furin介导的蛋白酶裂解来触发病毒细胞膜融合。这种启动和触发融合机制的灵活性极大地调节了不同冠状病毒的致病性和倾向性。然而,在SARS冠状病毒中还没有发现这种furin介导的蛋白酶裂解。在SARS冠状病毒中引入一个furin裂解位点,将导致了荆棘蛋白的裂解,从而会增强该病毒的膜融合活性。此外,在SARS冠状病毒模型中引入一个被切割的荆棘蛋白,它可以直接进入宿主细胞。根据先前的测序和结构分析,新型冠状病毒荆棘蛋白被认为是与ACE2受体相互作用并触发与宿主细胞膜的融合并引发感染。因此,改变S1-S2亚单位的突变或插入删除会显著影响病毒感染。我们假设PRRA的插入可能使荆棘蛋白进入furin过程,从而触发病毒融合事件。
尽管造成如此高感染率的确切机制仍有待进一步研究,我们关于RBD重组和荆棘蛋白S1和S2结构域之间独特的furin裂解位点插入的数据可能解释了为什么与相关的β冠状病毒(包括SARS和MERS)相比,这种新出现的病毒的传播显著增加。进一步追踪从不同时间点不同地点的患者身上分离的新型冠状病毒的基因组突变,将有助于了解这种快速传播病毒的分子进化规律。更重要的是,比较新型冠状病毒和其他β冠状病毒的蛋白质序列和结构差异,将为迅速制定新的策略来治疗或预防与新出现的感染性病毒相关的疾病提供了参照。
新冠病毒专题报道:

medRxiv预印本丨双嘧达莫对具有凝血功能异常的COVID-19患者的治疗作用

原文链接:
https://www.biorxiv.org/content/10.1101/2020.02.29.971101v1
继续阅读
阅读原文