新冠病毒进化一直是学术研究的热点问题,大流行结束后有关病毒进化对疫情影响的讨论仍方兴未艾。在此,翻译学习一篇综述,题目为《The evolution of SARS-CoV-2》,发表于2023年6月的《Nature Reviews Microbioloy》;第一作者Perter V. Markov,单位为欧盟委员会联合研究中心(European Commission, Joint Research Centre)和伦敦大学卫生与热带医学学院;通讯作者Aris Katzourakis,单位为英国牛津大学生物系。该综述侧重以分子流行病学角度来回顾和分析新冠病毒的进化历程及特征,内容丰富详实。本公众号将分几期分享该文。欢迎各位公卫、科研小伙伴进行交流,如有错误之处敬请指正。括号中的字号较小的橙色语句和最后一段概括为本公众号译者的理解,仅供参考。
1、突变率(mutation rate):复制保真度和宿主介导的基因组编辑
病毒进化速度的一个关键决定因素是它的突变率。突变率是病毒在每一次复制周期中发生基因改变的固有速率,它是由病毒聚合酶的复制保真度所决定的一种生化属性。基因改变是自然选择作用的“原材料”。其实,大多数突变/变异都是有害的,携带这些有害突变的病毒体是无法复制的。据估算,新冠病毒的突变率为每个复制周期每个核苷酸发生1×10-6至2×10−5次突变,这与之前对其它β冠状病毒的估计值相一致,但低于其它RNA病毒突变率所处的代表性范围,例如HCV(每个复制周期每个核苷酸发生10-5至10−6次突变)和HIV(每个复制周期每个核苷酸发生10-4至10−6次突变),这两种病毒与冠状病毒不同,病毒复制时缺少3'外切酶校正机制(因此突变率高于新冠病毒)。此外,复制错误导致的插入和缺失也可以使新冠病毒产生多样性,例如S基因69~70位的删除,使S基因发生缺失突变,这一特点有助于检测Alpha变异株。据报道,该缺失突变可能与(Alpha变异株)感染性增加有关。
除了RNA病毒复制错误,细胞天然防御机制通过宿主介导的病毒基因组编辑作用可能会在新冠病毒基因组中引入大量的定向突变,进而可能影响新冠病毒的进化(evolutionary rate)。细胞的突变驱动因子包括“载脂蛋白B mRNA编辑酶催化多肽家族”(the apolipoprotein B mRNA editing enzyme, catalytic polypeptide-like family,简称APOBEC)的成员们,例如APOBEC1、APOBEC3A和APOBEC3G,它们对许多DNA病毒、RNA病毒和逆转录病毒均具有编辑活性,新冠病毒也被包括在内。通过生物信息学研究可观察到(新冠病毒基因组上发生)大规模过量的C→U转换,远多于其它突变类型。此外,新冠病毒基因组也可能会被不同的细胞抗病毒蛋白所编辑,如“RNA特异性腺苷脱氨酶1”(adenosine deaminases that act on RNA 1,简称ADAR1),该酶可以造成A→G的转换(在病毒基因组负链上则是U→C转换)。
新冠病毒基因组序列中潜在的与编辑有关的C→U突变使新冠病毒进化基因组学分析变得更加复杂。C→U突变在一定程度上可以解释新冠病毒基因组中非同义突变替换率(dN)与同义突变替换率(dS)的比例(dN/dS)明显较高这一情况;(新冠病毒的)平均dN/dS比介于0.7~0.8,其衡量的是“平均每个非同义突变位点上发生的非同义突变数”(dN)与“平均每个同义突变位点上发生的同义突变数”(dS)的比率(比值)。这些突变可能是病毒抗原或表型变化的有力驱动因素。此外,C→U突变可能更易发生在具有特定RNA结构和碱基背景的突变“热点”处。“C→U转换”和“选择性回复突变(U→C)”二者间的重复循环可能产生大量的同质化位点(homoplasic sites),因此,遗传背景不同的毒株会表现出趋同进化。
虽然经常会混淆,但替代率(substitution rate,也称为分子进化率)与突变率(mutation rate)其实是两个不同的概念。替代率衡量的是病毒进化过程中突变积累的速度。高替代率意味着病毒在单位时间内会产生并积累数量较多的突变。对于RNA病毒,一般采用系统发育方法来估算替代率。其实际上是通过采用系统发育学统计方法,结合时间跨度信息以及不同时间点被采样病毒序列中突变数量的差异来估算替代率。需要强调的是,只有种群中频率高到可被检测出来的突变才能被用来估算进化速率。在新冠大流行初期,估算新冠病毒替代率的一个重要障碍是病毒进化改变(如突变)积累的数量有限(进化时间跨度太短,病毒产生并积累的突变数量太少),不足以做出可靠的估计。据估算,在VOC株出现前的疫情阶段,新冠病毒(基因组)每月仅发生不到2次进化上的改变(点突变、插入或缺失突变)(即2×10-6/位点/天)。
重组是另一种加速病毒适应性的机制,它将来自不同遗传背景的突变组合在一起,产生杂交变异株。重组是β冠状病毒进化的一个常见特征,在新冠病毒和其它sarbecoviruses(β冠状病毒属的一个亚属)病毒中均能检测到重组现象。如果病毒发生重组且随后可被检测出来,那么宿主必须同时感染两种遗传背景不同的病毒(鉴定同一谱系毒株间的重组非常困难);重组发生后,产生的(杂交病毒)后代必须是能存活的并且可继续传播给其它宿主。自新冠病毒出现以来,其遗传分化程度越来越高,使得多个不同谱系毒株可在同一地区内共同流行,从而为病毒重组提供了条件。
XA谱系是第一个被报道的谱系间重组的新冠毒株,XA毒株最早在英国被检测到。日本的一些新冠感染病例中还发现了VOC毒株(Alpha和Delta)重组的初步证据。之后又有研究显示,B.1.631和B1.634重组毒株(Pango命名系统将该重组毒株命名为XB谱系)在北美有较广泛的流行;而更晚的研究报道了XD、XF和XE重组毒株,XD和XF是Dealta株和BA.1间的重组,XE则是BA.1和BA.2间的重组。最近,几个其它的Omicron重组株也被鉴定出来。
概括:新冠病毒进化速度,首先是由其内在的生化“特性”所决定的,即新冠病毒的复制酶具有3'-外切酶的校正功能,这使得新冠病毒“先天”的比其它RNA病毒进化得慢。另外,受宿主细胞天然免疫作用,一些具有编辑作用的细胞蛋白会使病毒基因组发生定向突变(例如C→U),进而影响到病毒的进化速度。新冠病毒进化过程中不断“分化”出新的谱系,不同谱系间可发生重组。重组相较于点突变或局部插入/缺失突变,可以加速病毒进化。
其实还有一个影响新冠病毒进化速度的“内在”因素文中没有提到(当年毕业答辩时,有评委专家讲到),那就是病毒复制周期用时长短。新冠病毒完成一个复制周期的用时要比一些病毒长(如流感病毒),理论上相同时间内复制代数要比其它病毒少。另外重组虽然可以加速病毒进化,但并非所有的重组谱系都更“进化”,大部分重组谱系产生后很快就被湮没,只有个别重组谱系(如XBB)才会成为值得重视的VUM、VOI或VOC。
补充:综述讲到了多个新冠病毒的重组谱系,在此延伸介绍一下Pango lineage对重组毒株的命名规则:
1、重组毒株的谱系以“X”为前缀。
2、按照发现顺序,前缀的使用顺序为XA,XB,XC…,XAA,XAB…,XBA等等。
3、重组谱系的名字不含有其亲本谱系信息。
4、重组谱系的非重组子代谱系,需要加上后缀,如XA.1.1,XA.1.2等。
5、当达到最大后缀层级时,采用一般的字母混合命名方式,如XA.1.1.1.1会改写成AJ(如果AJ是即将启用的字母混合方式)。