不可思议的病毒多样性
病毒有各种形状和大小,如巨大的拟态病毒(mimivirus,右上)和月球着陆器形状的噬菌体(bacteriophage,中间)。
在病毒学家看来,病毒无处不在,而且它们并非都是有害的。科学家们正在开始对地球上的数十亿病毒以及它们对全球生态系统的贡献进行识别和分类。
Mya Breitbart在非洲白蚁堆、南极海豹和红海的水中获得了新型病毒。但是,要想获得成功,她只需走进她在佛罗里达州的后花园就可以了。在她的游泳池周围挂满了多刺圆蛛(Gasteracantha cancriformics)——一种引人注目的蜘蛛,它们有着圆鼓鼓的白色球状身体,黑色的斑点和6个猩红的尖刺,它们看起来就像是一件中世纪的武器装备。对于位于圣彼得堡的南佛罗里达大学(University of South Florida)的病毒生态学家布Breitbart来说,更引人注目的是蜘蛛体内的东西。当Breitbart等人收集了一些蜘蛛并把它们磨碎后,他们发现了两种以前不为科学界所知的病毒
尽管自2020年初以来,人类一直在关注一种特别令人讨厌的病毒,但还有大量其它的病毒等待我们去发现。科学家们估计,在任何时间,仅海洋中就有大约1031个独立的病毒颗粒——是已知宇宙中估计恒星数量的100亿倍。
越来越清晰的是,生态系统和生物体都依赖于病毒。数百万年来,体型微小但功能强大的病毒通过在宿主之间传递基因来推动进化。在海洋中,它们将微生物切开,并将其内容物洒入海中,使食物网充满营养。加拿大温哥华的不列颠哥伦比亚大学(University of British Columbia)的病毒学家Curtis Suttle表示,没有病毒,我们就无法存活。
国际病毒分类委员会(International Committee on Taxonomy of Viruses, ICTV)列出的被命名的病毒只有9110个,但这显然只是总数中一个极小的部分。部分原因是,对病毒进行正式分类曾经需要科学家在其宿主或宿主细胞中培养病毒,这是一个耗时甚至不可能的过程。还因为搜索方向一直偏向于导致人类或我们关心的生物体(如农场动物和作物植物)疾病的病毒。然而,正如COVID-19大流行提醒我们的那样,了解可能从一个宿主跳跃到另一个宿主,威胁我们自身、我们的动物或作物的病毒也是非常重要的。
在过去的十年里,由于发现病毒的技术的进步,加上最近对识别新病毒的规定进行了修改,允许在不培养病毒和宿主的情况下进行命名,已知和命名的病毒数量已经爆炸性增长。最有影响力的技术之一是宏基因组学(metagenomics),它使研究人员能够对环境中的基因组进行采样,而无需培养单个病毒。较新的技术,如单病毒测序(single-virus sequencing),正在将更多的病毒添加到列表中,其中包括一些非常常见但直到现在仍然隐藏的病毒。Breitbart认为,现在是进行此类研究的令人兴奋的时刻。她还认为,在许多方面,现在是宏病毒组的时代。
仅在2020年,ICTV的正式名单上就增加了1044种病毒,还有成千上万的病毒等待描述和命名。基因组数量的激增促使病毒学家开始重新思考他们对病毒进行分类的方式并帮助阐明它们的进化。有强有力的证据表明,病毒是多次出现的,而不是从一个单一的源头萌生。
即便如此,马里兰州德特里克堡的美国国家过敏和传染病研究所(US National Institute of Allergy and Infectious Diseases)的病毒学家Jens Kuhn表示,病毒世界的真正范围大部分仍然是未知的,我们真的完全不知道那里有什么。
这里、那里以及任何地方
所有的病毒都有两个共同点:每个病毒都将其基因组包裹在一个基于蛋白质的外壳中;每个病毒都依赖其宿主(无论是人、蜘蛛还是植物)来进行自我繁殖。但在这一般模式之外,还有无尽的变化。
有只携带两三个基因的微小循环病毒,也有比一些细菌还大、携带数百个基因的巨大拟态病毒。有看起来像月球登陆器的会感染细菌的噬菌体。当然,还有世界现在非常熟悉的杀手——COVID-19。有的病毒将其基因储存为DNA,有的则使用RNA。甚至还有一种噬菌体使用另一种遗传字母表,用不同的分子替换标准ACGT系统中的化学碱基A,命名为Z。
病毒无处不在,即使科学家不寻找它们,它们也会自己出现。Frederik Schulz在仔细研究废水中的基因组序列时,并没有打算研究病毒。2015年,作为维也纳大学(University of Vienna)的一名研究生,他正在使用宏基因组学来寻找细菌。这涉及到从整个生物体混合物中分离出DNA,将其切成碎片并对所有碎片进行测序。然后,一个计算机程序将这些片段组装成单独的基因组,这就像解决数百个碎片被打乱的拼图。
在细菌基因组中,Schulz不自觉地注意到一个巨大的病毒基因组(很明显,因为它带有病毒外壳的基因)有157万个碱基对,非常引人注目。事实证明,这是一种巨型病毒,属于一个在基因组大小和绝对尺寸方面都很大的群体(通常直径为200纳米或更大)。这些病毒感染变形虫、藻类和其它原生动物,使它们能够影响水生和陆生生态系统。
Schulz现在是加州伯克利美国能源部联合基因组研究所(US Department of Energy Joint Genome Institute)的微生物学家,决定在宏基因组数据集中搜索相关病毒。2020年,在一篇论文中,Schulz等人描述了来自包含巨型病毒群体的2000多个病毒基因组。在此之前,只有205个这样的基因组被存放在于公共数据库中。
病毒学家们也已经开始向内寻找新物种。病毒生物信息学家Luis Camarillo-Guerrero与英国辛克斯顿的维康基金桑格研究所(Wellcome Sanger Institute)的同事合作,分析了来自人类肠道的宏基因组,并建立了一个包含超过14万种噬菌体的数据库。其中一半以上是科学界的新物种。他们的研究于2月发表,与其他人的发现相吻合,即感染我们肠道中细菌的最常见病毒之一是一个被称为crAssphage(以2014年发现它的交叉装配软件命名)的群体。现在在英国剑桥的DNA测序公司Illumina工作的Camarillo-Guerrero表示,尽管它的数量众多,但关于它如何为我们肠道的微生物组做出贡献的信息仍知之甚少。
尽管宏基因组学发现了大量的病毒,但它也忽略了许多病毒。RNA病毒在典型的宏基因组中没有被测序,因此爱尔兰科克大学学院(University College Cork)的微生物学家Colin Hill等人在RNA的数据库中寻找它们,称为宏转录本(metatranscriptomes)。科学家们通常使用这些数据来了解一个群体中正在活跃转化为信使RNA以制造蛋白质的基因,RNA病毒基因组也可以显示出来。使用计算技术从数据中提取序列,该团队在来自污泥和水样的宏转录本中发现了1015个病毒基因组。同样,他们用一篇论文大大增加了已知病毒的数量。
尽管这些技术有可能意外地组装出不真实的基因组,但研究人员有质量控制技术来防止这种情况发生。但这也存在其他盲点。例如,那些成员非常多样化的病毒物种很难被发现,因为计算机程序很难将不同的序列拼凑在一起。
另一种方法是一次对一个病毒基因组进行测序,正如微生物学家Manuel Martinez-Garcia在西班牙阿利坎特大学(University of Alicante)所做的那样。他决定通过将海水滴入分选机器从而尝试分离出单个病毒,扩增它们的DNA,然后进行测序。
在他的第一次尝试中,他发现了44个基因组。其中一个基因组代表了海洋中最丰富的一些病毒。这种病毒是如此的多样化,它的基因拼图从一个病毒颗粒到另一个颗粒是如此的不同,以至于它的基因组从未出现在宏基因组学研究中。研究小组称其为37-F6,因为它位于原始的实验室培养皿上,但Martinez-Garcia开玩笑称,鉴于它能够隐藏在显眼的地方,它应该以虚构的超级间谍James Bond的名字命名为007。
病毒族谱
海洋病毒中的James Bond缺乏一个正式的拉丁种名,过去十年中通过宏基因组学发现的数千个病毒基因组中的大多数也是如此。这些序列给ICTV提出了一个难题:一个基因组是否足以命名一种病毒?直到2016年为止,向ICTV提出一个新的病毒或分类系统需要科学家们培养该病毒及其宿主,只有极少数例外。但在那一年,经过一场有争议但友好的辩论,病毒学家们一致认为,一个基因组就足以对其进行命名。
关于新病毒和新病毒群的建议蜂拥而至。但是这些病毒之间的进化关系往往并不清楚。病毒学家通常根据病毒的形状(比如说长而细,或者有头有尾)或基因组(DNA或RNA,单链或双链)对其进行分类。但令人惊讶的是,这对共同的祖先描述得极少。例如,具有双链DNA基因组的病毒似乎至少在四个不同的分类中出现过。
最初的ICTV病毒分类,完全独立于细胞生命谱,只包括进化等级的低层,从种(species)和属(genus)到目(order,相当于多细胞生命分类中的灵长类或带锥体的树木),并没有更高的级别。许多病毒科(viral families)独自游荡,与其它类型的病毒没有联系。因此,在2018年,ICTV增加了更高的等级:类(classes)、门(phyla)和界(kingdoms)。
在最顶端,ICTV发明了“域”(realms),旨在作为细胞生命的“域”的对应物(细菌、古细菌和真核生物),但用不同的词来区分这两种族系。(几年前,一些科学家建议,某些病毒可能适合基于细胞的进化谱系,但这个想法没有获得广泛的支持)。
ICTV概述了这个谱系的分支,并将基于RNA的病毒归入一个称为核糖病毒域(Riboviria)的病毒域。SARS-CoV-2和其它具有单链RNA基因组的冠状病毒是这个病毒域的一部分。但随后就由更广泛的病毒学家群体来提出进一步的分类系统。事实上,马里兰州贝塞斯达国家生物技术信息中心(National Center for Biotechnology Information)的进化生物学家Eugene Koonin已经组建了一个团队,分析所有的病毒基因组以及关于病毒蛋白的最新研究,以创建分类学初稿。
他们重组了核糖病毒域,并提议增加三个域。Koonin表示,在细节上有一些争论,但分类法在2020年被ICTV成员批准,没有什么纷争。另外两个域在2021年获得了批准,但最初的四个域可能仍然是最大的域。最终,Koonin推测,这些域的数量可能多达25个。
这个数字支持了许多科学家的猜测,即各类病毒没有一个共同的祖先。Koonin表示,所有的病毒都没有单一的起源,这根本不存在。这意味着病毒可能在地球上的生命史上出现过几次,而且没有理由认为这种情况不会再次发生。巴黎巴斯德研究所(Pasteur Institute)的病毒学家Mart Krupovic认为,新病毒的新起源仍在进行中,他参与了ICTV的决策和Koonin的分类学团队。
至于这些域是如何产生的,病毒学家有几个猜想。也许它们是在地球上的生命诞生之初,在细胞还没有形成之前,从独立的遗传元素中产生。也许它们是从整个细胞中逃脱或“转移”的,为了极简的生活方式而放弃了大部分细胞机制。Koonin和Krupovic支持一种混合假设,即那些原始遗传元件从细胞生命中窃取基因来构建它们的病毒颗粒。Kuhn表示,因为病毒有多种起源,所以它们有可能有多种起源方式,他也是ICTV委员会的成员,并参与了新分类法的提案。
因此,尽管病毒和细胞的生命谱系是不同的,但两者的分支是相通的,基因在二者之间传递。病毒是否算作“生命”,取决于个人对生命的定义。许多研究人员不认为它们是生物,但其他人不同意。日本京都大学(Kyoto University)研究病毒的生物信息学家Hiroyuki Ogata表示,他倾向于相信它们是活的。它们正在进化,它们有由DNA和RNA组成的遗传物质,而且它们在所有生命的进化中非常重要。
目前的分类被广泛认为只是第一次尝试,一些病毒学家认为这是一个有点混乱的问题。有几十个病毒家族仍然缺乏与任何域的联系。Martinez-Garcia表示,较好的一点是,他们正试图在这种混乱中建立一些秩序。
病毒域:与基于细胞的生命形式不同,病毒没有一个共同的祖先,这使得它无法创建一个种系发生谱。相反,截至2021年,国际病毒分类委员会(ICTV)确认了6个病毒域,根据其成员的基因和蛋白质的相似性来定义,每个域都来源于一个不同的共有祖先。
改变世界的病毒
由于地球上的病毒总量相当于7500万头蓝鲸的数量,科学家们确信它们对食物网、生态系统甚至地球的大气层产生了影响。哥伦布市俄亥俄州立大学(Ohio State University)的环境病毒学家Matthew Sullivan表示,新病毒的加速发现“成为了病毒直接影响生态系统的新方式的转折点”。但科学家们仍在努力量化它们的影响程度。
Ogata表示,目前没有一个非常简单的构思。在海洋中,病毒可以从它们的微生物宿主中迸发出来,释放出的碳被其它的病毒循环利用,这些病毒吃掉宿主的内脏,然后产生二氧化碳。但是,最近,科学家们也开始认识到,破裂的宿主细胞经常聚集在一起,沉入海底,将碳从大气中隔离。
Sullivan表示,在陆地上,解冻的永冻土层是碳的主要来源,而病毒似乎对该环境中微生物的碳释放起了作用。2018年,Sullivan等人描述了从瑞典解冻的永冻土层中收集的1907个病毒基因组和片段,包括编码可能影响碳化合物分解(可能成为温室气体)的病毒蛋白质基因。
病毒还可以通过扰动其它生物的基因组来影响它们。例如,当病毒将抗生素抗性基因从一个细菌转移到另一个细菌时,抗药性菌株就会延续。Camarillo-Guerrero表示,随着时间的推移,这种转移可以在一个群体中产生重大的进化转变。而且不仅仅是在细菌中,人类DNA中有8%估计是来自于病毒的。例如,我们的哺乳动物祖先从病毒中获得了一个对胎盘发育至关重要的基因。
对于许多有关病毒生活方式的问题,科学家需要的不仅仅是基因组。他们将需要找到病毒的宿主。病毒本身可能携带线索:例如,它可能在自己的基因组中携带可识别的宿主遗传物质。
Martinez-Garcia等人使用单细胞基因组学来确定含有新发现的37-F6病毒的微生物。宿主也是海洋中最丰富和多样化的生物之一,一种被称为远洋杆菌属(Pelagibacter)的细菌。在一些水域中,远洋杆菌属占据了一半的细胞。Martinez-Garcia表示,如果仅仅是这种类型的病毒突然消失,海洋生物就会失去平衡。
位于德国的基尔亥姆霍兹海洋研究中心(GEOMAR Helmholtz Centre for Ocean Research)的进化生态学家Alexandra Worden表示,为了了解一种病毒的全部影响,科学家需要弄清楚它如何改变其宿主。她正在研究携带有称为“角蛋白”(rhodopsins)的光收集蛋白基因的巨型病毒。理论上,这些基因可能对宿主有用(用于能量转移或信号传递等目的),但这些序列不能证实这一点。为了弄清这些角蛋白基因的情况,Worden计划将宿主和病毒培养在一起,并研究这对宿主和病毒在结合的“病毒-细胞"状态下如何运作。Worden表示,细胞生物学是能阐明出真正作用(角蛋白基因究竟是如何影响碳循环的)的唯一方法。
在佛罗里达州,Breitbart还没有培养出她的蜘蛛病毒,但她已经了解了一些关于它们的情况。这种病毒属于被Breitbart称之为不可思议的一类,因为它们的基因组很小,呈圆形,只为其蛋白衣壳编码一个基因,为其复制蛋白编码一个基因。其中一种病毒只存在于蜘蛛的身体里,从未在它的腿中被发现,所以Breitbart认为这种病毒实际上感染的是蜘蛛吃的某种生物。蜘蛛的全身布满了另一种病毒,并且它的卵和幼蛛中都有发现,所以她认为这种病毒是由父母传递给后代的。据Breitbart所知,病毒似乎并没有对蜘蛛造成任何伤害。
Breitbart表示,对于病毒,找到它们实际上是容易的部分。区分病毒如何影响宿主的生命周期和生态则要棘手得多。但首先,病毒学家必须要回答一个最棘手的问题,即如何选择要研究的问题?
对多刺圆蛛的研究发现了两种科学界以前未知的病毒。
原文检索:
Amber Dance. (2021) The incredible diversity of viruses. Nature, 595: 22-25.
郭庭玥/编译