肠道微生物组在人体健康方面起着重要的作用。其中,生命早期的人类肠道微生物群在肠道微生物组的成熟、免疫系统和生命早期和晚期健康中发挥着至关重要的作用。在肠道微生物群中,除了已进行深入研究的细菌组外,还有大量的病毒(称为“病毒组”),并与其他微生物群落发生相互作用。进一步研究肠道病毒组,有助于全面解读人类肠道微生物组内错综复杂的互利关系及其对健康和疾病的影响。
近期研究通过生成全面的病毒基因组数据库,如肠道病毒组数据库(GVD)、肠道噬菌体数据库(GPD)、宏基因组肠道病毒(MGV)目录和Cenote人类病毒组数据库(CHVD),使用大规模批量宏基因组或病毒样颗粒(VLPs)富集宏基因组测序,改善了该研究团队对肠道病毒组成的理解。但这些数据库主要是通过成人粪便宏基因组重建,导致早期生命病毒序列的代表性不足,限制了它们在生命早期人类肠道病毒组研究中的应用。
近日,四川大学华西第二医院王少璞、母得志、牛晓宇团队及合作者建立了生命早期人类肠道病毒组目录ELGV,包含160,478个非冗余DNA和RNA病毒序列。研究团队利用ELGV共鉴定出82141种病毒,其中68.3%的病毒在现有的主要来自成人的数据库中是缺失的,其中基于VLPs富集的64种病毒和基于批量宏基因组的8种病毒分别显示区分婴儿和成人的生物标志物潜力。此外,研究团队跟踪了生命早期人类肠道病毒组的固有不稳定性和时间发育,确定了与多个临床因素相关的差异病毒。ELGV目录提供了生命早期人类肠道病毒组最全面和完整的宏基因组图谱,有助于未来儿科疾病-病毒组的关联研究。该研究结果已发表Nature Communications 上,文章题为“A metagenomic catalog of the early-life human gut virome”。
文章发表在Nature Communications上
为了全面地表征生命早期人类肠道病毒组,研究团队分析了来自3岁以下婴儿的8130个公共粪便宏基因组,包括1865个VLPs富集和6265个批量宏基因组,跨越了35项研究,收集了多个已经充分记录的临床因素,这些因素已知会影响生命早期人类肠道细菌组的组成,包括分娩方式、出生时胎龄和采样时的喂养方式(图1a)。经不同算法识别以及数据质量检验和过滤,获得了160,498个DNA和RNA病毒序列。
研究人员通过对该目录的病毒操作分类单位(vOTUs)估计分析产生了82,152个vOTUs。将可能代表污染物或错误分类的vOTUs及其病毒序列删除后,得到82,141个vOTUs,包含160,478个病毒序列,该目录称为ELGV(图1b)。其中,27.0%的vOTU代表来自VLPs富集的宏基因组,13.1%的vOTU代表根据MIUViG质量等级被归类为高质量(图1c)。vOTU代表的中位数长度为8281bp,长度>10 kbp的vOTU代表有36,059个。
此外,vOTU的分类共注释了46个病毒家族,覆盖52,224个vOTU,包含119,126个病毒序列,其余未进行家族注释的vOTU(36.4%)突出了当前生命早期人类肠道病毒组分类的不完整性和知识缺口。
在ELGV目录中,99.6%为噬菌体,其余0.4%为真核病毒。大多数vOTU注释为Siphoviridae科,其次是Myoviridae、Peduoviridae、Podoviridae和Microviridae(图1d);检测到冠状病毒科、小核糖核酸病毒科和星状病毒科共3个RNA病毒科。该ELGV目录揭示了生命早期隐藏的大量病毒多样性,因为大多数ELGV目录不能分配到现有的病毒科和属。因此,ELGV可以促进未来对生命早期人类肠道微生物组的研究。
图1:早期人类肠道病毒组目录ELGV的重建和表征。
研究团队对生命早期人类肠道病毒组的多样性动态进行了检验,发现随着婴儿的年龄增长,早期肠道病毒组的总丰富度动态增加(图2a)。研究团队进一步确认了病毒组α多样性的增加与测序深度无关。随着婴儿年龄增长,婴儿肠道中温和病毒的比例下降,而溶菌病毒的比例增加,这些结果仅在完整和高质量的vOTU代表中观察到。
此外,随着婴儿年龄的增长,生命早期人类肠道病毒组发生了强烈的纵向转变(图2b)。无论是从VLPs富集还是批量宏基因组数据来看,个体内的相似性都比个体间的相似性更高,特别是在生命的第一年内(图2c)。值得注意的是,随着婴儿年龄的增长,个体间早期肠道病毒组的差异逐渐减少,这与肠道微生物组的其他组成一致,例如生命早期的细菌群落。
研究团队确定了82,141个vOTUs中18%的细菌宿主,最常见的门宿主是厚壁菌门,其次是放线菌门、拟杆菌门、变形菌门和疣微菌门(图3)。最常见的细菌家族宿主包括毛螺菌科、双歧杆菌科、韦荣氏菌科、梭菌科和拟杆菌科,这些都是从早期生命的6265个宏基因组中检测到的最丰富的细菌家族。
在属水平预测宿主的vOTUs中,绝大多数(91.1%)仅被一个属寄生,而其他vOTUs(8.9%)被预测为感染多个属。生命早期人类肠道细菌组与成年人不同,尤其是双歧杆菌属,其在婴儿中的相对丰度和普遍性更高。研究发现,大多数生命早期人类肠道vOTUs主要由双歧杆菌寄生。值得注意的是,有120个vOTUs被预测为由大肠埃希氏菌寄生,这是ELGG目录中基因组数量最多的物种。此外,肠道病毒组和细菌组的丰度在物种水平上显著相关(图3b)。
为了充分了解母婴病毒组的共同和独特特性,研究人员利用批量宏基因组分析了373对母婴粪便,并收集了已发表的26对母婴的VLPs富集宏基因组。对所有母体肠道宏基因组进行组装并预测病毒序列,得到83,543个符合条件的母体批量和VLPs富集宏基因组病毒序列。
基于VLPs富集的宏基因组,研究团队将656个合格的母婴病毒序列聚类成511个vOTUs。其中,199个和307个vOTUs分别为母亲和婴儿的病毒序列独特代表,只有5个vOTUs由母亲及其配对或未配对的婴儿共享(图4)。从未配对的母婴中排除仅含有病毒序列的vOTU后,有4个vOTUs被两对配对母婴共享,属于长尾噬菌体科和短尾噬菌体科。
除了基于组装的方法,研究团队还将来自母亲和婴儿的reads映射到ELGV,以计算每个vOTU代表的相对丰度。结果显示,母体的肠道病毒组与婴儿的肠道病毒组有所不同,但母亲和婴儿之间的平均丰度是可比较的。在基于reads的映射各种,只有两对配对母婴被发现共享vOTUs,其中一对(C047)在基于组装的分析中也观察到。
图4: 配对母婴共享病毒的状态。
与用于生成其他现有病毒数据库(即CHVD、GPD、GVD和MGV)的宏基因组相比,ELGV目录独有的宏基因组共有5068个(VLPs为1089个,批量为3979个)。
研究团队将ELGV与其他主要源自成人肠道的病毒数据库进行了聚类。经相同的标准过滤后进行比较,在95%ANI和85%较短序列的AF的条件下,获得的184,507个vOTUs中,来自ELGV目录的56,131个vOTUs(68.3%)与其他数据库中的任何病毒基因组都没有聚类。ELGV和其他数据库之间最大的vOTUs重叠出现在GPD中,其次是MGV。令人惊讶的是,所有数据库之间只有23个vOTUs是共享的,这表明每个数据库的特异性,但也可能归因于用于识别和过滤病毒序列的算法差异。
该研究建立了生命早期人类肠道病毒组目录ELGV,该目录包含160,478个专门针对生命早期人类的肠道病毒基因组序列,约涵盖82,141个物种、11,413个属和1238个家族水平的病毒,为了解生命早期人类肠道病毒组的组成和纵向演替以及塑造因素的影响提供了独特的视角,为更好地发现病毒和进一步研究揭示病毒与早期生命健康和疾病之间的隐藏关联提供了资源。
Zeng, S., Almeida, A., Li, S.et al. A metagenomic catalog of the early-life human gut virome. Nat Commun 15, 1864 (2024). https://doi.org/10.1038/s41467-024-45793-z
本文由 SEQ.CN 作者:白云 发表,转载请注明来源!