自2019年12月新型冠状病毒肺炎(COVID-19)在武汉爆发以来,确定病毒发源地对于寻找病毒来源、确定中间宿主,以及控制疫情和避免病毒再次爆发具有至关重要的意义。1月27日,Science杂志曾在线发表一篇新闻,报道有研究人员推测新型冠状病毒可能并非源自华南海鲜市场,理由是最初的一个病例在12月1日患病,但与华南海鲜市场无关。此后,对于新冠病毒的最原始来源,各界一直争议不断。
如今,此前推测得到了我国科学家的最新研究成果所证实。2月20日,中国科学院西双版纳热带植物园官方网站发布消息,该园联合华南农业大学和北京脑科中心的科研人员一起收集了全世界各领域共享到GISAID EpiFlu数据库中覆盖了四大洲12个国家的93个新型冠状病毒样本的基因组数据(截止2月12日),通过全基因组数据解析发现:华南海鲜市场的新型冠状病毒是从其他地区传入进来,在市场中发生快速传播蔓延到市场之外。研究中还指出,根据新型冠状病毒基因组数据推算1月之前的种群扩张发生时间是12月8日,该结果暗示病毒可能在12月初,甚至11月下旬即已经开始有人际传播,随后在华南海鲜市场加快了人际传播。
据悉,相关研究结果已提交到中国科学院科技论文预发布平台,可供疾控防疫相关部门参考,并接受专家学者的交流和讨论。(http://www.chinaxiv.org/abs/202002.00033)
基于120个变异位点得到58种单倍型(基因类型),单倍型演化关系显示,单倍型H13和H38是比较“古老的”单倍型,通过一个中间载体(mv1,可能为一个来自中间宿主或者“零号病人”的祖先单倍型)与蝙蝠冠状病毒RaTG13关联,并通过单倍型H3衍生出了单倍型H1。与华南海鲜市场有关联的患者样品单倍型都是H1及其衍生的单倍型H2,H8-H12(图1,A),而一份武汉样品单倍型H3与华南海鲜市场无关。可见,华南海鲜市场的新型冠状病毒是从其他地方传入进来,在市场中发生快速传播蔓延到市场之外。另外,根据病患发病时间记录和种群扩张时间推断,也印证了华南海鲜市场不是病毒发源地的推论。
对“古老的”单倍型H13和H38的病毒样品溯源发现分别是来自深圳的病患(广东首例)和美国华盛顿州的病患(美国首例)。他们的旅行记录表明应该都是2019年12月底至2020年1月初在武汉探亲期间被感染的。现有武汉样本中没有检测到H13和H38单倍型,可能是因为现有样品主要采自几家定点医院,而且样品采集时间局限于2019年12月24日和2020年1月5日。如果能在武汉其他医院早期的病患检测到这两种单倍型,将对于寻找病毒来源非常有帮助。
图1. 新型冠状病毒58种单倍型的演化关系和地理分布格局(A,B),单倍型之间的可能演化关系(C),以及新型冠状病毒的可能传播和扩散路线(D)。A和B圆圈中的数据是样本数量。
图2. 新型冠状病毒单倍型的样品采集时间情况。红色圈的样品是确认与华南海鲜市场有关;蓝色圈的样本确认与海鲜市场无关。
根据新型冠状病毒基因组数据推算1月之前的种群扩张发生时间是12月8日,该结果暗示病毒可能在12月初,甚至11月下旬即已经开始有人际传播,随后在华南海鲜市场加快了人际传播(图2)。研究推算2月份之前的种群扩张时间在1月6日,这个可能与元旦假期有关联。需要指出,这一天国家疾控中心发布了2级应急响应。当时的预警起到了一些警示作用,公众活动和出行都有所减少。如果当时的警示能引起大众更广泛的重视,那么1月份中下旬向全国和全球蔓延的病例会有所降低。研究人员进一步确认我国其他9个省区和其他11个国家的感染病例基本都是从武汉直接或者间接输入而来。
为了能够细分来源,研究人员将58种单倍型分成了五组(图1),采用标准是3个中心(古老超级传播者)单倍型(H1,H3和H13)和2个新的超级传播者单倍型(H56和mv2)。以此鉴别出广东的病毒可能有三个来源,重庆和台湾的病毒有两个来源。其中,广东深圳一家人在早期就通过人传人进行了传播。有较多样本的澳大利亚、法国、日本和美国,他们的患者感染源至少有两个,尤其是美国包括了五个来源。非常值得关注的是H56这个超级传播者单倍型,它同时是澳大利亚、法国和美国,以及我国台湾患者的传染源。其他国家患者因为样品比较少,大多数的来源比较单一,他们除了是武汉旅游输入或在武汉感染外,有一些人可能是在广东、新加坡等地被感染。
研究人员发现新型冠状病毒基因组没有发生重组事件,93个基因组之间有120核苷酸发生了突变(0.41%序列长度),并均匀分散在10个编码区(χ2=1.958, df=9, P=0.99)。120个突变的核苷酸关联了119个氨基酸密码子,其中79个密码子 (65.83%)改变了氨基酸类型,并有42个(53.17%)氨基酸理化性质都被改变(图3)。这些氨基酸类型以及理化性质改变是否会影响新型冠状病毒的活性暂不清楚,需要其他蛋白组学和结构生物学方面的专业人士进行验证。该研究是版纳植物园综合保护中心生物多样性研究组的科研人员利用其在系统与演化领域的专长开展的,该研究提到单倍型演化关系分析方法可以结合到传染病学研究中,对于寻找传染源,以及精确的传播和扩散方向能提供非常重要的信息。
图3. 120个变异位点在8个编码区的分布情况。统计类型包括替换或替代(左上角),密码子位置1-3(右上角),同义突变或非同义突变(左下角),和氨基酸性质(右下角)。
参考资料:
1. 中国科学院西双版纳热带植物园:版纳植物园基于全基因组数据解析新型冠状病毒的演化和传播
http://www.chinaxiv.org/abs/202002.00033
本文由 SEQ.CN 作者:白云 发表,转载请注明来源!