科研

首页 - 全部文章 - 科研 - Nature | 首次获得非人灵长类动物的性染色体完整序列,揭示不同物种Y染色体的显著差异

Nature | 首次获得非人灵长类动物的性染色体完整序列,揭示不同物种Y染色体的显著差异

动物的X和Y染色体被认为起源于大约1.7亿年前的一对常染色体。在雄性中,Y染色体通常以一个拷贝的形式存在,它获得了决定性别的基因SRY和其他雄性特有的基因和突变,这些基因和突变通过倒置来固定,从而阻止了Y和X染色体在其大部分长度上的重组。由于缺乏重组,Y染色体缩小并积累了有害突变和重复元件,导致Y和X染色体在大小和基因含量上存在差异。

虽然人类性染色体最近已完全测序,但人类的近亲——非人类灵长类动物的性染色体仍未完全表征。由于Y染色体的单倍体性质和高重复元件含量,以往的多数研究仅组装了雌性基因组,完全忽略了Y染色体。灵长类X染色体已经被解码到更高的连续性水平,但其组装——特别是长卫星阵列——仍未完成,阻碍了其完全表征。

近日,来自美国卫生国家基因组研究所的研究团队利用人类端粒到端粒(T2T)组装的实验和计算方法,成功构建了五种大猩猩(倭黑猩猩、黑猩猩、西部低地大猩猩、婆罗洲猩猩和苏门答腊猩猩)及一种小猩猩(暹罗长臂猿)的X和Y染色体的完整组装,并揭示了它们进化的复杂性。与X染色体相比,类人猿Y染色体的大小差异较大,由于谱系特异性扩增区、回文、转座元件和卫星序列的积累,Y染色体具有低对齐性和高水平的结构重排。许多Y染色体基因在多拷贝家族中扩增,部分基因在净化选择下进化。因此,Y染色体表现出动态进化,而X染色体更为稳定。该研究结果发表在Nature上,文章题为“The complete sequence and comparative analysis of ape sex chromosomes”。

01类人猿性染色体组装

为了对类人猿性染色体进行比较分析,研究团队为大多数现存的大猩猩物种——倭黑猩猩、黑猩猩、西部低地大猩猩(以下简称大猩猩)、婆罗洲猩猩(以下简称B.猩猩)和苏门答腊猩猩(以下简称S.猩猩)构建了基因组组装。研究团队还组装了一个与人类关系更近的外群——代表长臂猿(小猿)的暹罗猴(图1)。

研究团队从雄性细胞系中分离出高分子量DNA,并将其用于高覆盖率的PacBio HiFi测序、超长纳米孔(UL-ONT)测序和Hi-C测序。样本之间的测序深度为54到109x(HiFi),28到73x(UL-ONT)和30到78x(Hi-C)。研究还获得了倭黑猩猩和大猩猩个体的亲本DNA,并用Illumina短读长测序技术对其进行51-71x深度的测序。

图 1:染色体的对齐和差异。

总之,该分析生成了长臂猿和婆罗洲猩猩的X和Y染色体的端粒到端粒(T2T)组装,此前这些物种没有相关组装数据;并为倭黑猩猩、黑猩猩、大猩猩和苏门答腊猩猩的X和Y染色体生成了T2T组装,此前这些物种仅有较低质量的组装数据(图2)。与之前的组装相比,新生成的序列占Y染色体总长度的24%-45%(8.6–30 Mb),占X染色体总长度的2.6%-16%(3.9–28 Mb。T2T组装中新增的序列中含有高频率的能形成非典型(非B型)DNA结构的基序,这些基序是已知的测序难点。该研究结合测序技术弥补了这些区域的测序局限性。

图2:在组装中获得的序列、非B型DNA、基因、序列类别、回文和染色体内相似性

02重复序列的组成和甲基化

研究团队通过全面注释发现,Y染色体和X染色体长度的71–85%和62–66%分别由重复元件组成(图3),包括转座元件、卫星序列和简单或低复杂度区域,相比之下,人类T2T常染色体长度中只有53%是重复元件。在Y染色体上,重复元件主要由卫星序列和简单或低复杂度区域组成,且不同物种之间的分布差异很大,这显著地导致了Y染色体长度的变化。Y染色体祖先区域的转座元件含量(65.6%)显著高于Y染色体扩增区域(46.9%),这反映了Y染色体祖先区域缺乏重组,而Y染色体扩增区域发生频繁的染色体内重组。

研究发现了13个以前未知的复合重复序列、2个DXZ4重复序列的变异和33个卫星序列。以前未知的卫星序列在X和Y染色体上的平均长度分别为317 kb和61 kb。

图3:类人猿性染色体上的重复序列

鉴于DNA甲基化对重复元件和基因组组成的强烈影响,研究团队使用映射到这些T2T组合的长读长测序数据分析了猿类性染色体上的5-甲基胞嘧啶DNA甲基化模式,发现类人猿染色体甲基化快速进化。数据显示,Y染色体(不包括PARs)在远程窗口中表现出比X染色体更低的甲基化水平。在所有物种中,PAR1的DNA甲基化程度高于X染色体的其他部分,这可能是由于重组水平的差异,因为已知甲基化在重组率高的区域会增加。每个PAR2与X染色体其余部分之间的甲基化差异不显著。在黑猩猩、人类和婆罗洲猩猩的X染色体中,经过染色体内重组的扩增区域的甲基化水平明显高于祖先区域,但在其他物种的X染色体上,这两个区域之间没有显著差异,而在Y染色体上扩增区域的甲基化水平低于祖先区域。

03Y染色体中的高度种间变异

分析发现,在所有成对物种中,Y染色体的序列对齐百分比低于X染色体(图1b)。只有14-27%的人类Y染色体被与其他类人猿Y染色体的比对所覆盖,多达93-98%的人类X染色体被与其他类人猿X染色体的比对所覆盖(图1b,c)。在密切相关的物种中也观察到相同的模式,只有60-87%的Y染色体排列在它们之间,但超过95%的X染色体排列在它们之间(图1c)。

通过分析同一物种的X和Y染色体之间的序列相似性,研究确定了PARs。所有物种都具有同源的2.2-2.5mb PAR1,但在人类和倭黑猩猩中发现了独立获得的PAR2序列。

在具有物种间变异的序列中,X染色体上83-86%的碱基和Y染色体上99%的碱基受大规模结构变异的影响,剩余碱基受单核苷酸变异的影响。Y染色体上的倒位较为丰富,与其回文结构相一致。Y染色体上的倒位和插入分别比X染色体上的倒位和插入长8倍和3倍,表明Y染色体上结构变异积累速度更快。最后,为了识别在人类谱系中可能具有功能意义的结构变异,该研究团队研究了与334个Y染色体特有结构变异和1,711个X染色体特有结构变异的基因重叠情况。在Y染色体上,该研究团队检测到先前报道的3.7 Mb X转移区的插入——这是从X染色体到Y染色体的人类特有复制,包括13个基因。除基因拷贝数变化外,人类特有的倒位影响了Y染色体上的11个基因(图4),人类特有的插入和缺失影响了X染色体上的23个基因。因此,结构变异是X染色体上的主要遗传变异类型之一,尤其是Y染色体上,并可能具有功能影响。

图4:Y 染色体上的基因进化。

文章第一作者、通讯作者,宾夕法尼亚州立大学Kateryna Makova教授表示:“这些物种Y染色体之间的差异程度非常令人惊讶。部分物种仅在700万年前从人类血统中分化出来,从进化的角度来看,这并不是很长的时间,表明Y染色体进化得非常快。”
文章通讯作者、美国国家人类基因组研究所高级研究员Adam Phillippy博士表示:“在回文中拥有一些基因就像保留一个备份副本。这些基因中有许多都在执行重要功能,例如在精子生成中起作用,这对生育能力很重要,所以我们期望在不同物种的回文中看到相同基因,但事实似乎并非如此。”
综上所述,研究团队的完整组装并揭示了非人类灵长动物性染色体的演化,以前所未有的细节展示了X染色体和Y染色体的区别。与X染色体相比,Y染色体在所有灵长类动物中都经历了快速的演化,积累了重复元件,并经历了频繁的核苷酸替换、染色体内重排和片段重复等事件。此外,Y染色体还具有较低的全局DNA甲基化水平,与其许多基因的低表达水平相关。该研究不仅有助于了解人类进化还可以应用对灵长类和人类基因组的了解来更好地理解这些濒危物种的生物学和繁殖。

论文原文:

Makova, K.D., Pickett, B.D., Harris, R.S. et al. The complete sequence and comparative analysis of ape sex chromosomes. Nature 630, 401–411 (2024). https://doi.org/10.1038/s41586-024-07473-2

(0)

本文由 SEQ.CN 作者:白云 发表,转载请注明来源!

热评文章