近日,来自美国卫生国家基因组研究所的研究团队利用人类端粒到端粒(T2T)组装的实验和计算方法,成功构建了五种大猩猩(倭黑猩猩、黑猩猩、西部低地大猩猩、婆罗洲猩猩和苏门答腊猩猩)及一种小猩猩(暹罗长臂猿)的X和Y染色体的完整组装,并揭示了它们进化的复杂性。与X染色体相比,类人猿Y染色体的大小差异较大,由于谱系特异性扩增区、回文、转座元件和卫星序列的积累,Y染色体具有低对齐性和高水平的结构重排。许多Y染色体基因在多拷贝家族中扩增,部分基因在净化选择下进化。因此,Y染色体表现出动态进化,而X染色体更为稳定。该研究结果发表在Nature上,文章题为“The complete sequence and comparative analysis of ape sex chromosomes”。
为了对类人猿性染色体进行比较分析,研究团队为大多数现存的大猩猩物种——倭黑猩猩、黑猩猩、西部低地大猩猩(以下简称大猩猩)、婆罗洲猩猩(以下简称B.猩猩)和苏门答腊猩猩(以下简称S.猩猩)构建了基因组组装。研究团队还组装了一个与人类关系更近的外群——代表长臂猿(小猿)的暹罗猴(图1)。
研究团队从雄性细胞系中分离出高分子量DNA,并将其用于高覆盖率的PacBio HiFi测序、超长纳米孔(UL-ONT)测序和Hi-C测序。样本之间的测序深度为54到109x(HiFi),28到73x(UL-ONT)和30到78x(Hi-C)。研究还获得了倭黑猩猩和大猩猩个体的亲本DNA,并用Illumina短读长测序技术对其进行51-71x深度的测序。
图 1:染色体的对齐和差异。
总之,该分析生成了长臂猿和婆罗洲猩猩的X和Y染色体的端粒到端粒(T2T)组装,此前这些物种没有相关组装数据;并为倭黑猩猩、黑猩猩、大猩猩和苏门答腊猩猩的X和Y染色体生成了T2T组装,此前这些物种仅有较低质量的组装数据(图2)。与之前的组装相比,新生成的序列占Y染色体总长度的24%-45%(8.6–30 Mb),占X染色体总长度的2.6%-16%(3.9–28 Mb)。T2T组装中新增的序列中含有高频率的能形成非典型(非B型)DNA结构的基序,这些基序是已知的测序难点。该研究结合测序技术弥补了这些区域的测序局限性。
图2:在组装中获得的序列、非B型DNA、基因、序列类别、回文和染色体内相似性
研究团队通过全面注释发现,Y染色体和X染色体长度的71–85%和62–66%分别由重复元件组成(图3),包括转座元件、卫星序列和简单或低复杂度区域,相比之下,人类T2T常染色体长度中只有53%是重复元件。在Y染色体上,重复元件主要由卫星序列和简单或低复杂度区域组成,且不同物种之间的分布差异很大,这显著地导致了Y染色体长度的变化。Y染色体祖先区域的转座元件含量(65.6%)显著高于Y染色体扩增区域(46.9%),这反映了Y染色体祖先区域缺乏重组,而Y染色体扩增区域发生频繁的染色体内重组。
研究发现了13个以前未知的复合重复序列、2个DXZ4重复序列的变异和33个卫星序列。以前未知的卫星序列在X和Y染色体上的平均长度分别为317 kb和61 kb。
图3:类人猿性染色体上的重复序列
鉴于DNA甲基化对重复元件和基因组组成的强烈影响,研究团队使用映射到这些T2T组合的长读长测序数据分析了猿类性染色体上的5-甲基胞嘧啶DNA甲基化模式,发现类人猿染色体甲基化快速进化。数据显示,Y染色体(不包括PARs)在远程窗口中表现出比X染色体更低的甲基化水平。在所有物种中,PAR1的DNA甲基化程度高于X染色体的其他部分,这可能是由于重组水平的差异,因为已知甲基化在重组率高的区域会增加。每个PAR2与X染色体其余部分之间的甲基化差异不显著。在黑猩猩、人类和婆罗洲猩猩的X染色体中,经过染色体内重组的扩增区域的甲基化水平明显高于祖先区域,但在其他物种的X染色体上,这两个区域之间没有显著差异,而在Y染色体上扩增区域的甲基化水平低于祖先区域。
分析发现,在所有成对物种中,Y染色体的序列对齐百分比低于X染色体(图1b)。只有14-27%的人类Y染色体被与其他类人猿Y染色体的比对所覆盖,多达93-98%的人类X染色体被与其他类人猿X染色体的比对所覆盖(图1b,c)。在密切相关的物种中也观察到相同的模式,只有60-87%的Y染色体排列在它们之间,但超过95%的X染色体排列在它们之间(图1c)。
通过分析同一物种的X和Y染色体之间的序列相似性,研究确定了PARs。所有物种都具有同源的2.2-2.5mb PAR1,但在人类和倭黑猩猩中发现了独立获得的PAR2序列。
在具有物种间变异的序列中,X染色体上83-86%的碱基和Y染色体上99%的碱基受大规模结构变异的影响,剩余碱基受单核苷酸变异的影响。Y染色体上的倒位较为丰富,与其回文结构相一致。Y染色体上的倒位和插入分别比X染色体上的倒位和插入长8倍和3倍,表明Y染色体上结构变异积累速度更快。最后,为了识别在人类谱系中可能具有功能意义的结构变异,该研究团队研究了与334个Y染色体特有结构变异和1,711个X染色体特有结构变异的基因重叠情况。在Y染色体上,该研究团队检测到先前报道的3.7 Mb X转移区的插入——这是从X染色体到Y染色体的人类特有复制,包括13个基因。除基因拷贝数变化外,人类特有的倒位影响了Y染色体上的11个基因(图4),人类特有的插入和缺失影响了X染色体上的23个基因。因此,结构变异是X染色体上的主要遗传变异类型之一,尤其是Y染色体上,并可能具有功能影响。
图4:Y 染色体上的基因进化。
论文原文:
Makova, K.D., Pickett, B.D., Harris, R.S. et al. The complete sequence and comparative analysis of ape sex chromosomes. Nature 630, 401–411 (2024). https://doi.org/10.1038/s41586-024-07473-2
本文由 SEQ.CN 作者:白云 发表,转载请注明来源!