科研

首页 - 全部文章 - 科研 - “女娲”基因组资源第六篇 | 徐涛/何顺民团队解析人类基因组小卫星多态性图谱

“女娲”基因组资源第六篇 | 徐涛/何顺民团队解析人类基因组小卫星多态性图谱

在人类基因组中,超过一半的区域由重复序列组成。这些重复序列在人类进化过程中高度变化,极大地丰富了基因组的遗传多样性。可变数目串联重复序列(variable number tandem repeats,VNTRs,又被称为“小卫星DNA”)作为基因组中一种重要的遗传变异,是一类重复基序(motif)超过6bp(base pair),重复次数通常在10-60次的DNA串联序列。已有研究表明VNTR不仅可以通过长度扩增来增加患病风险,其重复基序(motif)的变化也具备独立的致病效应。然而受限于样本量,测序深度,人群多样性及识别算法等因素,在已有的人群规模的基因组测序项目中,VNTR的遗传研究还远远不足,导致了人类基因组中部分遗传力的“缺失”。

11月28日,中国科学院生物物理研究所徐涛院士团队和何顺民研究员团队在国际学术期刊Cell Genomics杂志上发表了题为“Genome-wide Investigation of VNTR Motif Polymorphisms in 8,222 Genomes: Implications for Biological Regulation and Human Traits”的文章(图1)。该研究利用140多个国家和地区的8,222例高深度全基因组测序数据,构建了全球人群VNTR多态性遗传图谱(“女娲”VNTR多态性图谱),并系统性地解析了VNTR的功能特征,特别是其在基因表达中的调控作用。

图1. 文章缩略图

此前“女娲”基因组项目基于大规模人群全基因组测序数据,已经发布和解析了人类基因组SNP、InDel(Cell Reports, 2021)变异图谱,移动元件变异图谱(MEI, Nucleic Acids Research, 2022)和微卫星变异图谱(STR,  Nature Communications, 2023)。并基于基因组中的近期正选择(Science Bulletin, 2023)及非编码调控元件适应性选择(Molecular Biology and Evolution,2024),探讨了其对人类表型和疾病演化的影响。此次发布的“女娲”VNTR多态性图谱,完成了“女娲”基因组资源对人类基因组中主要重复序列元件的全覆盖(ME,STR和VNTR),是系统解析重复序列元件变异的重要参考。“女娲”VNTR多态性图谱,发现了超过250万个VNTR长度多态性和超过1,100万个VNTR基序多态性,其中约30%是“女娲”项目特有的,且大多数是罕见变异(图2)。

图2. 该研究发现的VNTR长度多态性(VNTR- LPs)和基序多态性(VNTR- MPs)数量

“女娲”VNTR多态性图谱重点关注VNTR多态性对基因表达的调控作用。通过对441套来自Geuvadis项目的RNA-seq数据进行eQTL分析,研究团队识别出438个通过长度变化(定义为eVNTRs)影响基因表达的VNTRs,以及1,937个通过motif剂量变化(定义为eMotifs)影响基因表达的VNTRs。研究团队分别从基因组特征、表观修饰特征、进化保守性特征和转录因子结合偏好性方面评估了eVNTRs和eMotifs的功能影响(图3)。

图3. eVNTRs和eMotifs在基因表达中的顺式调控作用

进一步地,通过精细定位和功能注释,研究团队发现MAD1L1上的VNTR可能作为一个远端增强子,其motif能够特异性结合B淋巴细胞发育过程中的一个重要转录因子PU.1,通过剂量变化来调控MAD1L1的表达。随后研究人员开展了一系列的生物学实验,结果表明MAD1L1中eMotif的扩增能够提高转录因子PU.1的结合强度,从而上调邻近基因的表达(图4)。

图4. eMotif MAD1L1的基因调控作用

此外,“女娲”VNTR多态性图谱还分析了VNTR多态性在不同人群中的分布特征,探讨了它们对人类表型分化和疾病易感性的潜在影响。利用多人群的motif变异数据,研究团队实现了人群的有效分层,并发现洲际人群中均高度多态的VNTR motifs所关联的基因主要富集在神经发育和突触传递相关功能中,且在大脑皮层组织中显著富集。同时,研究团队定位到两个具有人群特异多态性的VNTRs分别位于VIPR2RPH3AL基因上(图5),可能与东亚人群的高度近视和非州结直肠癌患者的低生存率相关。

图5. 人类特异扩增的VNTR在人群间的差异

综上所述,“女娲”VNTR多态性图谱,系统分析了VNTR的变异特征、功能特征及人群遗传差异。通过长度和motif剂量两个层面鉴定了影响基因表达的VNTRs,并深入探究了MAD1L1 VNTR上motif多态性对基因的调控作用。该工作拓展了现有遗传研究中重复序列元件变异规模,为我们理解重复序列元件在基因调控中的作用提供了新的视角,并为未来的临床研究和基因型-表型关联研究提供了重要参考。

中国科学院大学生命科学学院博士生张斯佳和中国科学院生物物理研究所博士生宋乔为该论文的共同第一作者,中国科学院生物物理研究所徐涛院士何顺民研究员为论文的共同通讯作者。该研究工作得到了中国科学院战略性先导科技专项、国家重点研发计划、中国科学院“十四五”信息化规划、国家自然科学基金、中国博士后科学基金、国家基因组科学数据中心等多个项目的支持。

论文链接:https://www.cell.com/cell-genomics/fulltext/S2666-979X(24)00328-8

DOI:10.1016/j.xgen.2024.100699

女娲基因组研究系列文章报道

徐涛/何顺民团队发布“女娲”基因组资源,提供中国人群遗传变异图谱和参考面板(Cell Reports, 2021)

中国人群可移动元件插入变异图谱(Nucleic Acids Research, 2022)

中国人群基因组微卫星变异图谱( Nature Communications, 2023)

中国汉族人群基因组近期适应性选择的最新发现(Science Bulletin, 2023 )

中国人群基因组非编码调控元件的适应性选择(Molecular Biology and Evolution,2024)

(0)

本文由 SEQ.CN 作者:白云 发表,转载请注明来源!

关键词:

热评文章