图1. 文章缩略图
此前“女娲”基因组项目基于大规模人群全基因组测序数据,已经发布和解析了人类基因组SNP、InDel(Cell Reports, 2021)变异图谱,移动元件变异图谱(MEI, Nucleic Acids Research, 2022)和微卫星变异图谱(STR, Nature Communications, 2023)。并基于基因组中的近期正选择(Science Bulletin, 2023)及非编码调控元件适应性选择(Molecular Biology and Evolution,2024),探讨了其对人类表型和疾病演化的影响。此次发布的“女娲”VNTR多态性图谱,完成了“女娲”基因组资源对人类基因组中主要重复序列元件的全覆盖(ME,STR和VNTR),是系统解析重复序列元件变异的重要参考。“女娲”VNTR多态性图谱,发现了超过250万个VNTR长度多态性和超过1,100万个VNTR基序多态性,其中约30%是“女娲”项目特有的,且大多数是罕见变异(图2)。
图2. 该研究发现的VNTR长度多态性(VNTR- LPs)和基序多态性(VNTR- MPs)数量
“女娲”VNTR多态性图谱重点关注VNTR多态性对基因表达的调控作用。通过对441套来自Geuvadis项目的RNA-seq数据进行eQTL分析,研究团队识别出438个通过长度变化(定义为eVNTRs)影响基因表达的VNTRs,以及1,937个通过motif剂量变化(定义为eMotifs)影响基因表达的VNTRs。研究团队分别从基因组特征、表观修饰特征、进化保守性特征和转录因子结合偏好性方面评估了eVNTRs和eMotifs的功能影响(图3)。
图3. eVNTRs和eMotifs在基因表达中的顺式调控作用
进一步地,通过精细定位和功能注释,研究团队发现MAD1L1上的VNTR可能作为一个远端增强子,其motif能够特异性结合B淋巴细胞发育过程中的一个重要转录因子PU.1,通过剂量变化来调控MAD1L1的表达。随后研究人员开展了一系列的生物学实验,结果表明MAD1L1中eMotif的扩增能够提高转录因子PU.1的结合强度,从而上调邻近基因的表达(图4)。
图4. eMotif MAD1L1的基因调控作用
此外,“女娲”VNTR多态性图谱还分析了VNTR多态性在不同人群中的分布特征,探讨了它们对人类表型分化和疾病易感性的潜在影响。利用多人群的motif变异数据,研究团队实现了人群的有效分层,并发现洲际人群中均高度多态的VNTR motifs所关联的基因主要富集在神经发育和突触传递相关功能中,且在大脑皮层组织中显著富集。同时,研究团队定位到两个具有人群特异多态性的VNTRs分别位于VIPR2和RPH3AL基因上(图5),可能与东亚人群的高度近视和非州结直肠癌患者的低生存率相关。
图5. 人类特异扩增的VNTR在人群间的差异
综上所述,“女娲”VNTR多态性图谱,系统分析了VNTR的变异特征、功能特征及人群遗传差异。通过长度和motif剂量两个层面鉴定了影响基因表达的VNTRs,并深入探究了MAD1L1 VNTR上motif多态性对基因的调控作用。该工作拓展了现有遗传研究中重复序列元件变异规模,为我们理解重复序列元件在基因调控中的作用提供了新的视角,并为未来的临床研究和基因型-表型关联研究提供了重要参考。
论文链接:https://www.cell.com/cell-genomics/fulltext/S2666-979X(24)00328-8
DOI:10.1016/j.xgen.2024.100699
徐涛/何顺民团队发布“女娲”基因组资源,提供中国人群遗传变异图谱和参考面板(Cell Reports, 2021)
中国人群可移动元件插入变异图谱(Nucleic Acids Research, 2022)
中国人群基因组微卫星变异图谱( Nature Communications, 2023)
中国汉族人群基因组近期适应性选择的最新发现(Science Bulletin, 2023 )
本文由 SEQ.CN 作者:白云 发表,转载请注明来源!