近日,Nature出版集团旗下期刊Scientific Reports在线发表了来自WeGene、中南大学,德国马普研究所的研究人员取得的最新研究成果。该工作基于来自消费级基因检测的2139名中国男性Y染色体数据,构建了更高精度的中国人父系祖源图谱。
对于人类基因组来说,Y染色体是决定人类性别的染色体,因其只在男性中出现,而且不会有同源重组现象,可以忠实地保留父系信息,在分子人类学中,对研究人类的起源和迁徙有着重要意义。
文章第一作者,WeGene 生物信息专家姚笑天表示:现有的Y染色体已经成为人类走出非洲,并迁徙至世界各地的重要证据。目前,欧美人群的Y染色体精细谱系树已有较为系统、详尽的研究,而关于中国人的父系图谱的内部分枝结构的研究还有很多欠缺。
文章通讯作者王传超博士在复旦大学时师从国内分子人类学专家金力院士和李辉教授,现在德国马普研究所和哈佛医学院遗传学系继续从事分子人类学和古DNA方面的研究工作。王传超博士表示:随着高通量测序技术的应用,近年来在Y染色体上发现了数万个可能具有谱系识别力的SNP位点,但使用普通PCR和SNaPshot技术对这些位点的进一步验证和谱系定位却是耗时耗力、花费巨大。鉴于此,我们跟WeGene的生物信息团队一起设计了包含大量Y染色体、线粒体及其他常染色体上的共60万高质量位点的基因芯片。以数万中国人基因组数据为基础,构建、完善了东亚人群的高精度Y染色体谱系树。这对于理清中华民族的起源、迁徙和融合历史、法医身源鉴定等都有重要意义。
这项研究中,研究团队重点关注了O2a1c-002611这一Y染色体单倍群,利用WeGene芯片所涵盖的Y染色体上近两万个SNP的分型结果,找到了89个具有谱系鉴别力的SNP位点,并对O2a1c-002611进行了更精细的重构。根据新的单倍群树,其下游的O2a1c1a-F11在中国的汉族中经历了一次大的扩张,在现代汉族中占了高达11.13%的比例,并可以细分为7个更细的分支,比例占0.187%到3.553%不等。这一结果结合O2a1c-002611在藏缅等族群中的分布情况,将有助于研究人员进一步深入研究汉藏族群的起源和迁徙历程,对语言的起源和多样化研究也能起到参考作用。
据悉,这是第一篇基于消费级基因检测数据的中国人群基因组学研究论文。在此之前,美国的23andme等直接面向消费者基因检测公司已经基于所积累的大量基因组数据在Nature Biotechnology等诸多顶级期刊上发表多篇关于饮食喜好、抑郁症、遗传病等领域的论文。
王传超博士表示,这一研究是依托WeGene近年来所积累的大量用户的基因组数据库,进行中国人基因组相关科学研究的一个新探索。我们成功地将在中国人中高频出现的O2a1c-002611单倍群的内部结构进行了高精度的构建。未来我们会继续基于这个模式,探索与中国人群有关的重要分子人类学问题。
文章另一位通讯作者、 WeGene首席技术官陈钢博士表示:WeGene 通过与赛默飞、DNA Genotek、华大科技等全球一流的合作伙伴一起努力,在DNA样品质量、基因组数据质量等方面投入巨大,目的就是为了在确保用户得到可靠的检测结果的同时,还能让这些基因组数据在用户知情同意的情况下为中国人的基因组学研究作出贡献。
据悉,除了分子人类学方面的研究项目,WeGene也正与上海交通大学、济宁医学院等机构开展关于尼古丁成瘾易感性、酒精成瘾易感性、女性痛经遗传因素等研究合作项目。
参考文献:
Yao, X., Tang, S., Bian, B., Wu, X., Chen, G., & Wang, C.-C. (2017). Improved phylogenetic resolution for Y-chromosome Haplogroup O2a1c-002611. Scientific Reports, 7: 1146.http://doi.org/10.1038/s41598-017-01340-z
本文由 SEQ.CN 作者:戴胜 发表,转载请注明来源!