近日,Nature同时发表了三篇关于血液蛋白组学的最新研究文章。研究团队利用英国生物库药物蛋白质组学项目(UKB-PPP)的数据,展示了迄今为止规模最大的蛋白质研究结果,为UKB参与者生成了最新的、最全面的血浆蛋白质组遗传图谱。三项研究梳理了影响血液中蛋白质特征的常见和罕见遗传变异,同时探索了血浆蛋白质组、遗传学和疾病之间的相互作用。
第一篇为Biogen、辉瑞、基因泰克等团队合作发表的“Plasma proteomic associations with genetics and health in the UK Biobank”研究文章,报道了关于常见遗传变异对血液中循环蛋白质的影响,揭示了对流行疾病的生物学见解,并为科学界提供了一个可开放获取的大人群蛋白质组学资源。这项里程碑式的研究由渤健、辉瑞、诺和诺德、基因泰克、安进、葛兰素史克、百时美施贵宝、强生、阿斯利康、再生元、武田、Alnylam、Calico等13家国际生物制药公司合作的UKB-PPP联盟完成。
研究人员使用了基于抗体的Olink Explore 3072 PEA技术,对54219名UKB参与者的血液样本进行了蛋白质组分析。通过对2,923种蛋白质进行全面的蛋白质定量特征基因座(pQTL)映射,发现了涉及3,769个不同基因位点的14,287个主要遗传关联,其中81%是以前未报道过的。该研究还对非欧洲人群进行了独立的遗传关联研究,发现了祖先特异性的pQTL,为了解不同人群之间的生物学差异提供了线索。
图1.pQTL的遗传结构,来源:参考资料[1]
除此之外,该研究揭示了遗传多样性对受体-配体相互作用的影响、对多种细胞因子和补体网络的影响,ABO血型和FUT2分泌子对肠道富集的蛋白质的相互作用效应。这项研究提供了一个更为全面的人体蛋白质组学图谱,通过深入挖掘蛋白质与基因、疾病和健康之间的关系,研究人员将能够更好地了解生物体内复杂的调控网络,不仅有助于疾病机制的解析,还为新药物的发现和疾病治疗提供了理论基础。
BenjaminB. Sun说道:“该研究结果显著增强了对蛋白质的遗传和非遗传调节因子的理解,揭示了一系列基因的影响,其中一些基因作为调节蛋白质水平网络的相互作用和组成部分发挥作用。这项工作为该领域提供了精细的基因信号和疾病分析工具,有望为进一步揭示反式调控效应奠定基础。”
整合人类基因组学和蛋白质组学有助于阐明疾病机制、识别临床生物标记和发现药物靶点。第二篇文章由阿斯利康、Biogen、斯坦福大学团队联合发表,文章题为“Rare variant associations with plasma protein levels in the UK Biobank”。研究团队通过分析49,736名UKB参与者的外显子组测序数据和2,923种蛋白质的血浆水平,评估了罕见变异在血浆蛋白丰度中的潜在作用。
外显子组关联分析发现了5433个罕见变异与血浆蛋白质丰度之间的关联,有1962个基因与特定蛋白质的丰度存在关联,在来自蛋白截断变异的691个基因水平信号中,99.4%与蛋白质水平降低有关。例如,STAB1和STAB2是参与血浆蛋白清除的清除受体编码基因,它们作为多效位点出现,分别与77个和41个蛋白质相关联。此外,研究团队使用变异和基因水平的关联检测绘制了跨等位基因频谱的pQTL图谱,展示了这些关联如何用于发现生物标志物和等位基因序列。
图2.基因水平collapsing分析,来源:参考资料[1]
研究团队还展示了公共访问资源的实用性,例如详细描述了NLRC4基因的等位基因序列,鉴定了HSD17B13基因中与脂肪肝相关的潜在生物标志物,并通过整合蛋白质定量特征和蛋白质截断变异来支持相关研究的发现。最后,研究揭示了克隆性造血的不同蛋白质组学后果,包括TET2-CH与FLT3水平升高之间的关联。该研究表明罕见变异在血浆蛋白质丰度中扮演着重要角色,这些罕见变异的关联通常比常见变异更为明显。
第三篇是deCODE Genetics/Amgen公司和冰岛大学联合团队发表的题为“Large-scale plasma proteomics comparisons through genetics and disease associations”的研究文章。研究团队使用大约50000多名欧洲、非洲或亚洲血统的UKB参与者的数据,结合基因型和表型数据,进行了Olink Explore 3072和 SomaScan v4两个高通量蛋白质组学平台的关联研究。
SomaScan和Olink Explore是两个基于亲和力的高通量蛋白质组学平台,通过结合目标蛋白质进行检测。SomaScan使用单个适配体来检测目标蛋白质,Olink需要结合两种不同抗体进行免疫分析。研究团队表示:“我们的研究结果表明,证明了不同平台之间的差异,有时也会提供有用的互补性。”
在pQTL分析中,研究人员鉴定了大量顺式和反式pQTL,在Olink和SomaScan数据中,超过98%的顺式pQTL仅与一种顺式蛋白质相关,少数pQTL与多个蛋白质相关。使用Olink Explore平台和SomaScan平台对非洲人血浆中的1472种蛋白质水平进行分析,并检测顺式pQTL。结果表明,不同祖先群体之间存在pQTL差异,这对相同变异的疾病相关性研究具有潜在价值。
图3.pQTL及其与疾病相关变异的关系,来源:参考资料[3]
结果显示,Olink和SomaScan两个平台检测到具有顺式pQTL的蛋白质数量相差不大,且大部分蛋白质都有 pQTL存在。通过全基因组测序数据,研究人员发现了与罕见变异相关的蛋白质水平在两个平台上的差异。这表现在两个平台对蛋白改变变异(PAV)引起的表位效应同样敏感。
研究团队强调了挖掘血浆蛋白水平不同遗传因素的潜力,以更好地了解人类特征和疾病,同时更好地梳理出与环境因素而非遗传因素相符的蛋白水平多样性模式。研究团队表示:“当蛋白质水平与疾病相关时,它可能是疾病的后果,或者蛋白质可能参与疾病的发病机理。区分这两种可能性的一种方法是确定序列中影响蛋白质水平的变异是否也与疾病相关。在这两种情况下,蛋白质可以作为生物标记,如果变异与疾病相关,它也可以作为药物靶点。UKB中令人难以置信的丰富的表型数据使得这些蛋白质组数据在大量疾病和生理特征的分析中非常有用。"
综上所述,这项大规模蛋白质组研究构建了一个最新的血浆蛋白质组遗传图谱,揭示了对流行疾病的生物学见解,标志着人类健康研究迈出了里程碑式的一步。该系列采用的合作研究模式为科学界提供了一个具有相当广度和深度的开放式蛋白质组学资源,有助于阐明蛋白质基因组发现背后的生物学机制,并加速生物标记、预测模型和治疗方法的发展。
1.Sun BB, Chiou J, Traylor M, et al. Plasma proteomic associations with genetics and health in the UK Biobank. Nature. 2023;622(7982):329-338. doi:10.1038/s41586-023-06592-6
5.Genetic Contributors to Plasma Protein Levels Unearthed in Multiple Studies
本文由 SEQ.CN 作者:白云 发表,转载请注明来源!