探究癌症中特定体细胞SV事件的真正功能影响,可能会对个体化精准治疗产生积极作用。近年来,基于质谱(MS)的蛋白质组学技术发展迅速,使得在数百种人类肿瘤标本中分析数万种蛋白质特征的表达成为可能。此外,临床肿瘤蛋白质组学分析联盟(CPTAC)等重大科学研究也已产生了基于MS的蛋白质组学分析数据,以及相应的多组学数据。
近日,美国贝勒医学院、阿拉巴马大学伯明翰分校的研究人员在Nature Communications上发表了题为“Global impact of somatic structural variation on the cancer proteome”的文章。研究团队将基于MS的蛋白质组学数据与跨不同癌症类型的WGS、多组学数据相结合,以确定体细胞SV断点模式对附近基因蛋白表达的影响。结果显示,在mRNA水平上与SV相关、受顺式调控改变的数百个基因中,约25%在蛋白质水平上具有类似的相关性。此外,一部分与SV-蛋白相关的基因,与较差的患者生存模式或癌细胞系中基因敲除敏感性相关。
文章发表在Nature Communications
主要研究内容
研究团队从多个公共数据库中(如CPTAC、TCGA、ICGC等)收集了1,426例肿瘤患者的WGS和基因表达数据,将其进行汇总、整合构建成WGS-蛋白质组学数据集,共涉及12种癌症类型。与预期一致,肿瘤中基因的蛋白表达与相应的mRNA水平大致相关。
图1. 与体细胞SV断点附近相关的蛋白或mRNA表达改变。来源:Nature Communications
当体细胞SV断点位于基因内,并与其增加的蛋白质表达相关,这可能代表基因融合。研究团度使用基于RNA-seq的嵌合reads和基于WGS的SV断点整合预测基因融合,结果显示,在RNA-seq检测的9,459个候选融合事件中,3,419个涉及SV断点。在3,419个事件中,大多数涉及了受影响样本中一个或两个基因在mRNA水平的过表达,其中一部分事件也显示出蛋白质的过表达。
图2. 结合RNA-seq、WGS和蛋白质组学分析鉴定基因融合事件。来源:Nature Communications
基于蛋白质-WGS关联分析,研究团队发现在mRNA水平上与基因上调相关的SV中,拓扑关联结构域(TAD)-干扰SV(断点跨越两个不同的TAD)显著富集。在与mRNA过表达相关的TAD-干扰SV中,约66%存在蛋白质过表达。此外,涉及mRNA过表达的SV断点在潜在的增强子劫持事件中富集;SV-mRNA过表达也与逆转录转座子劫持事件相关,其中大多数事件涉及蛋白质过表达。
图3. SV相关蛋白表达改变的机制。来源:Nature Communications
在WGS-蛋白质汇总队列中,与SV-蛋白质相关的基因亚群也与由超3,000名患者组成的扩展mRNA-WGS汇总队列中的患者总生存率相关。在扩展的队列中,有3,156个基因存在与较差生存率相关的体细胞SV断点模式;有3,476个基因存在与较差生存率相关的基因表达;其中交集基因为679个。
图4. SV相关蛋白表达改变与患者预后。来源:Nature Communications
结 语
参考文献:
Chen, F., Zhang, Y., Chandrashekar, D.S. et al. Global impact of somatic structural variation on the cancer proteome. Nat Commun 14, 5637 (2023). https://doi.org/10.1038/s41467-023-41374-8.
本文由 SEQ.CN 作者:白云 发表,转载请注明来源!