近日,美国贝勒医学院章冰团队与复旦大学高强团队合作在Cell发表了题为“Pan-cancer proteogenomics expands the landscape of therapeutic targets”的文章。研究团队将CPTAC的10种癌症类型1043名患者的蛋白基因组学数据集与其他公共数据集,阐明了癌症治疗的蛋白质新靶点。对2863种可药物蛋白的泛癌分析揭示了广泛的丰度范围,并确定了影响mRNA -蛋白相关性的生物学因素,为现有的癌症药物靶点提供了更加详尽的数据,并系统地确定了药物再利用和开发新疗法的候选新靶点。此外,研究团队还创建了一个公开访问的网络门户(https://targets.linkedomics.org/),供研究人员探索该研究中发现的蛋白和肽段靶点及药物再利用等相关数据。总之,这一开创性的研究展示了蛋白质基因组学在癌症治疗靶点识别中的巨大潜力。
文章发表在Cell
研究人员分析了来自10种癌症类型的1043个肿瘤样本和524个正常组织样本的CPTAC蛋白质组数据,并将其与基因突变、拷贝数变异、甲基化以及转录本和磷酸盐丰度数据相结合,旨在为生物标记物的发现、药物再利用和新疗法的开发得出可操作的见解。
研究共收集了2863个潜在的小分子靶点蛋白和膜蛋白的药物靶标信息,然后将其分为五个等级。这些靶标基因的转录组数据被全覆盖,蛋白质组学数据也覆盖了71%。虽然蛋白质丰度较高的基因往往有较高的mRNA丰度,但仍有部分蛋白在一种或多种癌症类型中显示与mRNA丰度有着较差的相关性,这些发现也凸显了直接检测可用药物靶标基因蛋白质丰度的重要性和必要性。
图1. 治疗靶点的研究队列和蛋白质组学研究概况
随后,研究分析了蛋白质过度表达和过度激活驱动的靶向依赖关系。首先,研究人员比较了肿瘤和正常组织样本,以确定在肿瘤中过度表达的蛋白质。为了进一步筛选对癌细胞生存和增殖至关重要并对治疗有积极影响的治疗靶点的蛋白质,研究人员利用来自CRISPR-Cas9筛选实验的基因依赖分数在相应谱系的癌细胞系中进行筛选,最终确定了457个潜在靶点蛋白质,其中51个在至少5种癌症类型中共享,这种靶点是药物再利用和新疗法开发的最佳候选蛋白。研究还进一步将mRNA和蛋白质表达数据与突变、甲基化和拷贝数变异数据相结合,以确定其过度表达与各自基因中的基因组异常有关的蛋白质。例如,突变分析发现,EGFR突变经常伴随着拷贝数扩增,与EGFR mRNA和蛋白水平的增加有关。
除了过度表达外,蛋白质的活性还可以通过翻译后修饰来改变,以促进肿瘤的发生。为了确定蛋白质过度激活所驱动的靶向依赖性,研究人员对肿瘤和正常样本之间的磷酸蛋白组数据进行了差异丰度分析,并进一步推断了肿瘤和正常样本之间的激酶活性变化,发现共有19个激酶活性增加,11个有证据表明其在一个或多个癌症类型中发挥作用。
图2. 基于基因和基因组异常的靶向肿瘤过表达蛋白的筛选
来自体细胞突变的新抗原是疫苗和T细胞免疫治疗的有效靶点。研究团队对蛋白质组学、磷酸蛋白质组学以及配对的DNA和RNA测序数据进行了集成分析,系统地预测具有蛋白质表达证据的体细胞突变衍生的新抗原。在10种癌症类型中鉴定出27-533个突变多肽。此外,与在蛋白质水平上未检测到突变的基因相比,在蛋白质水平上检测到突变的基因显示出更高的蛋白质丰度,这表明蛋白质丰度在突变肽的鉴定中也起着重要作用。
研究分析确定了与846个体细胞突变相关的2315个假定新抗原,其中一些新的多肽或其高度相似的形式已经在临床前或临床上进行了研究,这些突变包括KRAS G12C、G12D、G13D和IDH1 R132H及 TP53 R273C突变产生的新肽。在75个带有KRAS G12D突变的肿瘤中,53%产生了可检测到的突变多肽,31%被预测产生至少一个KRAS G12D衍生的新抗原表位,另外两个KRAS突变也被预测在相当数量的肿瘤中产生新的抗原表位。值得注意的是,5个KRAS突变多肽被预测在4种癌症类型的44名患者中产生新抗原表位,因此有望成为靶向公共新抗原的候选对象。
图3. 利用蛋白基因组学数据预测体细胞突变衍生的新抗原
接下来,研究人员通过识别在肿瘤中过度表达的蛋白质和在正常组织中表现出高度限制性表达的蛋白质,以鉴定肿瘤相关抗原,共发现有140个蛋白符合上述筛选标准。其中包括5个黑色素瘤相关抗原(MAGE)家族蛋白。经过层层筛选,研究确定对7种蛋白质进行实验验证。最终,来自MAGEA1、MAGEA10、MAGEB2、BRDT和LEKR1的22个多肽显示出很强的HLA结合亲和力和较强的免疫原性,它们是作为免疫治疗潜在靶点很有前途的候选对象。
图4. 肿瘤相关抗原的鉴定及验证
综上所述,研究通过综合分析泛癌样本以及524个正常样本中的蛋白质组数据、基因组数据、转录组数据、表观组学数据和质谱数据等,系统评估了基因突变、基因表达、转录特征、DNA甲基化、蛋白质组学和磷酸蛋白质组学图谱,重点关注了蛋白质和多肽效应,指出了潜在的治疗靶点或新疗法。
图5. 研究总结图
文章共同第一作者、贝勒医学院分子和人类遗传学研究员Jonathan Lei表示:“虽然基因组研究大大提高了我们对癌症生物学和基因组驱动因素的理解,但大多数癌症患者仍在接受非特异性化疗和放疗,这些化疗和放疗的疗效低,毒性高。从临床角度来看,这项研究为蛋白质和多肽靶点提供了强有力的理论基础,可以进一步研究和形成未来生物标志物驱动的临床试验的基础。此外,研究也通过实验验证了从计算分析中确定的一些新的蛋白质和多肽靶点。”
研究团队表示:“我们的分析提供了对现有癌症药物靶点的见解,并系统地确定了药物再利用和新开发的候选新靶点,这些包括过度表达和过度激活的蛋白质依赖性以及鉴定的新抗原和肿瘤相关抗原。”
据悉,该团队目前也正在寻找合作者,不仅要验证研究中强调的蛋白质靶标,还要提出针对尚未被批准的药物靶向蛋白质的治疗方法。此外,研究团队还在扩展其他癌症类型和亚型的组学分析,例如乙酰组学、糖蛋白组学和泛素化组学分析等。
https://www.cell.com/cell/fulltext/S0092-8674(24)00583-X
本文由 SEQ.CN 作者:白云 发表,转载请注明来源!