文章发表于Nature Cancer
01 CBCGA队列的多组学景观
CBCGA提供了一个全面的多组学队列,包括773例中国乳腺癌患者的基因组学、转录组学、蛋白质组学、代谢组学、放射组学和数字病理学数据(图1)。在整个队列中检测到33,330个非同义突变,包括32,037个单核苷酸变异(SNV)和1,293个小片段插入和缺失(Indel)。研究人员通过PAM50基因预测分析乳腺癌的内在亚型,发现基于752例患者的RNA-seq数据,29.5%为luminal A型、29.4%为luminal B型、19.7%为HER2富集型、14.9%为基底样型、6.5%为正常样亚型。CBCGA队列中最常突变的基因包括TP53、PIK3CA、GATA3、MAP3K1、KMT2C和AKT1(图1c)。此外,研究人员还鉴定了PAM50亚型中差异表达的信使RNA、蛋白质和代谢产物(图1f–h)。
图1.CBCGA队列的多组学景观
02 中国乳腺癌患者的特异性分子特征
研究人员在TCGA中诊断为浸润性导管癌(IDC)的白人队列和CBCGA队列中,重点分析了临床和分子特征(图2),并探究了基因组差异。结果显示。两个队列AKT1的突变频率显著不同(图2a),CBCGA队列中luminal A乳腺癌患者的AKT1突变发生率显著高于TCGA白人队列(6.4% vs. 2.5%)(图2b)。进一步分析显示,AKT1突变是luminal A IDC病例的早期事件,在亚洲luminal A乳腺癌肿瘤发生中起到关键作用,其突变类型绝大多数(90.9%)为E17K突变,可被现有AKT抑制剂靶向。
接着,研究人员探究了CBCGA和TCGA白人个体队列之间分子亚型的差异(图2d)。与TCGA白人个体相比,CBCGA队列具有不同的内在亚型分布,luminal A亚型比例较少,HER2富集亚型比例较多,且HER2富集型中约40%是激素受体阳性/HER2阳性型(HR+/HER2+)。ERBB2基因在CBCGA队列中扩增更为明显,尤其是在HR+HER2+亚型中(图2e,f)。CBCGA队列的HR+HER2+亚型中ERBB2的高扩增与下游mRNA和蛋白质表达显著相关(图2g)。
图2.中国乳腺癌患者的特异性分子特征
03 蛋白质组学分析
为进一步探究拷贝数变异(CNA)在乳腺癌发生发展中起到的作用,研究人员通过TMT标记技术,鉴定了9787种独特的蛋白质,以探究CNA对mRNA和蛋白质水平的影响。结果发现,在不同的内在亚型中,CNA与mRNA和蛋白质水平的相关性不同。在整个队列中,5672个CNA-mRNA和3326个CNA-mRNA蛋白对存在显著的顺式相关性,而6235对和3717对(50.2%)基因在转录和翻译水平上存在显著的反式效应(图3a、b)。不同亚型中CNA的影响分析结果表明,luminal B型乳腺癌在蛋白质水平上表现出最大的顺式效应,其次分别是luminal A、basal-like和HER2富集型。在正常型乳腺中,只有13个基因(0.2%)在蛋白水平上表现出显著的顺式效应(图3c)。此外,研究人员整合了mRNA和蛋白质的丰度,采用相似性网络融合(SNF)分析进一步细化了乳腺癌患者的分类,鉴定到了4类乳腺癌,完善了当前的亚型分类系统。
图3.蛋白质组学分析为乳腺癌症亚型产生了新的见解
04 综合代谢组学分析
研究人员对CBCGA队列中的669种极性代谢产物和1312种脂质进行了定量分析(图4a)。结果发现,肿瘤样本和正常样本明显分离,大多数代谢产物在肿瘤中富集,特别是氨基酸和肽类显著上调,脂质代谢也异常活跃,表明肿瘤中存在明显的代谢失调(图4b)。为了进一步分析极性代谢组学,研究人员对这些蛋白质和代谢产物的丰度进行了注释(图4c),发现乳腺癌的每个固有亚型都具有不同的极性代谢组学特征(图4d)。
进一步分析发现,Luminal型乳腺癌中富含鞘脂,富集HER2和basal-like型乳腺癌中富含甘油磷脂(图4e)。PAM50亚型的铁死亡综合分析发现,basal-like型乳腺癌具有丰富的铁死亡相关的多不饱和脂肪酸(PUFA)、PL-PUFAs和PL-PUFA-OOH(图4h),表明铁死亡可能是basal-like型乳腺癌的潜在治疗靶点。
图4.综合代谢组学分析显示,铁死亡是basal-like肿瘤的潜在治疗靶点
05 免疫基因组分析
利用乳腺癌的转录组学数据,研究人员确定了癌症中三种不同的肿瘤微环境(TME)表型(图5a)。“cold”TME表现出相对较低的免疫细胞浸润。“moderate”TME是存在基质细胞浸润和一些不活跃的先天免疫细胞。“hot”TME表现出高丰度的适应性和活性先天免疫细胞,表明其具有强烈的抗肿瘤免疫反应(图5b)。
在肿瘤抗原方面,具有“cold”TME的basal-like乳腺癌显示出比“hot”TME更高水平的肿瘤抗原产生(图5d),但该亚型具有较低的免疫浸润。相应地,“cold”TME的basal-like乳腺癌的主要组织相容性复合体基因表达较低,杂合性丢失和等位基因失衡的比例较高,这解释了为什么“cold”乳腺癌的肿瘤抗原负荷略高,但免疫浸润较低(图5e)。不同TME表型的突变和CNA特征的比较结果显示,TP53、XIPR2和LRP1B在“hot”肿瘤中最常见,GATA3最罕见,CSMD1在“cold”肿瘤中最常见(图5f,g)。
图5.免疫基因组分析揭示了癌症TME的异质性
06 多模态数据整合优化复发风险分层
复发风险分层和预后预测是乳腺癌临床管理和转化研究中的主要问题。研究人员从对比增强MRI和病理学切片中获取了影像学和病理学特征,然后结合临床分期、免疫组化亚型、影像学特征、病理学特征、转录组数据和代谢组数据,建立了一系列预后预测模型。结果显示,多模态模型在预后预测方面显示出比单模态模型更大的潜力。在测试队列中,临床分期(TMPIC)模型对复发风险高和低的患者进行了良好的分层(图6d-e)。TMPIC模型包含5个基因、5种代谢产物、5种数字病理特征、IHC亚型和临床肿瘤分期,这些特征与良好的预后以及复发风险相关(图6f)。总之,该研究建立了一个全面的工作流程,并证明了多模式整合在预测癌症预后方面的潜力。
图6:利用机器学习进行多模态数据整合,对乳腺癌进行风险分层
此外,通过分析CBCGA队列的RNA-seq数据,在17号染色体上发现了频繁的基因融合事件,尤其是在HER2+样本中。研究共检测到11例复发性融合,其中一例(LHFPL5–CLPSL1)以前未被报道过。进一步分析显示,携带ERBB2融合的患者比没有携带的患者有更好的生存率。以上数据为癌症ERBB2融合提供了新的见解,并确定了一些融合作为HER2+乳腺癌的潜在预后标志物。
综上所述,这项研究提供了一个由773例中国乳腺癌组成的综合多组学队列,包括基因组、转录组、蛋白质组、代谢组、放射组和数字病理学数据。该数据集有助于识别乳腺癌的潜在治疗靶点、种族差异、TME和代谢特征,揭示亚洲乳腺癌的独特特征,并为未来研究乳腺癌的生物学复杂性提供关键参考。
论文原文:
Jiang YZ, Ma D, Jin X, et al. Integrated multiomic profiling of breast cancer in the Chinese population reveals patient stratification and therapeutic vulnerabilities. Nat Cancer. Published online February 12, 2024. doi:10.1038/s43018-024-00725-0
本文由 SEQ.CN 作者:白云 发表,转载请注明来源!