文章发表在Nature Communications
主要研究内容
研究团队使用HUPAN分析了185对胃癌、癌旁组织(共370个样本)的WGS深度测序数据,构建了包含人类参考基因组(GRCh38)和80.88 Mbp新序列的胃癌泛基因组(GCPAN)(图1)。其中,新序列中至少包含14个新基因。随后,将个体基因组以泛基因组作为参照比对,识别出胃癌患者个体中的PAVs。
图1. GCPAN的组成。来源:Nature Communications
为找出胃癌人群的癌症易感基因,研究团队将上述非必需基因与两个独立的基因组测序数据集(263人来自西蒙斯基因组多样性项目“SGDP”;90人来自中国汉族)进行了比较,并绘制了胃癌人群的PAV图谱(图2)。结果显示,有4个非必需基因(GSTM1、UGT2B17、ACOT1和SIGLEC14)在胃癌人群中高度缺失。UGT2B17在所有亚洲个体中都高频率缺失,GSTM1和SIGLEC14在东亚个体中高频率缺失,ACOT1在中国汉族人群中的缺失频率较高。
图2. 非必需基因的缺失变异和功能富集。来源:Nature Communications
研究团队使用上述得到的GCPAN,从非GRCh38序列预测了82个蛋白质编码基因(图3)。在这82个基因中,有14个预测基因的重复元件小于50%。通过三代测序的长读长序列进行染色体定位研究,发现了可以成功定位到染色体9q34.2位点的GC0643基因。
图3. 预测基因GC0643的染色体位置和功能。来源:Nature Communications
在来自亚洲患者的胃癌细胞系HGC27中加入GC0643真核表达载体后,研究团队在mRNA和蛋白质水平上检测到了GC0643的基因表达(图4)。GC0643基因的过表达显著抑制了细胞生长和集落形成。在GC0643过表达的癌细胞中,淋巴细胞活化和解毒通路被上调;伤口愈合、细胞因子介导的信号传导和细胞分裂被下调。此外,与对照组相比,GC0643过表达显著抑制了细胞迁移,shRNA在敲低GC0643基因后,细胞迁移抑制明显逆转。
图4. GC0643基因的生物学功能。来源:Nature Communications
综上所述,研究团队通过结合人类参考基因组和非参考序列开发了一种癌症基因组学研究的新策略,从185对胃癌和正常黏膜中构建了GCPAN。与非亚洲健康人群相比,基因ACOT1、GSTM1、SIGLEC14和UGT2B17在中国汉族甚至亚洲人群中都高度缺失,这四种基因与亚洲人群中胃癌的高发病率存在潜在关联。此外,研究团队还确定了GC0643是胃癌的抑癌基因。以上研究成果为解析中国人群胃癌高发的分子遗传学背景提供了重要参考。
参考文献:
Yu Y, Zhang Z, Dong X, et al. Pangenomic analysis of Chinese gastric cancer. Nat Commun. 2022 Sep 15;13(1):5412. doi: 10.1038/s41467-022-33073-7. PMID: 36109518; PMCID: PMC9477819.
本文由 SEQ.CN 作者:白云 发表,转载请注明来源!