其它

首页 - 全部文章 - 其它 - 李程/王健/武多娇团队合作发表肺癌临床样本基因组、三维基因组及转录组的整合分析成果

李程/王健/武多娇团队合作发表肺癌临床样本基因组、三维基因组及转录组的整合分析成果

染色质在细胞核中可折叠成高度复杂的三维结构,并且在细胞分化增殖等过程实现动态调控。染色质构象捕获技术如Hi-C等可以捕捉基因组范围的高分辨率染色质相互作用,帮助研究者更好地理解三维基因组和细胞功能之间的关系。肺癌是目前发病率和死亡人数最高的癌症之一,与肺癌相关的组学研究涵盖基因组、表观遗传学、转录组和蛋白组等,但与三维基因组相关的研究较少,特别是直接采用肺癌临床样本的三维基因组研究。

近日,北京大学生命科学学院李程研究员课题组联合复旦大学附属中山医院临床医学研究院武多娇教授、碳云智能数字生命研究院王健副院长团队在Genomics, Proteomics & Bioinformatics期刊发表题为“Integrative Analysis of Genome, 3D Genome, and Transcriptome Alterations of Clinical Lung Cancer Samples”的研究文章。在该研究中,研究团队用少量细胞 (1×104 ) 证明了Hi-C实验研究肺癌临床样本三维基因组的可行性,并通过多组学数据整合分析不同层面的基因组变化,揭示了肺癌临床样本的基因组、三维基因组和转录组之间的关系。图片

文章发表于Genomics, Proteomics & Bioinformatics

由于肺癌临床样本中可用的细胞数量较少,研究人员用来自A549肺ADC细胞系的1 × 104、1 × 105和1 × 106稀释梯度的细胞以及从患者(5534T)收集的肿瘤样本进行了Hi-C实验。数据显示,不同细胞浓度获得的Hi-C数据中的原始相互作用计数高度相关(图1A和B)。对于A549细胞系和5534T肿瘤样本,1 × 104细胞鉴定的标准化染色质相互作用和TADs与1 × 105、1 × 106细胞鉴定的染色质相互作用高度相似(图1C)。具体来说,使用1 × 106 A549细胞鉴定的3300个拓扑结构域(TADs)中,88%的TADs是使用1 × 104细胞发现的,使用1 × 104 A549细胞鉴定的3137个TADs中,93%的TADs是使用1 × 106细胞发现的(图1D)。以上结果证明了用少量细胞 (1×104 ) 的Hi-C实验研究临床肺癌样本三维基因组的可行性。

图1.临床肺癌样本的3D基因组检测。来源:Genomics, Proteomics Bioinformatics

研究团队从两例肺ADC患者中分别提取癌症和癌旁组织(患者5534和6405;图2A和B)进行Hi-C和RNA-seq测序,获得三维基因组和转录组信息。分析结果显示,从患者5534肿瘤样本中分离出的细胞中,约30%-40%为癌细胞,患者6405的肿瘤样本中,癌细胞的比例为10%~20%。配对正常和肿瘤样本的原始染色质相互作用矩阵基本上是相关的,但显示出明显差异(图2C)。

为了更深入地了解正常组织和肿瘤组织之间的3D基因组差异,研究人员使用caICB标准化的Hi-C数据比较了来自细胞系、组织样本和癌症类型的染色质相互作用数据的TADs和A/B室。结果发现,在成对的正常和肿瘤肺组织中检测到保守和改变的TAD(图2E)。与正常肺组织相比,肺癌临床样本中的TADs和染色质环(loops)结构都发生了显著变化。

图2.临床正常和肺癌标本的3D基因组结构。来源:Genomics, Proteomics & Bioinformatics

癌细胞的Hi-C相互作用计数受拷贝数变异(CNV)的影响,这意味着Hi-C可以使用类似于全基因组测序(WGS)数据的分析方法进行分析以识别CNVs。因此,研究人员利用A549细胞和肺样本的Hi-C数据进行了全基因组CNVs鉴定(图3A)。此外,在癌症细胞系百科全书(CCLE)数据库中的肺癌细胞系中,用Hi-C检测的A549细胞系中的CNVs与用单核苷酸多态性(SNP)阵列检测的CNVs相关性最高。以上结果表明,Hi-C技术不仅可以用于检测染色质三维结构,同时可用于推断癌症中的CNV和点突变(SNV)

图3.从Hi-C数据中鉴定肿瘤CNVs。来源:Genomics, Proteomics & Bioinformatics

为了探讨3D基因组是否介导基因组改变对肺癌基因表达的影响,研究团队通过Hi-C数据得到临床肺癌患者的三维基因组结构、CNV和突变信息,与RNA-seq数据进行整合分析,分析了基因组变异如何通过三维基因组影响转录调控。结果表明,大多数癌症表达失调是由于反调节机制。值得注意的是,细胞粘附途径在两个基因组中均出现富集(图4B),表明肺癌中特定途径的失调可能与3D基因组改变有关。在5534T肿瘤样本中,更多区域受CNVs影响的染色体含有更多的TAD变化和失调基因(图4C)。此外,5534T肿瘤样本中的突变主要发生在正常和肿瘤样本的组成性B区(图4D),表明CNV、三维基因组和基因表达之间存在显著关联。

图4.基因组、3D基因组和基因表达变化之间的相关分析。来源:Genomics, Proteomics & Bioinformatics

综上所述,该研究进行了一项开创性的3D基因组研究,证明了1× 104浓度的细胞足以进行原位Hi-C实验和获得空间结构信息,ADC患者原发性肺癌细胞的三维基因组结构与肺癌细胞系有显著差异。此外,该研究结果强调了三维基因组学在临床癌症样本研究中的重要性,并且对未来癌症三维基因组学研究提供了数据整合分析的流程。

该研究工作得到了国家自然科学基金、国家重点研发计划、北京大学“北极星”高性能计算平台的支持。李亭亭(军事科学院)、李瑞风(清华大学)、董旋(华大基因)、石林(复旦大学中山医院)、林淼(复旦大学中山医院)和彭婷(北京大学)为该论文共同第一作者。复旦大学附属中山医院临床医学研究院武多娇教授、碳云智能数字生命研究院王健副院长、北京大学生命科学学院李程研究员为该论文的共同通讯作者。

原文链接:https://www.sciencedirect.com/science/article/pii/S1672022921000966

李程研究组兴趣为三维基因组学实验和分析方法及其在再生生物学、健康衰老中的应用,目前在招聘生物信息学、分子生物学博士后,欢迎联系交流(http://3d-genome.life/)。

(0)

本文由 SEQ.CN 作者:白云 发表,转载请注明来源!

热评文章