该研究中,研究人员采集了2576例cfDNA,其中包含来自2019年1月至2020年1月在8家参与医院就诊的1074名结直肠癌(CRC)患者、356名进展期腺瘤(ADA)患者,80名其它癌种(肝癌、胃癌、食管癌和肺癌)患者及1066名对照,对这些样本进行了全基因组5hmC水平的分析(实验设计如图1所示)。其中,来自上海及浙江地区四家医院的样本(含664例I至III期结直肠癌,144例四期或者分期不明结直肠癌,246例腺瘤,960例对照)作为训练及内部验证集,来自国内另外4家医院的样本(266例结直肠癌,110例腺瘤,106例对照)作为外部验证集。
图1 实验设计图
排除了年龄、性别因素的差异后,训练集中共得到1391个在I-III期结直肠癌/腺瘤和健康对照有显著差异(p<0.01)的基因区域,经过逻辑回归和弹性网络归一化处理之后,得到由96个基因组成的模型。由这些基因组成的模型可以较好地区分健康对照和肠癌I-III期及腺瘤患者,在训练集、内部验证集和外部验证集的曲线下面积(AUC)分别为94.6%,92.6%和87.2%(图2A),也能分别较好地区分健康对照和肠癌I-III期(图2B,AUC分别为95.6%,94.3%和90.7%),以及健康对照和腺瘤患者(图2C,AUC分别为91.8%,87.9%和78.6%),均高于单独使用这些基因的区分能力(AUC一般在52.0%到65.2%之间)。而且,从健康到腺瘤再到肠癌患者,基于5hmC基因模型的判分呈现出逐步升高的趋势,这在训练集、内部验证集和外部验证集中都表现得很明显(图2D)。
图2 由96个基因组成的模型可以较好地区分健康人和肠癌I-III期及腺瘤患者
与基于5hmC的基因模型相比,传统血清标志物CEA区分健康人和肠癌I-III期患者的能力明显稍逊一筹,其在训练集、内部验证集和外部验证集的AUC分别为78.0%,77.1%和73.2%(图3A)。基于5hmC的基因模型,无论是从AUC来看,还是根据90%特异性下的灵敏度来看,正确识别腺瘤和肠癌I-III期患者的能力都优于CEA(图3C, 3D)。尤其需要指出的是,基于5hmC的基因模型可以纠正单独使用CEA被错判的案例,如图3B所示,内部验证集中215例肠癌I-III期患者,其中145例(67.4%,图3B中第二、三象限)因为CEA值小于5ng/mL的标准阈值而被错判,但基于5hmC的基因模型能够正确判别其中的124例(57.7%,图3B中第二象限),因此大大提高检测的灵敏度。
图3 基于5hmc检测的预测模型表现好于传统血清标志物CEA
对1391个在I-III期结直肠癌/腺瘤和健康对照有显著差异的基因区域进行功能注释,发现其中富集了多个与癌症相关的KEGG代谢通路,例如神经活性配体-受体相互作用,钙离子、MAPK、cAMP信号通路等(图4A)。共修饰分析发现六组互作/共修饰模块(图4B),这些模块中涉及到的诸多基因和结直肠癌的发病机理和转移相关,例如模块M2中的GJA1基因(编码间隙连接蛋白α-1,图4C,4D)不但是得到的96基因模型之一,而且有文献报道表明和结直肠癌免疫浸润相关,是表征结直肠癌预后的生物标志物之一。
图4 差异基因的功能分析
同为无创检测,美国一项研究表明基于血液的检测,相比粪便检测更容易被人接受。而市面上多款仅限于Sept9基因甲基化的血清检测,其检出结直肠癌的灵敏度只有约48%,检出腺瘤的能力则更低,只有21%的灵敏度和79%的特异性。基于血液cfDNA进行全基因组5hmC水平检测,其检出结直肠癌和进展期腺瘤的灵敏度优于CEA等目前常用的各种标志物,而且由于其无创的特点,可以更加方便地加以推广,从而有助于在结直肠癌尚可通过手术切除的发展早期被及时发现,因此具有很好的研究和临床应该前景。
论文原文:
https://doi.org/10.1158/1078-0432.CCR-24-0199
本文由 SEQ.CN 作者:白云 发表,转载请注明来源!