当前,机器学习分类器已成为处理放射学和组织病理学图像的颇具前景的新工具。近日,麻省理工学院科赫综合癌症研究所和麻省总医院的研究团队合作在Cancer Discovery发表了题为“Developmental Deconvolution for Classification of Cancer Origin”的文章。研究团队开发了一种新型深度学习模型“D-MLP”,可通过分析、比较早期细胞发育和分化相关的基因表达数据对未知原发性癌症(CUP)进行分类。该研究提供了肿瘤发育起源的系统图谱,为病理诊断提供了有效的工具,并提示发育分类可能是助力患者肿瘤治疗有潜力的方法。
文章发表在Cancer Discovery
主要研究内容
图1. 研究流程模式图。来源:Cancer Discovery
图2. 发育反卷积捕获正常和恶性细胞的信号。来源:Cancer Discovery
接下来,研究团队将肿瘤和胚胎细胞中发育基因表达模式之间的相关性转化为机器学习模型。将来自TCGA的肿瘤样本基因表达反卷积为与发育轨迹中特定时间点相对应的单个发育成分,并为每个发育成分分配数值,基于此构建了一个机器学习模型,称为发育多层感知分类器(D-MLP),该分类器可对肿瘤发育成分进行评分,并预测其起源。
图3. D-MLP分类器的构建与检验。来源:Cancer Discovery
图4. D-MLP分类器对CUP患者的诊断。来源:Cancer Discovery
研究团队在一位具有乳腺癌病史的患者中验证了D-MLP模型的预测性能。该患者腹部周围的液体空间中显示出侵袭性癌症的迹象,但肿瘤学家无法找到肿瘤块,也无法使用现有工具对癌细胞进行分类。D-MLP强烈预测了该患者卵巢癌的发生。在患者首次就诊六个月后,经过广泛的额外临床检查,医生的确在患者的卵巢中发现了一个肿块,并证实其是肿瘤的起源。
图5. D-MLP分类器对CUP患者的诊断-案例验证。来源:Cancer Discovery
结 语
综上所述,研究团队分析比较了TCGA肿瘤样本和MOCA单细胞数据,构建了人类肿瘤发育图谱,系统地量化了癌症生物学和发育程序之间的相似性。使用该图谱构建了一个能高精度预测肿瘤类型的D-MLP分类器。该研究证明可通过发育轨迹和肿瘤特征的整合对其他未分类的肿瘤实体进行诊断。
文章第一作者麻省理工学院博士后Enrico Moiso表示:“单细胞解析工具极大地改变了我们研究癌症生物学的方式,但我们如何使这场革命对患者产生影响是另一维度的难题。随着发育细胞图谱的出现,特别是那些关注器官发生早期阶段的图谱,如MOCA,我们可以将工具扩展到组织学和基因组信息之外,为分析、识别肿瘤以及开发新疗法提供了思路。”
参考文献:
1. Enrico Moiso et al, Developmental Deconvolution for Classification of Cancer Origin, Cancer Discovery 2022.
2. Lu MY, et al. AI-based pathology predicts origins for cancers of unknown primary. Nature 2021.
3. Cao J, et al. The single-cell transcriptional landscape of mammalian organogenesis. Nature 2019.
本文由 SEQ.CN 作者:白云 发表,转载请注明来源!