科研

首页 - 全部文章 - 科研 - SCI ADV | 王凯/周筠筠团队发表癌症体细胞突变AI注释平台——CancerVar

SCI ADV | 王凯/周筠筠团队发表癌症体细胞突变AI注释平台——CancerVar

新一代测序技术(NGS)和精准医学的发展使得数以百万计的体细胞突变被识别和鉴定。目前,研究人员已建立多个数据库对体细胞变异进行分类,以了解其是否与疾病的临床过程有关或影响疾病的发生发展。但不同的数据库并没有提供体细胞变异的标准化解释。2017年,美国分子病理学协会(Association for Molecular Pathology, AMP)、美国临床肿瘤学会(American Society of Clinical Oncology, ASCO)和美国病理学家协会(College of American Pathologists, CAP)联合提出了体细胞变异解释、报告和评分的标准及指南。

虽然已有标准指南,但AMP/ASCO/CAP分类方案并没有明确规定如何实施这些标准,从而导致不同知识库提供了不同的结果。此外,AMP/ASCO/CAP分类法依赖于已发表的临床证据来确定某一特定变异的作用,但当对某一特定变异使用相同证据时,时常出现模糊或混淆的分配结果。

为了解决上述难题,美国费城儿童医院王凯团队、周筠筠团队及合作者联合在Science Advances发表了题为“CancerVar: An artificial intelligence–empowered platform for clinical interpretation of somatic mutations in cancer”的文章。研究团队开发了一种改进版的体细胞突变体解释工具——CancerVar,是基于Python编程语言搭建的一个网络服务器,包含1,911个癌症相关基因中1,300万个体细胞突变的临床证据。用户可以使用染色体位置或蛋白质变化等信息查询变异的临床解释,并基于先验知识或其他用户指定的标准,交互式微调特定评分特征的权重。CancerVar能够自动生成总结描述性解释的文本,包括诊断、预后、靶向药物反应和许多热点突变的临床试验信息,大大减少了精准肿瘤学实践中临床医生的工作量

图片

文章发表在Science Advances

CancerVar功能概况和OPAI

CancerVar包含30种癌症类型和两个参考基因组版本的组学数据,用户可以在体细胞突变、基因和拷贝数改变(CNA)水平上进行查询。依据用户提供的输入信息,CancerVar可以生成一个输出网页,将信息组织成不同分类,包括整体解释、基因概述、突变信息、临床证据细节、临床出版物以及来自其他知识库的可交换信息等等。

此外,用户还可以手动调整输入信息,并根据之前的知识或经验进行重新解释,也可以利用体细胞突变的每个评分标准信息,计算其临床意义。根据2017年AAMP/ASCO/CAP的评分标准和指南,每个突变均有一个预测评分和临床分类类别。

图1. CancerVar的功能总结。来源:Science Advances

通过基于深度学习的方法,研究团队开发了一种基于人工智能的致癌优先级评分方法——Oncogenic Prioritization by Artificial Intelligence(OPAI)。OPAI可以利用不同计算工具预测的评分指标来确定一个突变的致癌性。与传统的深度学习算法不同,OPAI基于半监督生成对抗网络,该网络包含从真实癌症患者测序数据中观察到的但未分类的体细胞突变。目前,OPAI的功能和用户指令已经集成到CancerVar软件中,允许用户在未来根据自己的个性化需求来预测特定的变体。

图2. OPAI工作流程。来源:Science Advances

OPAI在预测致癌突变中的表现

如上所述,CancerVar的独特特征之一是包含了OPAI方法,能够预测从未在公共数据库中报告过的致癌突变。与传统的基于标记数据训练的模型不同,使用OPAI可以了解临床数据中收集的未标记突变的隐藏分布。

随后,研究团队评估了OPAI预测新型致癌突变的能力,将OPAI与现有的5种机器学习算法(包括梯度提升树、SVM、AdaBoostRF和XGBoost)进行了比较,并进一步比较了五种癌症类型(包括CanDrA、CHASM、CTAT-cancer和MutingAssessor)特异性驱动突变分析工具的性能,使用ROC曲线下面积(AUC)评分和真负率(特异性)作为性能检测标准。

结果显示,在基于6,226个体细胞变异的独立测试集中,与癌症特异性驱动因子预测方法和任何其他单个功能预测工具相比,CancerVar中的OPAI方法均表现最佳(AUC-ROC = 0.854) 。图片

图3. OPAI性能评估与比较,来源:Science Advances

应用案例:前列腺癌FOXA1体细胞突变的综合解释

最后,研究团队展示了CancerVar对前列腺癌FOXA1突变的临床解释。前列腺癌是全世界男性中最常见的癌症。已有研究表明,FOXA1蛋白对前列腺的正常发育至关重要,FOXA1体细胞突变在前列腺癌中经常检测到,并与不良预后相关。2019年,两项研究表明FOXA1在前列腺癌中充当致癌基因,其中R219的热点突变(R219SR219C)能够驱动前列腺癌的发生。

研究团队在CancerVar网站服务器上使用蛋白质变化和基因名称“FOXA1”搜索错义突变R219C,结果显示,CancerVar中没有任何治疗、诊断或预后的证据来证明这种突变。根据AMP/ASCO/CAP/CGC指南,这种变体属于“III级不确定意义”类,得分为7分;但基于OPAI模型的评估则显示该变异得分为0.99,表明其极有可能致癌。上述应用案例表明,在给定现有知识和领域专业知识的情况下,半自动解释方法可以极大地提高每个突变的预测精度。此外,包含机器学习的智能模型也可以作为支持基于规则方法的额外证据。

图4. FOXA1体细胞突变的综合解释。来源:Science Advances

癌症体细胞突变的临床解释对于临床医生和精确肿瘤学领域的研究人员非常重要。CancerVar是一个标准化、快速和用户友好的变体解释工具,是癌症突变知识库的增强版本,为癌症的体细胞突变提供了完善的、半自动的临床解释,有助于半自动起草临床报告。

文章通讯作者Kai Wang博士表示:“在临床环境中,CancerVar不会取代人类解读,但它将显著减少工作人员在精准肿瘤学实践中对通过测序确定的突变进行分类和起草临床报告的手工工作。CancerVar能够协调各种类型的临床证据,包括药物信息、临床证据和体细胞突变的详细模式,然后通过提供标准化、可复制和精确的输出来解释体细胞变异。”

Kai Wang博士还提道:“这一工具展示了我们如何使用计算工具来自动化人类生成的指导方针,以及机器学习如何指导临床决策制定,未来的研究也将探索该框架应用到病理学的其他领域。”

参考文献:
1. Quan Li et al, CancerVar: An artificial intelligence–empowered platform for clinical interpretation of somatic mutations in cancer, Science Advances (2022).DOI: 10.1126/sciadv.abj1624
2. A. H., et al., A harmonized meta-knowledgebase of clinical interpretations of somatic genomic variants in cancer. Nat. Genet. 52, 448–457 (2020).
3. B. M., et al., A census of pathway maps in cancer systems biology. Nat. Rev. Cancer 20, 233–246 (2020).
(0)

本文由 SEQ.CN 作者:白云 发表,转载请注明来源!

关键词:

热评文章