近年来,人工智能(AI)在辅助诊断方面显示出巨大潜力,但现有AI工具在帮助遗传学家进行初步诊断方面的进展仍然有限。因此,目前迫切需要高效、系统和全面的方法来提高罕见和未确诊遗传病的诊断速度和准确性。
为解决上述难题,美国得克萨斯州儿童医院和贝勒医学院Duncan NRI研究所的科研人员合作在NEJM AI发表了题为“AI-MARRVEL—A Knowledge-Driven AI System for Diagnosing Mendelian Disorders”的文章。研究团队开发了一种新的AI机器学习系统,称为AI-MARRVEL(AIM),可根据患者的临床特征和测序图谱对孟德尔遗传病的潜在致病基因或变异进行优先排序。AIM利用已知变异和遗传分析的大型、公共数据库(MARRVEL)进行训练,能够辅助临床医生确认罕见遗传病的致病变异,并以此提高诊断潜力。该研究表明,AIM在诊断准确性方面优于现有其他方法,并且兼具耗时少这一优势。
文章发表在NEJM AI
主要研究内容
研究团队基于随机森林算法开发了机器学习模型AIM,并使用MARRVEL数据库中来自数千个确诊病例的超350万个变异进行训练。特别地,在训练AIM时,研究人员还加入了美国医学遗传学和基因组学委员会(ABMGG)认证专家临床诊断和决策的高质量样本及其设计的特征,以再现分子诊断中错综复杂的决策过程。
在向AIM提供罕见病患者的外显子组序列数据和症状后,AIM即可提供最可能导致其罕见病的候选基因排序。此外,AIM的模块还可在不依赖目标基因相关临床知识的情况下进行预测,有助于推进新疾病机制的发现。
为将AIM与其他基准模型进行比较,研究团队在来自贝勒遗传学、未确诊疾病网络(UDN)和破译发育障碍(DDD)项目的三个真实世界数据队列中评估了这些模型,并选择免费、本地可编程访问的算法作为基准测试算法。结果显示,AIM始终将诊断基因列为第一候选基因的情况是所有其他基准方法的两倍,其显著提高了遗传诊断准确率。
进一步分析发现,在AIM预测结果中,每个个体携带15.5个在ClinVar数据库中被归类为致病性的遗传变异。这提示医生仅依靠ClinVar信息不足以进行准确诊断,而将AIM作为补充可区分诊断性和非诊断性致病性变异。
分子诊断通常通过两个因素的联合考虑来实现:分子证据和表型匹配。为评估不准确表型信息对AIM预测的影响,研究团队将表型相关特征设置为最小值,并模拟了表型信息与诊断基因完全无关的极端情况。结果显示,即使使用完全不相关的表型信息,AIM仍达到了很高的准确率,并优于所有其他基准方法,这表明分子证据数据至关重要。
图1. 准确的AIM诊断需要高质量的表型和分子特征
为解析AIM如何实现准确预测,研究团队开发了一种“特征攀爬”方法,通过扰动特征值并重新运行预测来评估每个特征的贡献;将每个特征的效应大小量化为预测得分与通过扰动可实现的最小值之间的最大差异,所有特征都根据其生物学意义分为不同的类别。
结果显示,当干扰次要等位基因频率(MAF)时,观察到最大的效应大小,其次是疾病数据库中的变异管理状态和表型匹配;但所有纳入特征的效应大小无显著不同。上述结果表明表明,AIM模型进行预测时,没有一个单一的因素是决定性的;具有相同诊断基因/变异的患者可能由于环境影响、不完全遗传或遗传背景变化而表现出不同的疾病表现。
图1. 准确的AIM诊断需要高质量的表型和分子特征
目前,临床基因诊断的准确率为30%-40%,这导致了大量未解决的病例积压,使得人工定期审查成本高昂且劳动密集。每年都有数百个新致病变异被发现和报道,这为诊断先前未解决的病例提供了机会,但由于病例数量庞大,需要一种自动化的方法来对其进行重新评估,以确定那些现在可诊断的病例。因此,AIM为多年来悬而未决的罕见病病例带来了新的希望。
研究团队开发了一个交叉样本置信度评分指标来代表使用AIM在患者中正确识别诊断变异的可能性,可将患者分为高、低高置信度两组:高置信度组患者进行人工审查,低置信度组患者推迟到随后的再分析周期。接下来,研究团队在一组UDN和DDD的病例(871例)数据集中评估了AIM的再分析功能。结果显示,AIM准确率达到98%,能正确识别出57%可诊断的病例。值得注意的是,在AIM中,有56%诊断变异被归类为高或中等置信度。
为评估置信度评分识别可诊断病例的能力,研究团队在三个数据队列中进行分析,收集确诊的患者,并将其标记为阳性(n=275),新发诊断变异患者的未受影响亲属标记为阴性(n=596)。结果显示,精确率—召回率曲线AUC为0.82,表明AIM能有效识别可诊断病例。
图3. 高通量再分析的交叉样本置信度评分
当候选基因或变异尚未与任何疾病相联系时,基因诊断过程将变得更加复杂。为此,研究团队设计了AIM—NDG模型,其消除了与已建立的疾病数据库(如OMIM、ClinVar和HGMD)直接或间接相关的所有特征。虽然这会导致准确性下降,但AIM-NDG的性能仍与其他基准工具的性能相当。
研究团队评估AIM—NDG模型在现实世界中的有效性,在两个UDN病例中,AIM正确预测了两个新报道的致病基因:MYCBP2和TMEM161B。经AIM—NDG计算,MYCBP2的置信评分为88,TMEM161B的置信评分为51,研究团队估算这两个基因应分别在首选候选基因排名的前3名和前2名之内。上述结果证明了AIM—NDG在识别可能的新致病基因和变异方面的潜力。
图4. 将AIM模型扩展为不同应用场景
结语
综上所述,研究团队开发了AI-MARRVEL,可帮助优先确定孟德尔遗传病的潜在致病基因/变异。通过减少潜在的鉴别诊断和/或潜在的候选基因,以及对未诊断病例进行快速、经济的大规模自动再分析,AIM可以提高诊断效率并减少工作量,从而对遗传性疾病的诊断方式产生巨大影响。与现有传诊断方法相比,AIM准确性更高。AIM的在线版本可在https://ai.marrvel.org获得。
文章通讯作者,贝勒遗传学院分子与人类遗传学副教授、临床副主任刘鹏飞博士表示:“我们的目标是通过创建一个知识和AI驱动的系统来提高预测的准确性、加速发现新疾病基因并节约成本。希望AIM工具能为临床遗传学诊断领域带来重大进展。”
共同通讯作者刘占东博士说道:“我们训练AIM模仿人类做决定的方式,机器可以更快、更高效、成本更低,这一方法有效地将准确诊断率提高了一倍。”
本文由 SEQ.CN 作者:白云 发表,转载请注明来源!