近期,德国德累斯顿工业大学、亥姆霍兹慕尼黑环境与健康研究中心等机构的研究人员在Cancer Cell上发表了题为“Transformer-based biomarker prediction from colorectal cancer histology: A large-scale multicentric study”的文章。研究团队开发了一种新的基于Transformer的分析框架,通过将预训练的Transformer编码器与用于补丁聚合的Transformer网络相结合,从CRC常规病理切片中进行端到端的生物标志物预测。通过对来自16个队列13,000多名结直肠癌患者组成的大规模、多中心队列进行训练和评估,该方法在手术切除组织样本的MSI预测方面达到了99%的灵敏度,阴性预测值超99%。与当前最先进的算法相比,基于Transformer的方法大大提高了预测性能、通用性、数据效率和可解释性。
文章发表于Cancer Cell
研究团队通过两种方式在CRC患者手术切除队列中,评估了基于Transformer的框架的MSI预测性能(图1)。首先在单个队列上训练模型,并在保留测试集(内部)和所有其他队列(外部)上进行测试。结果显示,在大型队列中(如DACHS、QUASAR、TCGA或NLCS),该模型AUC为0.95左右;该方法性能上述四个队列中均优于基于CNN的方法。此外,在早期发病CRC中,该方法也实现了接近0.9的AUC。
接下来,研究团队在除YCR-BCIP外的所有CRC切除队列上训练了模型,并在外部验证队列YCR-BCI上对其进行了评估。结果显示,模型灵敏度为0.99,阴性预测值超0.99。具有不同临床病理特征的患者ROC分析表明,该模型在所有亚组中表现良好。0.86的高平均AUPRC分数表明,尽管队列中部分MSI样本存在严重的类别不平衡,但基于Transformer的模型仍实现了高灵敏度和高精度。
为更好地与最先进的技术进行比较,研究团队使用相同的特征提取器CTransPath在上述四个大型队列上训练了AttentionMIL和完全基于Transformer的模型。基于CNN的方法实现了0.96的AUC,AttentionMIL为0.96,而完全基于Transformer的方法表现略好,AUC为0.97。上述结果表明,完全基于Transformer的方法在大队列和小队列上都能产生较高的生物标志物预测性能。从临床角度来看,基于Transformer的方法具有更好的泛化性能,能够产生更可靠的结果。
图1. 工作流程概述。来源:Cancer Cell
研究团队探究了完全基于Transformer的模型在其他生物标志物预测任务中的性能,如BRAF和KRAS。按照MSI预测的实验设置,研究团队首先在单个队列上对模型进行了训练,并在外部队列上进行了评估,然后在一个完全合并的多中心队列上对模型进行了训练。结果显示,模型在大队列中(DACHS和NLCS)表现较好,AUC分别为0.88和0.87;在较小队列中性能略差,AUC为0.83-0.85,但远远优于先前方法。此外,大型多中心队列中,该模型的AUC为0.88,几乎达到临床级表现。
将KRAS作为研究目标时,研究团队观察到了类似的泛化结果,在多中心队列上训练时,模型AUC为0.80,优于最新方法;单队列训练的AUC为0.53-0.77,与最新数据一致或更高。上述结果表明,基于Transformer的模型可以预测与CRC常规诊断相关的多种生物标志物。
图2. 评估生物标志物MSI、BRAF和KRAS在单个队列和大规模多中心实验中的性能。来源:Cancer Cell
在先前研究中,几乎所关于CRC中生物标志物的预测分析都是通手术切除切片进行的,因此,商业上可用的MSI检测算法仅用于切除切片。但最近的临床研究表明,MSI阳性的CRC患者需要在手术前进行免疫治疗,这就导致需要在活检材料上进行MSI检测。为解决上述难题,研究团队使用YCR-BCIP以外的所有队列的手术切除样本训练了模型,并对来自1,592名YCIP-BCIP结直肠癌患者的活检组织进行了评估(图3)。
当对两个外部队列(YCR-BCIP和MAINZ)的活检中分别进行验证时,基于Transformer的模型的平均AUC评分分别为0.92和0.86。值得注意的是,MAINZ活检队列的MSI-high比率高于训练队列。该方法表现优于现有方法,并在对切除标本的模型训练后,在活检中取得了临床级的性能。当选择具有高灵敏度的分类阈值时,与切除样本相比,活检中所有阳性预测病例中,正确MSI阳性预测病例的比率较低。
在切除样本的内部测试集上固定分类阈值时,基于Transformer的模型分别获得0.98和0.91的敏感得分,这些值高于或接近临床批准的用于切除样本的DL算法,这表明该算法能够用于临床活检。
图3. 基于Transformer的模型可实现活检的临床级性能。来源:Cancer Cell
研究团队对基于Transformer的模型的预期临床用途如下(图4):首先,患者前往疑似CRC或进行常规CRC的诊所筛查,结肠镜检查显示可疑肿瘤,经组织学评估发现为腺癌。随后,通过基于Transformer的模型进行活检,以检测MSI/MMR状态和BRAF/RAS突变状态。最后,根据MSI、BRAF和KRAS状态,为患者选择最合适的治疗方法。
同样,在转移性疾病中,活检组织中存在MSI将使患者有资格接受姑息性免疫治疗。由于对活检组织的敏感性很高,基于Transformer的AI算法模型可作为一种预筛查工具,随后再进行肯定测试。综上,应用基于AI的生物标志物预测可以降低检测负担,加快活检和分子测定MSI-high状态之间的步骤,从而使患者能够在适合的情况下更早接受免疫治疗。
图4. 预期的MSI高分级器活检的临床工作流程。来源:Cancer Cell
综上所述,该研究提出了一个完全基于Transformer的模型来预测CRC的MSI,可加快组织样本的分析,从而更快地做出治疗决策,提供了与CRC患者活检临床测试相当的结果。在外部验证队列中,该模型在切除样本中的AUC为0.97,活检组织中的AUC为0.92和0.86。与现有的最先进的MIL或CNN方法相比,该方法具有更好的泛化能力和数据效率。
本文由 SEQ.CN 作者:戴胜 发表,转载请注明来源!