基础模型在医学领域有着巨大的潜力。经过自监督学习预训练(如图像重建)后,基础模型可以应用于特定任务,提高泛化能力,尤其是在数据集较小的情况下。自监督学习在医学影像中的应用主要集中在二维(2D)图像(X射线、全切片图像、皮肤病学图像、眼底图像等)的诊断方面。在预后方面,自监督学习是否有助于训练基础模型用于生物标志物发现呢?
哈佛医学院的研究团队及合作者在Nature Machine Intelligence发表了题为“Foundation model for cancer imaging biomarkers”的文章,研究了基础模型是否可以改善基于深度学习的影像生物标志物的发现,特别是在有限的数据集规模情况下。
文章发表在Nature Machine Intelligence
首先,研究团队利用2312名患者的计算机断层扫描(CT)成像中识别的11,467个经注释的病变数据集进行了自我监督预训练(图1a),开发了一个深度学习基础模型。该模型首先通过对病变解剖部位进行分类,从而进行技术验证(用例1)。随后,该模型被应用于两个临床相关应用:开发预测肺结节恶性程度的诊断生物标志物(用例2)和非小细胞肺癌(NSCLC)肿瘤的预后生物标志物(用例3;图1b)。
图1. 研究概览。
01预训练策略选择
作为基础模型的技术验证,研究人员开发了分类模型来预测训练和调整数据集上的解剖部位,共3830个病变(用例1,图1b)。结果发现,与比较的基线方法相比,基础模型的实现显示出优势(图2c,d)。微调基础模型的平均精度为0.857,在平均精度层面显著优于所有基线方法。平衡准确度也有所改善,为0.804。
为了评估基础模型的普适性,研究人员选择了一个非分布任务和分类模型来预测LUNA16数据集中507个肺结节的恶性程度(图1b中的用例2),然后在170个结节的单独测试集进行了性能评估。结果显示,微调基础模型的曲线下面积(AUC)为0.944,平均精度为0.953,显著优于大多数基线实现性能(图2e,f)。对于从该基础模型中提取的特征,类似于用例1,其性能超过了基于基线特征的实现性能。
图2. 病变解剖部位(用例1)和结节恶性分类(用例2)的预训练策略和性能评估的比较。
研究团队在临床相关用例3中评估了新基础模型的有效性,以捕获NSCLC的预后放射学表型。使用来自HarvardRT队列的数据训练和调整预测模型,以预测治疗后2年的总生存期,然后比较基础模型和基线实现在两个独立测试队列中的性能,LUNG1和RADIO (图3)。
图3. NSCLC预测基础模型的性能(用例3)。
02基础模型的稳定性
图4.输入和测试-重测试基础模型的稳定性。
03微调基础模型的显著性
图5.微调基础模型的显著性图。
04基础模型的基本生物学基础
通过分析RADIO数据集中130名参与者的与模型预测相关的基因表达数据,研究人员探究了基础模型的生物学基础。研究选择了前500个基因并进行了相关性分析,将基础模型和微调基础模型预测与基因表达谱进行了比较,发现基因表达谱与基础模型预测之间的绝对相关系数显著较高,表明与潜在的肿瘤生物学有更强的相关性(图6a)。此外,基因集富集分析显示,基础模型显示出免疫相关途径的富集模式,微调基础模型没有观察到可识别的模式(图6b)。
图6.基础模型的基本生物学基础。
综上所述,该研究证明了基础模型在发现新影像生物标志物方面的巨大潜力,及其在数据集有限的情况下的特殊优势。这些生物标志物可能扩展到其他临床应用场景,并可以加速影像生物标志物向临床环境更广泛的转化。该文章第一作者Suraj Pai表示:“鉴于影像生物标志物研究是为了回答越来越具体的研究问题而量身定制的,我们相信这一工作将使研究更加准确和高效。”
2.https://medicalxpress.com/news/2024-05-foundation-cancer-imaging-biomarkers.html
本文由 SEQ.CN 作者:白云 发表,转载请注明来源!