近期,美国康奈尔大学、加利福尼亚大学欧文分校等机构的科研人员在Nature Communications发表了题为“Circulating cell-free RNA in blood as a host response biomarker for detection of tuberculosis”的文章。研究团队使用RNA测序和机器学习方法,在跨三个国家的患者队列中评估了血浆cfRNA作为结核病宿主反应生物标志物的效用;通过分析鉴定了一个6基因cfRNA特征,该特征在测试、训练和验证队列中的AUC分别为0.95、0.92和0.95,可有效区分结核病阳性和阴性个体,准确率高达91.8%。无论地理位置、样本采集方法和HIV感染状况如何,该特征均符合WHO TPPs要求(敏感性:97.1%,特异性:85.2%)。综上,该研究表明血浆cfRNA是一种有前景的诊断结核病的宿主反应生物标志物。
文章发表在Nature Communications
研究团队进行了一项病例对照研究,以调查结核病的cfRNA特征;分析了乌干达、越南和菲律宾三个队列中251名咳嗽持续至少两周患者的血浆样本(图1)。在上述251份血浆样本中,142份(56.6%)来自经微生物确诊的结核病患者,37份(14.7%)来自艾滋病毒感染者。接下来,研究团队使用NGS技术分析这些血液样本中的RNA,发现平均每个血浆样本有31,737,786个reads。
为确定样本中cfRNA的起源细胞类型,研究团队使用基于参考的反卷积算法(BayesPrism)进行分析,该算法使用参考数据集和贝叶斯推理识别起源细胞类型。结果显示,有呼吸道症状的患者血浆cfRNA主要来源于血小板、骨髓祖细胞、B细胞、内皮细胞、自然杀伤细胞、单核细胞和中性粒细胞;血小板贡献存在批次效应,三个队列之间的血小板贡献存在显著差异(平均比例为0.11、0.61、0.36),这些差异主要由不同队列研究中使用的样本采集管和血浆采集程序不同引起。
为深入了解结核病的宿主反应并评估cfRNA能否提供有关结核病状态的信息,研究团队对所有251个样本进行了差异丰度分析,在结核病阳性组和阴性组之间共鉴定出1,956个差异丰度基因。与阴性组相比,结核病与巨噬细胞标志物、中性粒细胞标志物、干扰素基因、抗微生物基因水平升高相关。此外,肺结核患者肺部特异性标志物(SFTPC、SFTPB、SLC34A2、SFTPA1、SFTPA2)水平也升高,这为了解正在进行的致病过程提供了线索。研究团队使用Ingenuity Pathway Analysis软件对上述发现相关性进行证实,显示在结核病中富集的经典通路包括中性粒细胞脱颗粒化、干扰素γ信号传导和抗菌肽通路。
图1. 血浆cfRNA图谱。
血浆cfRNA中差异丰度基因可用于开发结核病的分诊测试和诊断分析。为此,研究团队将样本分为“发现”队列(队列1、2)和“验证”队列(队列3),并将发现队列样本随机分为训练集(70%)和测试集(30%),对训练集进行差异丰度分析;使用调整后的p值(p<0.05)和基均值(均值>100)筛选特征,并使用筛选后的基因训练了15个机器学习分类模型。分析结果显示,大多数模型表现良好,8个模型的受试者工作特性曲线(ROC-AUC)下训练和测试区域>0.9。
在评估了不同机器学习模型性能后,研究团队发现贪婪前向搜索算法(greedy forward search)性能最佳,将该算法多次迭代,得到由GBP5、BNIP3L、KLF6、DYSF、LASP1、PCBP1组成的6基因特征(图2)。进一步,研究团队使用ROC分析在训练、测试和验证集中评估了6基因特征作为诊断或分类工具的效用。结果显示,6基因特征在三个数据集中的区分能力都很高,ROC-AUC分别为0.921、0.947、0.946。
在训练集、测试集和验证集中,6基因特征区分结核病阳性组和阴性组的准确率分别为91.5%、91.8%、88.3%,灵敏度分别为94.5%、97.1%、97.1%,特异性分别为87.7%、85.2%和76.0%。特别地,在测试集中,该特征超过了WHO TPP对分诊测试的最佳标准。
经鉴定,GBP5是对6基因特征性能贡献最大的基因,其在结核病阳性个体中的表达水平基本不受队列和样本采集的影响。进一步分析显示,6基因特征的区分能力不受地理区域、队列和HIV感染状况的影响。上述结果表明,6基因特征有可能成为结核病的分诊工具。
图2. 血浆cfRNA中鉴定出的6基因特征的性能。
为比较cfRNA和wbRNA对结核病的效用,研究团队将6基因cfRNA特征与先前报道的wbRNA特征进行比较(图3)。在符合WHO最低分诊测试标准的wbRNA特征中,有7个已在多队列人群中被评估过其区分结核病和其他疾病的性能。比较结果显示,与wbRNA panel相比,6基因cfRNA特征具有更好的性能;cfRNA特征的6个基因中只有GBP5与先前wbRNA研究中报道的基因重叠。
研究团队还比较了cfRNA和wbRNA的来源,发现其并不相同:血浆cfRNA来自血液中的细胞和血管化的实体组织,而wbRNA主要由循环免疫细胞释放。进一步,研究团队对结核阳性和阴性样本之间的cfRNA和wbRNA进行差异丰度分析, 分别鉴定出2,018个和1,956个差异丰度基因,其中517个基因是共享的。在6基因特征中,有3个基因在匹配的全血样本中也存在差异丰度,即GBP5、DYSF和BNIP3L,表明通过血浆cfRNA可深入了解全血RNA分析无法获得的细胞损伤机制。
图3. 6基因血浆cfRNA特征与文献中wbRNA特征的比较。
综上所述,研究团队评估了血浆cfRNA作为宿主特异性生物标志物检测结核病的效用;并利用RNA测序和机器学习发现了一个6基因特征,其具有较高的诊断准确性、敏感性和特异性,超过了WHO TPP对分诊测试的最佳标准。该研究还发现血浆cfRNA和wbRNA的来源存在差异,血浆cfRNA可比全血RNA更充分地捕捉到宿主对结核病的反应。这项研究为开发基于血浆cfRNA特征的结核病即时检测方法奠定了基础,可帮助改善结核病的诊疗。
论文原文:
Chang, A., Loy, C.J., Eweis-LaBolle, D. et al. Circulating cell-free RNA in blood as a host response biomarker for detection of tuberculosis. Nat Commun 15, 4949 (2024). https://doi.org/10.1038/s41467-024-49245-6
https://www.nature.com/articles/s41467-024-49245-6
本文由 SEQ.CN 作者:戴胜 发表,转载请注明来源!