图1. 方法流程示意图
图2. AML scGPS在疾病组与对照组上的表达模式差异
研究团队将上述scGPS应用于八个不同bulk数据集的分类中。在分类效果上,相对于传统基于差异基因(differentially expressed genes)的表达特征以及在bulk数据上提取的基因表达特征, scGPS在不同bulk数据集中都显示了较高的准确性。
图3. AML scGPS与单细胞差异基因特征以及bulk基因特征的分类效果对比
为了验证scPAGE方法在其他疾病场景下的有效性,该团队进一步分析了脓毒症(sepsis)的单细胞数据,提取sepsis scGPS并应用于microarray数据的分类。结果显示,sepsis scGPS具有良好的分类效果以及较强的鲁棒性。此外,不同于AML 数据中单细胞基因特征普遍优于bulk基因特征的结果,在sepsis中,microarray差异基因特征优于单细胞差异基因特征。该结果更加体现了不同测序平台数据的差异与传统差异基因特征在特征转移(signature transfer)上的不足,以及scPAGE方法的优势。
图4.Sepsis scGPS与单细胞差异基因特征以及microarray基因特征的分类效果对比
综上所述,程立新团队提出了一种全新的数据嫁接方案,将单细胞基因特征应用于bulk数据分类,充分利用了单细胞数据的优势,提升了分类效果,实现了不同平台数据之间基因特征与生物信息的转移。
联系人:程老师,Email: easonlcheng@gmail.com
参考文献:
[1] Wang, R., Zheng, X., Wang, J., Wan, S., Song, F., Wong, M.H., Leung, K.S. and Cheng, L., Improving bulk RNA-seq classification by transferring gene signature from single cells in acute myeloid leukemia. Briefings in Bioinformatics (2022).
[2] Zheng, X., Leung, K.S., Wong, M.H. and Cheng, L., 2021. Long non-coding RNA pairs to assist in diagnosing sepsis. BMC Genomics (2021).
本文由 SEQ.CN 作者:白云 发表,转载请注明来源!