scCASE发表于Nature Communications
scCASE基于非负矩阵分解,引入了可迭代优化的细胞间相似性矩阵,有效整合相似细胞的表观信号以克服数据噪声。通过在多个数据集上进行综合评估,研究团队系统地展示了scCASE相较于其他方法在数据增强、下游分析、鲁棒性等方面的优势。增强后的单细胞染色质开放性数据能够有效地刻画细胞异质性信号,提升细胞聚类、可视化等下游分析的质量。通过广泛的组织特异性表达富集、生物学功能富集和遗传力富集分析,研究团队揭示了scCASE具备良好的模型解释性,能够为细胞亚群提供有价值的生物学见解。研究团队还提供了scCASE的多个扩展方法,并展示了其在测序深度矫正、批次效应矫正、以及结合参考数据进行弱监督学习的潜力。
scCASE模型示意图
相较于单细胞转录组测序而言,现有的单细胞表观基因组测序难度与成本较高,且灵敏度与通量较低,因此,如何通过计算方法基于其他组学的单细胞数据生成相应的单细胞表观基因组数据,从而构建更为全面的表观细胞图谱,是一个亟待解决的问题。
scButterfly发表于Nature Communications
scButterfly基于耦合变分自编码器和对抗学习策略,在语义级别对不同组学的潜在表示进行对齐,以学习跨组学数据间的联系,并提出了多种有效的数据扩增方法。通过在多个数据集上进行综合评估,研究团队系统地展示了 scButterfly相较于其他方法能够更有效地在多种复杂情况下完成单细胞数据的跨组学转换,同时为不同组学数据提供有价值的生物学见解。此外,研究团队还介绍了 scButterfly在多组学整合分析、多组学数据增强以及scATAC-seq数据细胞类型注释等方面的广泛应用,并展示了scButterfly利用数据扩增及最优传输策略,推广至非配对数据训练和扰动响应分析的能力。最后,研究团队介绍了scButterfly从表观组经转录组到蛋白组的连续转换能力,以及揭示细胞类型新标志物的潜力。
scButterfly模型示意图
2024年5月10日,陈盛泉课题组联合清华大学自动化系江瑞课题组在Nature Computational Science上在线发表题为“Discrete latent embedding of single-cell chromatin accessibility sequencing data for uncovering cell heterogeneity”的研究论文[3],提出了一种名为CASTLE的单细胞染色质开放性数据离散嵌入表示方法,被美国新泽西理工学院Zhi Wei教授发表在Nature Computational Science上的观点文章评价为“CASTLE is poised to play a key role in unraveling the intricate regulatory landscape of the genome and its impact on cellular diversity, enabling biological discoveries and translational applications in fields ranging from developmental biology to precision medicine.” [4]。清华大学自动化系2019级直博生崔雪建为论文第一作者,清华大学江瑞教授和南开大学陈盛泉副教授为论文通讯作者。
CASTLE发表于Nature Computational Science
CASTLE基于向量量化变分自动编码器(VQ-VAE),引入了自适应更新的离散化隐空间codebook,为单细胞表观基因组数据提供了可解释的建模思路。研究团队在多个数据集上验证了CASTLE相较于其他方法具有更强的细胞类型辨识能力和可视化效果。基于模型训练得到的codebook可以得到细胞类型特异的特征频谱,直观、定量地刻画细胞表观异质性。同时,CASTLE能够识别细胞类型特异的染色质开放区域,结合丰富的下游分析,研究团队揭示了CASTLE解析特定细胞类型或组织的基因调控机制的潜力。此外,CASTLE能够充分利用外部参考数据,无论参考数据是否带有标签均能优于基准方法,并且在运行时间和内存使用方面均具备高效性。
CASTLE模型示意图
陈盛泉,2017年7月本科毕业于厦门大学自动化系,2021年12月博士毕业于清华大学自动化系,2022年1月至今任南开大学数学科学学院副教授,主要研究方向为单细胞数据建模与解析。现主持国家自然科学基金一项,以第一或通讯作者身份在Nature Machine Intelligence、Nature Communications、Nature Computational Science、Genome Biology、Nucleic Acids Research、Genome Research等期刊发表学术论文22篇。曾获得4次国家奖学金、2021年获评清华大学“学术新秀”称号,2023年入选国家青年人才托举工程。
个人主页:
https://my.nankai.edu.cn/sms/csq/list.htm
课题组主页:
https://biox-nku.github.io
本文由 SEQ.CN 作者:白云 发表,转载请注明来源!