2022年11月14日,Nucleic Acids Research在线发表了中科院生物物理所健康大数据研究中心团队的研究文章“NPInter v5.0: ncRNA interaction database in a new era”(图1),发布了最新版的NPInter(NPInter v5.0)。研究团队对非编码RNA分子多维度的相互作用以及相关分子进行了详细的注释以及可视化,提供了一个全面、系统的非编码RNA相互作用的研究平台。
图1:文章发表于Nucleic Acids Research
陈润生院士课题组于2006年发布了NPInter数据库的第一个版本(Nucleic Acids Research)。在过去的十几年中,NPInter数据库一直获得业内的广泛认可,被RNAcentral收录为专家数据库,迄今为止,已经更新过四个版本。本次更新,内容方面除了对NPInter第四版涉及到的相关内容进行扩充外,也关注于非编码RNA相互作用在热点领域如肿瘤生物学和新冠病毒中的研究,致力于为用户提供非编码RNA分子多维度多领域的相互作用及功能注释参考(图2)。
图2:NPInter v5.0数据库
此次NPInter v5.0更新,数据量有较大幅度的增加,来自文献挖掘和高通量测序数据分析的RNA相互作用数据条目从原有的1,100,618条增加到了2,596,695条(不包括RNA-DNA相互作用对),其中包括来自5,143篇文献中的8,586条非编码RNA相互作用对,由实验验证的非编码RNA相互作用数目得到了较大提升。
整合了多对多RNA-DNA相互作用数据,对来自iMARGI、ChAR-seq、GRID-seq的高通量测序数据结果进行了收集与整合。这三种测序方式都能够同时对所有与染色体相互作用的非编码RNA进行定位与鉴定,极大地增加了RNA-DNA的相互作用条目以及与染色体相互作用的非编码RNA分子数目。其中RNA-DNA相互作用数目从原有的888,915条增加到了8,329,382条,非编码RNA分子数从原有的15增加至16,806。
对新冠病毒SARS-CoV-2相关RNA相互作用进行了整合与展示,为了给寻找抗SARS-CoV-2病毒药物靶点方面提供全面的参考,提出了专门针对于SARS-CoV-2 RNA相互作用的集合,其中包括病毒与宿主之间不同类型相互作用的五个面板(共1567条相互作用对)。
对肿瘤单细胞RNA-seq(scRNA-seq)数据细胞特异表达lncRNA的鉴定与注释及相互作用分子的展示,从20种肿瘤scRNA-seq测序数据中鉴定出细胞亚型特异表达的lncRNA, 并展示了数据库中已存在的这些lncRNA的相互作用对,最终鉴定出了来自248个细胞亚型的1442个lncRNA,为肿瘤中的非编码RNA相互作用提供了一定的参考。
本次更新对网站也进行了升级,针对SARS-CoV-2病毒相关RNA相互作用和单细胞RNA-seq数据细胞特异表达lncRNA的展示增加了相应的模块,浏览页面增加了与基因组相互作用的非编码RNA分子的整理与展示。此外,根据用户反馈,为了展示RNA结合蛋白(RBP)更为具体的相互作用和功能,NPInter网站中整合了名为RBP的新模块。该模块列出了数据库中的277个RBP,并展示了RBP的function、localization和domain三个属性(图3)。
图3:NPInter数据整合。来源:Nucleic Acids Research
综上,NPInter非编码RNA相互作用数据资源平台涵盖了非编码RNA与蛋白质、RNA和基因组全方位多维度的相互作用,提供了更加丰富的相互作用及分子功能注释,并为热点研究领域如肿瘤生物学和新冠病毒的研究提供了新的参考。
原文链接:
https://academic.oup.com/nar/advance-article/doi/10.1093/nar/gkac1002/6827104
本文由 SEQ.CN 作者:白云 发表,转载请注明来源!