前不久,中国科学家联合多个国家、地区的科研人员发布了人类首张“黑洞”照片,作为宇宙中的“暗物质”,一夜之间圈粉无数。
同样,在生命科学研究领域也存在大量如同“黑洞”般的“暗物质”,他们存在于基因组中非编码区域,因此也被称为基因组 “暗物质”。尤其是面对人类基因组中大量存在的暗物质非编码区域时,我们对其知之甚少!
来自中国科学院的陈润生院士是非编码核酸研究领域的权威专家,其研究团队已经发现和解析了大量的非编码基因。陈润生院士认为,自上世纪90年代组学大数据出现后,整个生命医学已经发生了深刻的变化,但这个变化才刚刚开始。以下是陈润生院士的精彩解读。
在漫长的生命科学研究中,我们根深蒂固相信的中心法则:由DNA转录成RNA,最后翻译成蛋白质。随着基因大数据的积累,人们发现不仅仅是中心法则中的信使RNA,绝大部分的遗传密码,几乎都可以产生多种类型的转录本。由此也引发了一些问题:到底有哪些转录本?这些转录本到哪里去了?这是大数据给我们的第一个宏观问题,就是“转录本的命运”。
目前还没有关于转录本“暗物质”命运的综合研究。从目前的研究来看,转录本的命运可以归为四类,简单来说即:不翻译、部分翻译,从头翻译,以及过度翻译。所以,从这个角度来看转录本的命运,我们过去关注的只是其中的一小部分,即从头翻译,很少关注不翻译、部分翻译和过度翻译的情况。
什么是不翻译?DNA转录出的RNA,除了mRNA还有non-coding RNA(ncRNA)等RNA。翻译机制需要在细胞质中进行,这些转录本如果只停留在细胞核中是无法翻译的。不翻译的RNA存在四种情况:(1)部分RNA始终以非翻译的RNA形式行使功能;(2)部分RNA虽然到了细胞核外,如果没有办法接触核糖体仍然不能翻译;(3)部分RNA接触了核糖体,但是无法完成翻译过程,也就没有翻译产物;(4)翻译产物一出现就立刻被降解了。
从以上的四点情况可以看出,有相当多的转录本是与中心法则没有任何关系的。整个基因组DNA转录出来的转录本,到底有多少进入细胞质?又有多少保留在细胞核中呢?希望大家能够关注这些方面的研究。根据我们团队做的基本统计和实验,发现大约有90% 的RNA会留在细胞核中,进入细胞质的大约只有11%。所以目前大多数针对RNA的分析,实际上不超过总RNA的11%。细胞核中90%左右的RNA作用是什么?命运又是怎样的?
此外,进入细胞质的11%的RNA中有一部分是mRNA以及非编码RNA。如果有机会接触到核糖体,这些非编码RNA约有1%的概率发生翻译。但大部分非编码RNA是不翻译的。mRNA在接触到核糖体后,会以比较高(28%~30%)的概率翻译成蛋白质。所以核糖体的翻译过程是一个动态过程,有一定的概率,并不是大家普遍认为的一成不变。
从不翻译RNA的研究结果我们可以总结两点:(1)迄今为止,大部分转录本我们尚未研究,所以相关信息分析还有很多工作要做;(2)非编码RNA和信使RNA的结构相似。但为什么翻译的概率相差几十倍?这是非常重要的基础问题,还需要信息分析来解决。此外,以上问题也从侧面说明,目前我们对生物医学大数据的利用率不高。未来,大数据分析和基因测序将成为常规研究手段,同时,转录本研究已经受到众多企业的关注。然而,各家企业面临的挑战是如何运用测序得到的转录本,并了解其生物学意义,这将为健康、疾病、生长、发育等研究带来极大的帮助。
除了不翻译的转录本之外,还有部分翻译的转录本。以往大家认为非编码RNA是不翻译成多肽和蛋白质的。但已有试验证明,某些长非编码RNA有可能翻译出一段短肽。这种短肽翻译自RNA的一部分信息,因此被称为部分翻译。
在中心法则中,mRNA是从起始密码子翻译到终止密码子。那么在非编码RNA中,又是从哪一点开始到哪一点结束呢?对此,我们的研究结果是,这种翻译依然遵从经典起始密码子甲硫氨酸,但只占不到50%。另外有六、七种三联体密码子也可以作为起始密码。
因此,长非编码RNA就有可能翻译成各种各样的短肽,它们是保守的还是可变的?又是如何调控的?我们的研究结果发现,非编码RNA的翻译产物是恒定的,不会随意变动。对于调控,研究发现调控元件是不固定的,也就是说不一定从起始密码子开始,也不一定是以终止密码子结束。但如何实现翻译产物的恒定呢?目前这个问题尚未解决。
从头翻译也就是中心法则,这已经形成了非常根深蒂固的认知。但研究已经证实,非编码RNA也能翻译。相信随着研究的深入,这个概念会慢慢被大家理解。
过度翻译多发生在环状RNA身上。环状RNA模板在翻译完一遍后,还可以继续翻译。但环状RNA有很多终止密码子,所以产物是随机的吗?我们发现,研究中某环状RNA有三种特定的过度翻译产物,包括16KD、18KD和23KD的多肽。
最后,我们仍需要关心的是,遗传物质的信息我们掌握了多少?它们变成了什么?例如转录本,目前我们只是了解了约10%。90%的转录本迄今为止我们并不了解,这并不是因为我们的技术、分析、工具不够先进,而是知识还没有达到。从整个转录本研究来看,我们离真正了解、掌握这些知识和运作规律还差得很远。
本文由 SEQ.CN 作者:戴胜 发表,转载请注明来源!