非编码DNA查看源代码讨论查看历史
非编码DNA(或称“垃圾DNA”),是指不包含制造蛋白质的指令,或是只能制造出无转译能力RNA的DNA序列。此类DNA在真核生物的基因组中占有大多数。有很长的一段时间科学家们没有认为这些非编码的作用,因此,这些重复的DNA片段被冠以垃圾DNA的称号。随着时间的推移,科学家们对垃圾DNA的认识逐渐深入,慢慢地发现其实很多非编码DNA有着其独特的作用,它们在基因剪切等方面起重要的作用。
功能争议
非编码区的数量与生物进化程度有密切关系,在微生物中,非编码区只占整个基因组序列的10%—20%;但在高等生物和人类基因组中,非编码序列则占了基因组序列的绝大部分。
长期以来,对非编码区的一个主要研究方向是对调控元件的研究。因为在非编码区,只有一小部分已被证实为有用成分,能帮助基因开启和关闭以调控基因的表达,即大名鼎鼎的调控DNA。大部分非编码DNA仍处于争议中,因为它们的功能尚未被认知,因此人们不知道它们是否应该被认为是垃圾。
研究人员发现,以往的研究方法对调控DNA数量的监测与其真实存在数量有一定差距,而这一差距经过纠正后,调控DNA的影响可能远比人类先前所认识的更加丰富。该发现有助于科学家进一步分析调控元件对遗传性疾病的作用,也必将会引起有关于非编码DNA“垃圾论”的新一轮争辩。 研究结果发表在2007年12月13日的《基因组研究》期刊网络版上。 发现这一问题的是美国约翰霍普金斯遗传医学研究所的麦考林博士研究小组。
传统查找调控序列的方法是比较远缘物种的DNA,理论上,功能性重要区域将比非功能性区域出现更多的相类似序列,然而麦考林小组发现,这种方法存在严重问题。研究小组在对神经元发育所需基因周围的DNA序列进行了详尽的分析研究后证实,计算机程序在扫描基因组时,会遗漏60%以上的重要DNA区域。
麦考林小组正在规划利用其他神经细胞基因开展研究。他认为,调控元件通过调节每个细胞的基因活性,将在人类的身体中创造种种不同的细胞类型。
已知有超过1500种基因与遗传性疾病的发生有密切关系,而基因的正常表达离不开调控元件的参与,某些调控元件的异常还会导致临床表现与相应基因编码区的疾病突变。
这一研究表明,非编码区调控元件的数量比原有的估计有新突破,这将对治疗帕金森症和精神失常有深远意义。 [1]
已知功能
科学家们已经发现:“垃圾”DNA的功能之一就是调节基因的活动,如同一道指令一样,控制着基因。一些控制基因开和关的特殊蛋白(转录因子)能特异识别基因附近的非编码“垃圾”DNA,通过与它们相互作用参与基因的抑制与激活。科学家还发现,大多数基因的开启和关闭是由附近的“垃圾”DNA控制的。它们就像是基因的“分子”开关,调节基因的活动。例如,在酵母中,大约30%基因上游的非编码DNA在基因调控中发挥作用。在拥有更大基因组的哺乳动物中,虽然特殊的有功能的“垃圾”DNA的分布要比在酵母中分散,但却在编码蛋白序列的上下游区域内呈簇分布。特别在人中,许多的“垃圾”DNA序列的变化与复杂疾病如关节炎、共济失调症等的发生息息相关。不同个体对药物的反应、对疾病易感性的差异在很多情况下也是由一些特殊的“垃圾”DNA调节的。甚至一些科学家猜想:可能正是“垃圾”DNA造成了人类个体间的差异。
在“垃圾”DNA家族中,还有一类特殊的群体,称为假基因。假基因与基因很像,但却不能产生功能性蛋白,常常被归类为“垃圾”DNA。科学家预计,人类假基因的数目竟然与正常基因的数量相似,大约有2万个左右,已鉴定的已超过12 000个。虽然假基因不能合成蛋白,但并不是说,它们不具有任何功能,研究发现“假”基因确有真本领。研究人员在对小鼠进行遗传改造的时候偶然造成了一个假基因的缺失,该小鼠的后代发生严重的先天性缺陷,并且寿命急剧缩短,可见这种假基因的作用不可小视,它对健康生命是必需的。该假基因是其对应的基因Makorin1的缺陷拷贝,长度不到其一半大,只能产生小分子mRNA(蛋白质合成的中介物),却不能合成蛋白质。尽管很小,但是这种“假RNA”有保护真基因免受破坏的功能。如果这个假基因在小鼠或者人类细胞中丢失的话,真基因的功能也不能正常发挥。研究人员推测,可能是由于假基因RNA看起来像Makorin1,它们掩护真基因,通过“牺牲”自己将不利因素引开,而保护真基因免受干扰。这可能是一种新的基因调节的方法。
“垃圾”DNA还能通过合成调节性RNA发挥功能。这些RNA并不是为了合成蛋白质,但却在生命的舞台上扮演着不同的角色。迄今为止,细胞中的snRNA、asRNA、snoRNA、miRNA、piRNA(microRNA)都是非编码“垃圾”DNA合成的。它们参与到基因活化、基因沉默、基因印记、剂量补偿、蛋白合成与功能调节、代谢调控等众多生物学过程中。2001年,芬兰科学家凯缇那领导的课题组发现了一个“垃圾”DNA区域,它合成的RNA可以与蛋白质结合,生成一种在线粒体中发挥作用的酶。当这个非编码RNA的关键位点发生变异,个体的健康和寿命都会受到威胁。
此外,“垃圾”DNA中还存在大量的重复DNA序列,这些DNA看似没有意义也不能编码蛋白质,却能形成特殊的DNA高级结构,并以此调节附近基因的活性。 [2]
绰号的由来
基因是具有遗传效应的特定DNA序列,通俗地讲,基因就是编码某种蛋白质的一段DNA。它们就像散落于天幕的星星一样,分散在人类的基因组中。而在这些基因间存在的大片大片的DNA 片段是不能编码蛋白质的,即“非编码序列”。由于功能不清,加州理工学院的大野·乾于1972年提出用“垃圾基因”的概念来形容它们。“垃圾”有多少呢?21世纪之初时,科学家还估计人类基因组(人类全部遗传信息的总和)大约有10万个基因,但不到5年的时间,这一数字已经迅速跌至2~3万个,所以基因包含的DNA序列只占人类基因组总DNA序列的2%左右,也就是说,在人类基因组中,有98%的信息是看似无用的“垃圾”。