非編碼DNA
非編碼DNA(或稱「垃圾DNA」),是指不包含製造蛋白質的指令,或是只能製造出無轉譯能力RNA的DNA序列。此類DNA在真核生物的基因組中占有大多數。有很長的一段時間科學家們沒有認為這些非編碼的作用,因此,這些重複的DNA片段被冠以垃圾DNA的稱號。隨着時間的推移,科學家們對垃圾DNA的認識逐漸深入,慢慢地發現其實很多非編碼DNA有着其獨特的作用,它們在基因剪切等方面起重要的作用。
目錄
功能爭議
非編碼區的數量與生物進化程度有密切關係,在微生物中,非編碼區只占整個基因組序列的10%—20%;但在高等生物和人類基因組中,非編碼序列則占了基因組序列的絕大部分。
長期以來,對非編碼區的一個主要研究方向是對調控元件的研究。因為在非編碼區,只有一小部分已被證實為有用成分,能幫助基因開啟和關閉以調控基因的表達,即大名鼎鼎的調控DNA。大部分非編碼DNA仍處於爭議中,因為它們的功能尚未被認知,因此人們不知道它們是否應該被認為是垃圾。
研究人員發現,以往的研究方法對調控DNA數量的監測與其真實存在數量有一定差距,而這一差距經過糾正後,調控DNA的影響可能遠比人類先前所認識的更加豐富。該發現有助於科學家進一步分析調控元件對遺傳性疾病的作用,也必將會引起有關於非編碼DNA「垃圾論」的新一輪爭辯。 研究結果發表在2007年12月13日的《基因組研究》期刊網絡版上。 發現這一問題的是美國約翰霍普金斯遺傳醫學研究所的麥考林博士研究小組。
傳統查找調控序列的方法是比較遠緣物種的DNA,理論上,功能性重要區域將比非功能性區域出現更多的相類似序列,然而麥考林小組發現,這種方法存在嚴重問題。研究小組在對神經元發育所需基因周圍的DNA序列進行了詳盡的分析研究後證實,計算機程序在掃描基因組時,會遺漏60%以上的重要DNA區域。
麥考林小組正在規劃利用其他神經細胞基因開展研究。他認為,調控元件通過調節每個細胞的基因活性,將在人類的身體中創造種種不同的細胞類型。
已知有超過1500種基因與遺傳性疾病的發生有密切關係,而基因的正常表達離不開調控元件的參與,某些調控元件的異常還會導致臨床表現與相應基因編碼區的疾病突變。
這一研究表明,非編碼區調控元件的數量比原有的估計有新突破,這將對治療帕金森症和精神失常有深遠意義。 [1]
已知功能
科學家們已經發現:「垃圾」DNA的功能之一就是調節基因的活動,如同一道指令一樣,控制着基因。一些控制基因開和關的特殊蛋白(轉錄因子)能特異識別基因附近的非編碼「垃圾」DNA,通過與它們相互作用參與基因的抑制與激活。科學家還發現,大多數基因的開啟和關閉是由附近的「垃圾」DNA控制的。它們就像是基因的「分子」開關,調節基因的活動。例如,在酵母中,大約30%基因上游的非編碼DNA在基因調控中發揮作用。在擁有更大基因組的哺乳動物中,雖然特殊的有功能的「垃圾」DNA的分布要比在酵母中分散,但卻在編碼蛋白序列的上下游區域內呈簇分布。特別在人中,許多的「垃圾」DNA序列的變化與複雜疾病如關節炎、共濟失調症等的發生息息相關。不同個體對藥物的反應、對疾病易感性的差異在很多情況下也是由一些特殊的「垃圾」DNA調節的。甚至一些科學家猜想:可能正是「垃圾」DNA造成了人類個體間的差異。
在「垃圾」DNA家族中,還有一類特殊的群體,稱為假基因。假基因與基因很像,但卻不能產生功能性蛋白,常常被歸類為「垃圾」DNA。科學家預計,人類假基因的數目竟然與正常基因的數量相似,大約有2萬個左右,已鑑定的已超過12 000個。雖然假基因不能合成蛋白,但並不是說,它們不具有任何功能,研究發現「假」基因確有真本領。研究人員在對小鼠進行遺傳改造的時候偶然造成了一個假基因的缺失,該小鼠的後代發生嚴重的先天性缺陷,並且壽命急劇縮短,可見這種假基因的作用不可小視,它對健康生命是必需的。該假基因是其對應的基因Makorin1的缺陷拷貝,長度不到其一半大,只能產生小分子mRNA(蛋白質合成的中介物),卻不能合成蛋白質。儘管很小,但是這種「假RNA」有保護真基因免受破壞的功能。如果這個假基因在小鼠或者人類細胞中丟失的話,真基因的功能也不能正常發揮。研究人員推測,可能是由於假基因RNA看起來像Makorin1,它們掩護真基因,通過「犧牲」自己將不利因素引開,而保護真基因免受干擾。這可能是一種新的基因調節的方法。
「垃圾」DNA還能通過合成調節性RNA發揮功能。這些RNA並不是為了合成蛋白質,但卻在生命的舞台上扮演着不同的角色。迄今為止,細胞中的snRNA、asRNA、snoRNA、miRNA、piRNA(microRNA)都是非編碼「垃圾」DNA合成的。它們參與到基因活化、基因沉默、基因印記、劑量補償、蛋白合成與功能調節、代謝調控等眾多生物學過程中。2001年,芬蘭科學家凱緹那領導的課題組發現了一個「垃圾」DNA區域,它合成的RNA可以與蛋白質結合,生成一種在線粒體中發揮作用的酶。當這個非編碼RNA的關鍵位點發生變異,個體的健康和壽命都會受到威脅。
此外,「垃圾」DNA中還存在大量的重複DNA序列,這些DNA看似沒有意義也不能編碼蛋白質,卻能形成特殊的DNA高級結構,並以此調節附近基因的活性。 [2]
綽號的由來
基因是具有遺傳效應的特定DNA序列,通俗地講,基因就是編碼某種蛋白質的一段DNA。它們就像散落於天幕的星星一樣,分散在人類的基因組中。而在這些基因間存在的大片大片的DNA 片段是不能編碼蛋白質的,即「非編碼序列」。由於功能不清,加州理工學院的大野·乾於1972年提出用「垃圾基因」的概念來形容它們。「垃圾」有多少呢?21世紀之初時,科學家還估計人類基因組(人類全部遺傳信息的總和)大約有10萬個基因,但不到5年的時間,這一數字已經迅速跌至2~3萬個,所以基因包含的DNA序列只占人類基因組總DNA序列的2%左右,也就是說,在人類基因組中,有98%的信息是看似無用的「垃圾」。