求真百科歡迎當事人提供第一手真實資料,洗刷冤屈,終結網路霸凌。

启动子查看源代码讨论查看历史

跳转至: 导航搜索

启动子是RNA 聚合酶识别、结合和开始转录的一段DNA 序列,它含有RNA 聚合酶特异性结合和转录起始所需的保守序列,启动子本身不被转录。

启动子的特性最初是通过能增加或降低基因转录速率的突变而鉴定的。启动子一般位于转录起始位点的上游。

基本结构

启动子是一段位于结构基因5'端上游区的DNA序列,能活化RNA聚合酶,使之与模板DNA准确地相结合并具有转录起始的特异性。因为基因的特异性转录取决于酶与启动子能否有效地形成二元复合物,故RNA聚合酶如何有效地找到启动子并与之相结合是转录起始过程中首先要解决的问题。有实验表明,对许多启动子来说,RNA聚合酶与之相结合的速率至少比布朗运动中的随机碰撞高100倍。

转录的起始是基因表达的关键阶段,而这一阶段的重要问题是RNA聚合酶与启动子的相互作用:启动子的结构影响了它与RNA聚合酶的亲和力,从而影响了基因表达的水平。

为什么RNA聚合酶能够仅在启动子处结合呢?显然启动子处的核苷酸顺序具有特异的形状以便与RNA聚合酶结合,就好像酶与其底物的构相恰恰适合一样。将100个以上启动子的顺序进行了比较,发现在原核生物的RNA合成开始位点的上游大约10bp和35bp处有两个共同的顺序,称为-10和-35序列。这两个序列的共同顺序如下,-35区“TTGACA”,-10区“TATAAT”。大多数启动子均有共同顺序(consensus sequence),只有少数几个核苷酸的差别。

转录单元(transcription unit) 是一段从启动子开始至终止子(terminator)结束的DNA序列,RNA聚合酶从转录起点开始沿着模板前进,直到终止子为止,转录出一条RNA链。在细胞中,一个转录单元可以是一个基因,也可以是几个基因。

转录起点

转录起点是指与新生RNA链第一个核苷酸相对应DNA链上的碱基,研究证实通常为一个嘌呤。常把起点前面,即5’末端的序列称为上游(upstream),而把其后而即3’末端的序列称为下游(downstream)。在描述碱基的位置时,一般用数字表示,起点为+1,下游方向依次为+2、+3……,上游方向依次为-1、-2、-3……。

启动子区

启动子区是RNA聚合酶的结合区,其结构直接关系到转录的效率。关于其结构特点,Pribnow设计了一个实验,他把RNA聚合酶全酶与模板DNA结合后,用DNase l水解DNA,然后用酚抽提,沉淀纯化DNA后得到一个被RNA聚合酶保护的DNA片段,约有41~44个核苷酸对。他先后分离了fd噬菌体、T7噬菌体的A2及A3启动子、h噬σ菌体的PR启动子及大肠杆菌乳糖操纵子的UV5启动子等5段被酶保护的区域,并进行了序列分析,以后又有人做了50多个启动子的序列分析后发现,在被保护区内有一个由5个核苷酸组成的共同序列,是RNA聚合酶的紧密结合点,称为Pribnow区(Pribnow box),这个区的中央大约位于起点上游10bp处,所以又称为-10区。

许多原核生物都含有这两个重要的启动子区:RNA聚合酶同启动子结合的区域称为启动子区。将各种原核基因同RNA聚合酶全酶结合后,用DNase I水解DNA,最后得到与RNA聚合酶结合而未被水解的DNA片段,这些片段有一个由5个核苷酸(TATAA)组成的共同序列,以其发现者的名字命名为Pribnow框(Pribnow box),这个框的中央位于起点上游10bp处,所以又称-10序列(-10 sequence),后来在-35 bp处又找到另一个共同序列(TTGACA)。Hogness等在真核基因中又发现了类似Pribnow框的共同序列,即位于-25~-30 bp处的TATAAAAG,也称TATA框(TATA box)。TATA框上游的保守序列称为上游启动子元件(upstream promoter element,UPE)或上游激活序列(uptream activating sequence,UAS)。另外在-70~-78 bp处还有一段共同序列CCAAT,称为CAAT框(CAAT box)。

在真核生物基因中,Hogness等先在珠蛋白基因中发现了类似Pribrow区的Hogness区(Hogness box),这是位于转录起始点上游-25~-30 bp处的共同序列似TAAA,也称为TATA区。另外,在起始位点上游-70~-78 bp处还育另一段共同序列CCAAT,这是与原核生物中-35bp区相对应的序列.称为CAAT区(CAAT box)。

-10位区和-35位区

提纯被保护的片段后却发现,RNA聚合酶并不能重新结合或并不能选择正确的起始点,表明在保护区外可能还存在与RNA聚合酶对启动子的识别有关的序列。果然,科学家不久就从噬菌体的左、右启动子PL及PR和SY40启动子的-35 bp附近找到了另一段共同序列:TTGACA。经过数年的努力,分析了46个大肠杆菌启动子的序列以后.确证绝大部分启动子都存在这两段共同序列,即位于-10bp处(……T89A89T50A65A100……)的TATA区和-35 bp处(……T85T83G81A61C69A52……)的TTGACA区。现已查明,-10位的TATA区和-35位的TTGACA区是RNA聚合酶与启动子的结合位点,能与σ因子相互识别而具有很高的亲和力。[1]

原核生物中-10区同-35区之间核苷酸数目的变动会影响基因转录活性的高低,强启动子一般为17±1 bp,当间距小于15 bp或大于20 bp时都会降低启动子的活性。

在真核基因中,有少数基因没有TATA框。没有TATA框的真核基因启动子序列中,有的富集GC,即有GC框;有的则没有GC框。GC框位于-80~-110bp处的GCCACACCC或GGGCGGG序列。

TATA框的主要作用是使转录精确地起始;CAAT框和GC框则主要是控制转录起始的频率,特别是CAAT框对转录起始频率的作用更大。如在TATA框同相邻的UPE之间插入核苷酸,也会影响转录使之减弱。

-10序列(原核生物)也称为Pribnow box,在真核生物中相应的序列称为TATA盒,又称为Goldberg-Hogness box,是RNA聚合酶Ⅱ的结合部位。-10和-35这两个部位都很重要:【1】RNA聚合酶能和-35和-10序列中的碱基和DNA主链中的磷酸基相接触;【2】离开共同顺序较远的启动子的活性亦较弱;【3】最重要的是,破坏启动子功能的突变中有75%都是改变了共同顺序中的碱基,其余25%亦为离共同顺序较近的。-35和-10序列相距约20bp,即大致是双螺旋绕两圈的长度。因为这两个结合区是在DNA分子的同一侧面,可见此酶是结合在双螺旋的一面。可以想像,它能"感觉到每个结合区的沟底中碱基所产生的特异形状。"

原核生物亦有少数启动子缺乏这两个序列(-35和-10)之一。在这种情况下,RNA聚合酶往往不能单独识别这种启动子,而需要有辅助蛋白质的帮助。可能是这些蛋白质因子与邻近序列的反应可以弥补启动子的这个缺陷。

在真核生物中,在转录起始位点上游70-80bp处有CAAT顺序,也称为CAAT盒。这一顺序也是比较保守的共同顺序:GCCTCAATCT。RNA聚合酶Ⅱ可以识别一顺序。在对家兔β珠蛋白基因CAAT顺序的研究中发现,用人工方法诱导CAAT顺序发生突变使家兔β珠蛋白基因的转录水平降低。

启动子中的-10和-35序列是RNA聚合酶所结合和作用必需的顺序。但是附近其他DNA顺序也能影响启动子的功能。例如,在核糖体RNA合成的起始位点的上游50到150核苷酸之间的顺序就是对启动子的完全活性所必需的。如果这一段DNA顺序缺失并由其他外来DNA所取代(例如克隆在质粒DNA中的rRNA基因),则转录起始的频率将降低10倍。同样,在其他情况下,远隔部位的富有AT的DNA顺序被认为能增进转录起始的频率。有时候上游顺序可以是某些能直接激活RNA聚合酶的"激活蛋白"的结合部位。但是,上游顺序往往有另外的功能。例如上游顺序可以吸引拓扑异构酶,后者可导致结合的局部产生有利于转录起始的超螺旋状态。上游顺序所引起的DNA结构的微细变化可能在双螺旋上被传导到相当远的距离,因此上游顺序的变化可以影响到-10和-35区的DNA结构细节。[2]

启动子功能变异的疾病

以下是从人类孟德尔遗传学(OMIM)证实与启动子故障有关,不论是因启动子序列直接突变或是转录因子或转录共激发因子的突变。而多种癌症都没有列下是因为从染色体易位产生嵌合基因:

哮喘β地中海贫血鲁宾斯坦泰比综合症

要留意的是在病原学上大部份的疾病都是异质的,而在分子层面上一种疾病往往是指多种疾病,纵然它们的病征及治疗方法一致。疾病对治疗有不同的反应,是因背后分子源头的差异,这会是药物遗传学的范畴。

参考文献