RNA聚合酶查看源代码讨论查看历史
RNA聚合酶(RNA polymerase),或称核糖核酸聚合酶,是以一条DNA链或RNA为模板,三磷酸核糖核苷为底物、通过磷酸二酯键而聚合的合成RNA的酶。因为在细胞内与基因DNA的遗传信息转录为RNA有关,所以也称转录酶。它是一种非常重要的酶,且可在所有生物、细胞及多种病毒中可见。
基本介绍
RNA聚合酶(RNA polymerase):以一条DNA链或RNA为模板催化由核苷-5′-三磷酸合成RNA的酶。
催化转录的RNA聚合酶是一种由多个蛋白亚基组成的复合酶。如大肠杆菌的 RNA聚合酶有五个亚基组成,其分子量为480000,含有α,β,β’,σ,ω等5种不同的多肽,其中α为两个分子,所以全酶(holoenzyme)的组成是α2ββ’σω。σ亚基与RNA聚合酶的四聚体核心(α2ββ’)的形成有关;β亚基与起始和催化聚合反应有关;β’亚基含有与DNA模板的结合位点;而σ因子只与RNA转录的起始有关,与链的延伸没有关系,一旦转录开始,σ因子就被释放,而链的延伸则由四聚体核心酶(core enzyme)催化。所以,σ因子的作用就是识别转录的起始位置,并使RNA聚合酶结合在启动子部位;ω亚基作用暂不明确。
细菌的RNA聚合酶,像DNA聚合酶一样,具有很复杂的结构。其活性形式(全酶)为15S,由5种不同的多肽链构成,按分子量大小排列分别为β'(155000),β(151000),σ(70000),α(36500)和ω(11000)。每分子RNA聚合酶除有两个α亚基外,其余亚基均只有一个,故全酶为β'βα2σω(450000)
如果全酶为球状,则可计算其直径约为100A,即约为双链DNA的30bp节段的长度。然而全酶可结合约60个核苷酸,提示其形状应为椭圆球形。
σ亚基和其他肽链的结合不很牢固。当σ亚基脱离全酶后,剩下的β'βα2ω称为核心酶。核心酶本身就能催化核苷酸间磷酸二酯键的形成,不论有无σ存在的利福平(rifampicin)和利福霉素(rifamycin)能结合在β亚基上而对此酶发生强烈的抑制作用。它抑制RNA合成的起始而不抑制其延长。β亚基的基因rpoB的突变可使细菌对利福平有抗性。而另一种抗生素链霉溶菌素(streptolydigin)能抑制RNA链的延长,rpoB的突变却可使细胞对链霉溶菌素亦发生抗性。总的看来β亚基似乎是酶和核苷酸底物结合的部位。肝素能与DNA竞争与RNA聚合酶相结合。肝素是一种多价阴子,能和β'亚基结合,从而在体外抑制转录作用。可见β'亚基的碱性较强,适于与模板DNA相结合。α亚基的功能现尚未知。然而,当噬菌体T4感染E.coli时,其α亚基即在精氨酸上被ADP-核糖化。这种修饰作用使该RNA聚合酶全酶对其原先识别的启动子的亲和力减弱。所以有人认为,α亚基的功能可能是识别其相应的启动子[1]
启动环
启动环(triggerloop,TL)结构是真核生物和原核生物RNA聚合酶中的一个高度保守区域,但它在转录过程的确切功能还不甚了解。美国斯坦福大学的Kaplan等人的最新研究发现,TL在底物选择过程中发挥重要功能,是真菌毒素α鹅膏覃碱(α-amanitin)的直接作用位点。该研究结果发表的《分子细胞》(MolecularCell)上。以往研究表明,TL结构直接与新合成RNA的3'端和NTP相互作用,其中一个保守的组氨酸残基直接与NTP底物相结合。Kaplan等人用其他氨基酸替代酿酒酵母RNA聚合酶Ⅱ中TL结构中的His1085残基,结果导致酿酒酵母表现出严重的生长缺陷,甚至无法存活。离体实验表明,His1085能够选择正确的NTP底物,该位点变异后,聚合酶Ⅱ掺入错误的NTP底物和2'dNTP底物的可能性大大增加。
α鹅膏覃碱能够抑制RNA聚合酶Ⅱ的延伸速率,降低其底物选择性,但His1085被替代后的RNA聚合酶Ⅱ对α鹅膏覃碱则具有较高的抗性。研究人员进一步研究了纯化的RNA聚合酶-α鹅膏覃碱复合体的晶体结构,发现α鹅膏覃碱和TL结构间存在直接的相互作用。因此,研究人员认为,α鹅膏覃碱通过直接作用于TL结构而降低RNA聚合酶Ⅱ的速率和保真度。
结构
为什么细菌的RNA聚合酶需要这么大和复杂的分子结构呢?而某些噬菌体特有的RNA聚合酶则要小得多,仅由一条多肽链组成。这证明RNA合成所需的机构可以远比宿主的酶小。这种情况说明,噬菌体内的转录仅需一条"最小"的机构。然而这种酶只能识别噬菌体本身所有的少数几个启动子;它们不能识别其他启动子。例如噬菌体T3和T7的RNA聚合酶分子很相似,二者都不过是一条多肽链,分子量约11000。它们能很快合成RNA。其速率在37℃时可达约200核苷酸/秒。
相比之下,宿主细胞的RNA聚合酶却能转录细胞内的许多转录单位(>1000个)中的任意一个。这些转录单位中有一些可由RNA聚合酶直接转录,不需要其他因子的帮助。但大多数这些转录单位仅在更多的蛋白质因子存在下才能被该RNA聚合酶所转录。所以,可以想像宿主细胞所以要求这样大和复杂,至少部分反映了它需要和许多其他因子相互作用,而不是其催化活性的固有的要求。
E.coli的RNA聚合酶各亚基的基因(除ω亚基的基因尚不详外)均存在于三个操纵子中,这些操纵子还含有蛋白质合成和DNA合成所需的基因。P71主要启动子(P)均在操纵子的左侧,RNA则向右方合成。次要启动子(p)包括σ操纵子中的一个启动子(PHS,是在热休克条件下才有活性的启动子),均位于操纵子之内。这些次要启动子仅启动在其右侧的基因。β操纵子的前面两个基因L11和L1,有时被认为组成另一个独立的操纵子,因为在L10基因之前另有一启动子。这些基因编码50个左右核糖体蛋白质中的某些蛋白质。σ操纵子中还含有复制所需的蛋白质,即DNA引物酶的基因。还不清楚这些操纵子是如何进行调节的。
σ操纵子有两个连续的启动子,就像rRNA的操纵子一样。受到ppGpp分子的调控,故与生长速度有关。这些操纵子中的基因并不是相等地被转录的:在σ和β操纵子开始中的核糖体蛋白质基因的后面有衰减子(attenuators),可使其后的RNA聚合酶基因的转录大为降低。因此,在每个细胞中RNA聚合酶亚基的数目(约3000个)要大大少于核糖体蛋白质的分子数(约20000个),这是符合细菌的需要的。然而令人不解的是DNA引物酶基因位于σ基因之前,然而在细胞内σ亚基的数目反而要比引物酶分子数多60倍(3000比50)。这可能是因为编码引物酶的mRNA节段要比其余mRNA部分不稳定得多。这些操纵子内都有几个次要的启动子,包括σ操纵子内的一个可被热休克所激活,说明实际的调控作用还要更为复杂得多。[2]
代换
T7噬菌体在转录的时序调控中不是采用σ因子的级联取代,也不是像T4噬菌体那样对核心酶进行修饰,而是根据自动的感染特点采用了RNA聚合酶的代换来进行时序转录的调控。T7是E.coli的烈性噬菌体,基因组长为39,936nt,顺序已知。整个基因组可能具有55个基因,其中44个基因的产物已鉴别出了,已知30种是有功能的转录可分为3组,30°C整个生活周期约为25¢;分钟,但其DNA的注入很慢,整个的过程约10分钟,而其它的噬菌体仅1分钟即可完成。这也是一种调控的手段,因未注入宿主细胞中的DNA是不能转录的。在感染6分钟后,E.coli的RNA合成体系全部被T4的合成体系所取代。
在感染后的前6分钟,T7噬菌体的RNAPol尚未表达,因此仍使用了宿主E.coli的RNA聚合酶,转录的基因主要有10个(0.3,0.4,0.5,0.6,0.65,0.7,1,1.1,1.2,1.3),其0.3基因编码宿主限制酶的抑制蛋白,使T7进入宿主免遭降解;0.7基因编码一种蛋白激酶,能将E.coli的RNA聚合酶磷酸化,为抑制宿主RNAPol作准备;基因1编码T7RNAPol聚合酶,分子量为98KDa,是一条单链肽,它所识别的启动子是由23bp组成的保守顺序(-17~16)。
晚期转录分为二组(Ⅱ和Ⅲ)。感染后6~12分钟后T7就利用自己的RNA聚合酶转录第Ⅱ组转录物。这一组约含(1.4,1.5,1.6,1.7,1.8,2,2.5,2.8,3,3.5,3.8,4,5,5.7,6),其中对转录调控有关系的是基因2,其产物是E.coli聚合酶抑制剂。宿主的RNA聚合酶先受到基因0.7产物的磷酸化,再经抑制完全失去了作用,此时T7已不再需要I组的转录物了,因此废除了宿主RNA聚合酶的功能,而将自己编码的RNA聚合酶取而代之。第Ⅱ组的基因多与T7的复制酶系的合成及几种结构蛋白有关,但第Ⅱ组的启动子和复制的φL启动子因其保守顺序中分别有2~7个碱基发生了改变,所以是较弱的启动子,但由于其位置排在Ⅲ组启动子的前面,所以先进入宿主得以转录,而不与第Ⅲ组启动子的竞争。
晚期转录的另一组基因就是第Ⅲ组转录物,它排在最后,故在感染12分钟后才得以表达。此转录物约含15个基因,它们主要编码头部蛋白,尾部蛋白以及负责装配,这样使得T7噬菌体不至于过早地装配成粒子。这一组虽排在最后,但启动子的结构和保守顺序完全一致所以是极强的启动子,从而保证最后阶段结构蛋白的合成。第Ⅰ组转录的终止位置在邻近1.4基因的上游区(1.3和1.4之间),此是E.coliRNA聚合酶的终止子)它解离后T7RNA聚合酶则重新从第Ⅱ组起始转录。第Ⅱ组和第Ⅲ组都使用终止子Tj,由于自注入宿主缓慢,在第Ⅱ组转录时第Ⅲ组基因尚未注入,仍得不到表达。
Tj的终止效率是90%,尚有10%可以延长转录T7的末端,Tj位于基因10和11之间。基因10是主要的头部蛋白,需要量大,它排在第Ⅱ组末是合理的,即有强启动子的启动,又在转录后被终止,这样不仅满足了装配颗粒的需要,又不至造成浪费。而排在基因10后面的基因都是编码少量头部蛋白和尾部蛋白的,无需大量的转录,后面越过Tj延长转录的强度就可满足需要了,这本身也是一种终止子对转录的调控。[3]
作用
RNA聚合酶(RNA polymerase)的作用是转录RNA。有的RNA聚合酶有比较复杂的亚基结构。如大肠杆菌RNA聚合酶有四条多肽链,另有一个促进新RNA分子合成的σ因子,因此它的组成的是α2ββσ。这种结构称为全酶(holoenzyme),除去了σ因子的酶称为核心酶。噬菌体RNA聚合酶则没有亚基。
真核生物的RNA聚合酶分三类。RNA聚合酶Ⅰ存在于核仁中,转录除5S rRNA以外的rRNA序列。RNA聚合酶Ⅱ存在于核质中,转录大多数基因,需要“TATA”框。RNA聚合酶Ⅲ存在于核质中,转录很少几种基因如tRNA基因,以及5S rRNA基因。有些重复顺序如Alu顺序可能也由这种酶转录。上面提到的“TATA”框又称Goldberg –Hogness顺序,是RNA聚合酶Ⅱ的接触点,是这种酶的转录单位所特有的。它在真核生物的转录基因的5’端一侧,在转录起点上游20至30个核苷酸之间有一段富含AT的顺序。如以转录起始点为0,则在-33到27个核苷酸与-27至21核苷酸之间,有一个“TATA”框。一般是7个核苷酸。原核生物中也类似“TATA”框的结构。RNA聚合酶作用在“TATAAT”(Pribnow)盒和“TTGA-CA”框附近。
研究进展
在美国著名哲学家爱默生(RalphWaldoEmerson)说“大自然容不得任何错误”的时候,他一定没有考虑过RNA聚酶(RNApolymerase,RNAP),这一能将遗传物质DNA与生物功能表现者蛋白联系起来的不二功臣实际上在转录的时候会发生很多错误,但是它也有“自知之明”会及时将这些错误更正过来。这一由Stanford大学StevenBlock实验室完成的研究发表在11月Nature上面。RNA聚合酶(RNAP),只要是稍微接触过分子生物学的人就不会对这个名词陌生,在DNA要将它的遗传信息表达出去,成为真正具有功能效应的单位——蛋白的时候,需要中间体RNA的帮助,而要实现这个过程就不能缺少这个重要的酶。StevenBlock和他的同事利用一种比之前光阱(opticaltrap)更稳定的装置发现在大肠杆菌转录的过程中,这个酶每隔大约1000个碱基就会出现一个错误,但是RNAP也有良好的自我纠正机制,能及时发现和纠正这些错误。
在这一研究中,StevenBlock研究小组改进了光阱,使之放大了10倍,这样研究人员就可以直接观察到RNA聚合酶的每一步动作了,这帮助深入了解了之前并未完全研究清楚的基因转录和调节的过程。而且利用这种装置,研究人员排除了RNAP偶然性的停顿和回转,可以分析一个完全单独的延伸过程,结果他们发现由于RNAP在前进的过程中会结合一个新的NTP,因此导致RNAP一次滑过一个碱基对来确保转录过程的准确性,这被称为布朗荆轮(brownianratchet)。这一研究获得了许多科学家的认可,德克萨斯大学健康中心的RuiSousa认为这是一项迄今为止最好的布朗荆轮的证明,但是也有科学家对此表示怀疑态度。
比较
概述 DNA连接酶:主要是连接DNA片段之间的磷酸二酯键,起连接作用,在基因工程中起作用。
DNA聚合酶:催化脱氧核苷酸之间的聚合反应。主要是脱氧核苷酸之间的磷酸二酯键,在DNA复制中起做用。
DNA聚合酶只能将单个核苷酸加到已有的核酸片段的3′末端的羟基上,形成磷酸二酯键;而DNA连接酶是在两个DNA片段之间形成磷酸二酯键,不是在单个核苷酸与DNA片段之间形成磷酸二酯键。
DNA聚合酶是以一条DNA链为模板,将单个核苷酸通过磷酸二酯键形成一条与模板链互补的DNA链;而DNA连接酶是将DNA双链上的两个缺口同时连接起来。因此DNA连接酶不需要模板。
RNA聚合酶(又称RNA复制酶、RNA合成酶)的催化活性:RNA聚合酶以完整的双链DNA为模板,转录时DNA的双链结构部分解开,转录后DNA仍然保持双链的结构。真核生物RNA聚合酶:真核生物的转录机制要复杂得多,有三种细胞核内的RNA聚合酶:RNA聚合酶I转录rRNA,RNA聚合酶Ⅱ转录mRNA,RNA聚合酶Ⅲ转录tRNA和其它小分子RNA。在RNA复制和转录中起作用。
模板和酶 1.模板RNA的转录合成需要DNA做模板,DNA双链中只有一股链起模板作用,指导RNA合成的一股DNA链称为模板链(template strand)或称反义链(antisense strand),与之相对的另一股链为编码链(coding strand)或称有意义链(sense strand),不对称转录有两方面含义:一是DNA链上只有部分的区段作为转录模板(反义链或模板链),二是模板链并非自始至终位于同一股DNA单链上。
2.RNA聚合酶转录需要RNA聚合酶。原核生物的RNA聚合酶由多个亚基组成:α2ββ'称为核心酶,转录延长只需核心酶即可。α2ββ'σ称为全酶,转录起始前需要σ亚基辨认起始点,所以全酶是转录起始必需的。真核生物RNA聚合酶有RNA-polⅠ、Ⅱ、Ⅲ三种,分别转录45s-rRNA; mRNA(其前体是hnRNA);以及5s-rRNA、snRNA和tRNA。
3.模板与酶的辨认结合
转录模板上有被RNA聚合酶辨认和结合的位点。在转录起始之前被RNA聚合酶结合的DNA部位称为启动子。典型的原核生物启动子序列是-35区的TTGACA序列和-10区的Pribnow盒即TATAAT序列。真核生物的转录上游调控序列统称为顺式作用元件,主要有TATA盒、、CG盒、上游活化序列(酵母细胞)、增强子等等。和顺式作用元件结合的蛋白质都有调控转录的作用,统称为反式作用因子。反式作用因子已发现数百种,能够归类的称为转录因子(TF),相应于RNA-polⅠ、Ⅱ、Ⅲ的是TFⅠ、TFⅡ、TFⅢ。TFⅡ又有A、B、C、D、E、F多种及其亚类。
基本概念:
1.不对称转录:两重含义,一是指双链DNA只有一股单链用作转录模板(模板链);二是对不同基因同一单链上某些区段作为模板链而另一些区段作为编码链,即模板链并非永远在同一单链上。
2. 编码链:DNA双链上不用作转录模板的那一段单链,因其碱基序列除由T代替U而外,其他与转录产物mRNA序列相同而得名。
3.σ(sigma)因子:原核生物RNA聚合酶全酶的成份,功能是辨认转录起始区,这种σ因子称σ70,此外还有分子量不同,功能不同的其他σ因子。
基本要求:掌握转录与复制的区别,转录的不对称性,原核生物的RNA聚合酶的组成及各亚基的功能,真核生物RNA聚合酶的分类、性质及功能,原核生物启动子的结构特点,了解真核生物RNA聚合酶的组成,研究转录起始区的方法。
转录过程 1.转录起始:转录的起始就是生成由RNA聚合酶,模板和转录5'端首位核苷酸组成的起始复合物。原核生物RNA5'端是嘌呤核苷酸(A、G),而且保留三磷酸核苷的结构,所以其起始复合物是:pppG-DNA-RNA聚合酶。
真核生物起始,生成起始前复合物(PIC)。例如RNA-pol-Ⅱ转录,是由各种TFⅡ相互辨认结合,再与RNA聚合酶结合,并通过TF结合到TATA盒上。
2. 转录延长:转录的延长是以首位核苷酸的3'-OH为基础逐个加人NTP即形成磷酸二醋键,使RNA逐步从5'向3'端生长的过程。在原核生物,因为没有细胞膜的分隔,转录未完成即已开始翻译,而且在同一DNA模板上同时进行多个转录过程。电镜下看到的羽毛状图形和羽毛上的小黑点(多聚核糖体),是转录和翻译高效率的直观表现。
3.转录终止:转录的终止在原核生物分为依赖Rho因子与非依赖Rho因子两类。Rho因子有ATP酶和解螺旋酶两种活性,因此能结合转录产物的3'末端区并使转录停顿及产物RNA脱离DNA模板。非依赖Rho因子的转录终止,其RNA产物3'-端往往形成茎环结构,其后又有一串寡聚U。茎环结构可使因子聚合酶变构而不再前移,寡聚U则有利于RNA不再依附DNA模板链而脱出。因此无论哪一种转录终止都有RNA聚合酶停顿和RNA产物脱出这两个必要过程。真核生物转录终止是和加尾(mRNA的聚腺昔酸poly A)修饰同步进行的。RNA上的加尾修饰点结构特征是有AAAUAA序列。
基本概念:
1.转录起始前复合物 (pre-initiation complex,PIC):是真核生物转录因子与RNA聚合酶一同结合于转录起始前的DNA区域而成的复合物。
2.加尾修饰点:真核生物mRNA转录不是在mRNA的位置上终止,而是在数百个核苷酸之后,研究发现在编码链读码框架的3'端之后,常有一组共同序列AATAAA,再下游还有相当多GC的序列,这些序列称为加尾修饰点,转录越过修饰点后,mRNA在修饰点处被切断,随即加入polyA。
3.Rho因子:是原核生物转录终止因子,有ATP酶和解螺旋酶活性。转录终止也可不依赖Rho因子。
三.真核RNA的转录后加工
1.mRNA转录后加工
真核生物转录生成的RNA,多需经加工后才具备活性,这一过程称为转录后修饰,mRNA转录后修饰包括首、尾修饰和剪接。加尾修饰是和转录终止同步的,5'端修饰主要是指生成帽子结构,即把5'-pppG转变为5'-pmGpppG。其过程需磷酸解、磷酸化和碱基的甲基化。mRNA由hRNA加工而成。真核生物基因由内含子隔断编码序列的外显子,是断裂基因。内含子一般也出现在转录初级产物hRNA。切除内含子,把外显子连结在一起,就是剪接加工。在电镜下看到加工过程,内含子往往被弯曲成套索状,因此称为套索RNA。知道剪接加工中,需要由多种Sn-RNA与蛋白质共同组成的并接体。并接体和hnRNA上的内含子边界序列辨认结合。剪接过程先由含鸟苷酸的酶提供3'-OH对其中内含子5'-端的磷酸二酯键作亲电子攻击使其断裂。断裂的外显子3'-OH对内含子3'-端的磷酸二酯键作亲电子攻击,使刚断出的外显子完全置换了内含子,两个外显子就相连起来,因此这个过程称二次转酯反应。
2.tRNA转录后加工
tRNA的转录后修饰,除了剪接加工外,还包括tRNA链上稀有碱基的形成,以及加上3'端的CCA序列。
3.rRNA的转录后加工
rRNA加工多采用自我剪接的形式。自我剪接的RNA本身形成一种特别的二级结构,称为锤头结构。锤头结构是指复合的茎环组成形态,但其中某些序列上必需是特定的碱基所占据。这种RNA结构,不需要任何蛋白质,就可以水解RNA链上某一特定位点的磷酸二酯键。也就是说,这是一种起催化作用的RNA,现称为核酶。核酶的发现,对酶学、分子生物学,进化生物学都是重要的理论更新,而且,医学上已开始利用人工设计的核酶,去消灭一些作为病原体的RNA病毒或消除一些不利于生命活动的细胞内RNA。
基本概念:
1.剪接修饰:RNA转录初级产物含有非编码组分,通过剪接除去非编码组分,把编码组份连接起来。剪接修饰最常见的是靠并接体协助的二次转酯反应,此外还可有自我剪接及需酶的剪接等剪接方式。
2.外显子:定义为断裂基因上及其转录初级产物上可表达的序列。或转录初级产物上通过拼接作用而保留于成熟的RNA中的核苷酸序列或基因中与成熟RNA相对应的DNA序列.
3.内含子:早期定义为核酸上的非编码序列。随着内含子功能的被拓宽,建议用"转录初级产物上通过拼接作用而被去除的RNA序列或基因中与这种RNA序列相对应的DNA序列"较全面。
4.并接体:由snRNA和蛋白质组成的核糖核酸蛋白(核蛋白)复合物。其功能是结合内含子两端的边界序列,协助RNA的剪接加工。
5.核酶(ribozyme):具有催化功能(酶的作用)的RNA分子。核酶能起作用的结构,至少含有3个茎(RNA分子内配对形成的局部双链),1至3个环(RNA分子局部双链鼓出的单链)和至少有13个一致性的碱基位点。
参考文献
- ↑ RNA聚合酶的种类和功能微信
- ↑ []
- ↑ RNA聚合酶是如何发挥作用的?知乎