表观遗传学查看源代码讨论查看历史
表观遗传学是研究基因的核苷酸序列不发生改变的情况下,基因表达的可遗传的变化的一门遗传学分支学科。表观遗传的现象很多,已知的有DNA甲基化(DNA methylation),基因组印记(genomic imprinting),母体效应(maternal effects),基因沉默(gene silencing),核仁显性,休眠转座子激活和RNA编辑(RNA editing)等。
定义
中文 在生物学中,表观遗传学这个名词指的是基因表达中的多种变化。这种变化在细胞分裂的过程中,有时甚至是在隔代遗传中保持稳定,但是不涉及到基本DNA的改变。
这个概念意味着即使环境因素会导致生物的基因表达出不同,但是基因本身不会发生改变。表观遗传学在真核生物中的变化主要被举例为细胞分化过程中干细胞分化成与胚胎有关的多种细胞这一过程。这个过程通过一些可能包含某些基因的沉默,移除某些基因上沉默的标志并且永久的失活于其他基因的机制变得稳定。
简介
中文名称:表观遗传学
英文名称: epigenetics
学科分类:遗传学
别名:拟遗传学、表遗传学、外遗传学以及后遗传学
表观遗传学是与遗传学(genetic)相对应的概念。遗传学是指基于基因序列改变所 致基因表达水平变化,如基因突变、基因杂合丢失和微卫星不稳定等;而表观遗传学 则是指基于非基因序列改变所致基因表达水平变化,如DNA甲基化和染色质构象变 化等;表观基因组学(epigenomics) 则是在基因组水平上对表观遗传学改变的研究。
DNA甲基化
所谓DNA甲基化是指在DNA甲基化转移酶的作用下, 在基因组CpG二核苷酸的胞嘧啶5'碳位共价键结合一个 甲基基团。正常情况下,人类基因组“ 垃圾”序列的CpG二核苷酸相对稀少,并且总是处于甲基化状态,与之相 反,人类基因组中大小为100—1000 bp 左右且富含CpG二核苷酸的CpG岛则总是处于未甲基化状态,并且与56% 的人类基因组编码基因相关。人类基因组序列草图分析结果表明, 人类基因组CpG岛约为28890个,大部分染色体每1 Mb就有5—15个CpG岛,平均值为每Mb含10.5个CpG岛,CpG岛的数目与基因密度有良好的对应关系[9]。 由于DNA甲基化与人类发育和肿瘤疾病的密切关系, 特别是CpG岛甲基化所致抑癌基因转录失活问题,DNA甲基 化已经成为表观遗传学和表观基因组学的重要研究内容。
染色质重塑
表观遗传学重塑 依赖的染色质重塑与人类疾病
染色质重塑复合物依靠水解ATP提供能量来完成染色质结构的改变,根据水解ATP的亚基不同,可将复合物分为SWI/SNF复合物、ISW复合物以及其它类型的复合物。这些复合物及相关的蛋白均与转录的激活和抑制、DNA的甲基化、DNA修复以及细胞周期相关。
ATRX、ERCC6、SMARCAL1均编码与SWI/SNF复合物相关的ATP酶。ATRX突变引起DNA甲基化异常导致数种遗传性的智力迟钝疾病如:X连锁α-地中海贫血综合征、Juberg-Marsidi综合征、Carpenter-Waziri综合征、Sutherland-Haan综合征和Smith-Fineman-Myers综合征,这些疾病与核小体重新定位的异常引起的基因表达抑制有关。ERCC6的突变将导致Cerebro-Oculo-Facio-Skeletal综合征和B型Cockayne综合征。前者表现为出生后发育异常、神经退行性变、进行性关节挛缩、夭折;后者表现出紫外线敏感、骨骼畸形、侏儒、神经退行性变等症状。这两种病对紫外诱导的DNA损伤缺乏修复能力,表明ERCC6蛋白在DNA修复中有重要的作用。SMARCAL1的突变导致Schimke免疫性骨质发育异常,表现为多向性T细胞免疫缺陷,临床症状表明SMARCAL1蛋白可能调控和细胞增殖相关的基因的表达。BRG1、SMARCB1和BRM编码SWI/SNF复合物特异的ATP酶,这些酶通过改变染色质的结构使成细胞纤维瘤蛋白(Retinoblastoma protein, RB蛋白)顺利的行使调节细胞周期、抑制生长发育以及维持基因失活状态的功能,这三个基因的突变可导致肿瘤形成。
DNA复制相关 组蛋白乙酰化、去乙酰化与人类疾病
组蛋白乙酰化与基因活化以及DNA复制相关,组蛋白的去乙酰化和基因的失活相关。乙酰化转移酶(HATs)主要是在组蛋白H3、H4的N端尾上的赖氨酸加上乙酰基,去乙酰化酶(HDACs)则相反,不同位置的修饰均需要特定的酶来完成。乙酰化酶家族可作为辅激活因子调控转录,调节细胞周期,参与DNA损伤修复,还可作为DNA结合蛋白。去乙酰化酶家族则和染色体易位、转录调控、基因沉默、细胞周期、细胞分化和增殖以及细胞凋亡相关。
CREB结合蛋白(CREB binding protein,CBP)、E1A结合蛋白p300(E1A binding protein p300,EP300)和锌指蛋白220(zinc finger 220,ZNF220)均为乙酰化转移酶。CBP是cAMP应答元件结合蛋白的辅激活蛋白,通过乙酰化组蛋白使和cAMP应答元件作用的启动子开始转录,它的突变导致Rubinstein Taybi综合征,患者智力低下、面部畸形、拇指和拇趾粗大、身材矮小。CBP和EP300均可抑制肿瘤的形成,在小鼠瘤细胞中确定了CBP的突变,在结肠和乳房瘤细胞系中确定了EP300的突变,另外ZNF220异常和人的急性进行性髓性白血病相关。
如果突变导致错误的激活去乙酰化酶或错误的和去乙酰化酶相互作用,将可能导致疾病的发生。甲基化CpG-结合蛋白-2(methyl cytosine binding protein-2,MeCP2)可募集去乙酰化酶到甲基化的DNA区域,使组蛋白去乙酰化导致染色质浓缩,MeCP2的突变导致Rett综合征,患者出生即发病、智力发育迟缓、伴孤独症。若阻碍去乙酰化酶的功能,则可抑制癌细胞的增殖和分化,可用于急性早幼粒细胞性白血病, 急性淋巴细胞性白血病和非何杰金氏淋巴瘤的治疗。
染色质重塑异常引发的人类疾病是由于重塑复合物中的关键蛋白发生突变,导致染色质重塑失败,即核小体不能正确定位,并使修复DNA损伤的复合物,基础转录装置等不能接近DNA,从而影响基因的正常表达。如果突变导致抑癌基因或调节细胞周期的蛋白出现异常将导致癌症的发生。乙酰化酶的突变导致正常基因不能表达,去乙酰化酶的突变或一些和去乙酰化酶相关的蛋白的突变使去乙酰化酶错误募集将引发肿瘤等疾病。[1]
基因组印记
介绍 基因组印记是指来自父方和母方的等位基因在通过精子和卵子传递给子代时发生了修饰,使带有亲代印记的等位基因具有不同的表达特性,这种修饰常为DNA甲基化修饰,也包括组蛋白乙酰化、甲基化等修饰。在生殖细胞形成早期,来自父方和母方的印记将全部被消除,父方等位基因在精母细胞形成精子时产生新的甲基化模式,但在受精时这种甲基化模式还将发生改变;母方等位基因甲基化模式在卵子发生时形成,因此在受精前来自父方和母方的等位基因具有不同的甲基化模式。发现的印记基因大约80%成簇,这些成簇的基因被位于同一条链上的顺式作用位点所调控,该位点被称做印记中心(imprinting center, IC)。印记基因的存在反映了性别的竞争,从发现的印记基因来看,父方对胚胎的贡献是加速其发育,而母方则是限制胚胎发育速度,亲代通过印记基因来影响其下一代,使它们具有性别行为特异性以保证本方基因在遗传中的优势。
印记基因的异常表达引发伴有复杂突变和表型缺陷的多种人类疾病。研究发现许多印记基因对胚胎和胎儿出生后的生长发育有重要的调节作用,对行为和大脑的功能也有很大的影响,印记基因的异常同样可诱发癌症。
基因组印记 巨舌-巨人症综合征(BWS )
BWS患者表现为胚胎和胎盘过度增生,巨舌,巨大发育,儿童期易发生肿瘤。该病主要是由11号染色体上的IGF2和CDKN1C两个印记基因的错误表达引发,IGF2为父本表达的等位基因,CDKN1C为母本表达的等位基因。父本单亲二体型(uniparental disomies, UPDs)是引发BWS的主要原因,即IGF2基因双倍表达,CDKN1C基因不表达;次要原因是母本的CDKN1C等位基因发生突变[22];极少数病例是由于母本的染色体发生移位造成CDKN1C基因失活和(或)造成母本的IGF2基因表达。其它一些印记基因在胚胎发育过程中的过量或缺失表达也可导致类似于BWS的综合征,如原来母本表达的IPL基因的不表达或母本的ASCL2基因逃避印记都将导致胚胎的过度发育。这表明父本表达的等位基因对胚胎的生长有促进作用,而母本表达的等位基因对胚胎的发育起到限制作用。
基因组印记与Prader-Willi/Angelman综合征(PWS/AS)
PWS表现为肥胖、身材矮小和轻度智力发育迟缓;AS表现为共济失调、过度活跃、严重智障、少语、表情愉悦,这两种疾病都和神经功能失调相关。PWS是由于突变导致父本印记基因在大脑中高表达所致,如SNPNP基因高表达;AS是由于母本的UBE3A基因的缺失或受到抑制所致,该基因编码泛素蛋白连接酶并在脑中表达。父本表达的SNRNP基因的微缺失可导致PWS,而在其上游进一步缺失则可导致AS,这说明这两个区域就是印记中心所在的位置。如果缺失父本染色体上的PWS印记中心将导致SNRNP基因以及附近的父本表达的等位基因被抑制,而缺失父本染色体上的AS印记中心则没什么变化,但若缺失母本染色体上的AS印记中心将导致UBE3A被抑制而导致AS。
基因组印记丢失 印记丢失不仅影响胚胎发育并可诱发出生后的发育异常,从而导致癌症发生。如果抑癌基因有活性的等位基因失活便提高了发生癌症的几率,例如IGF2基因印记丢失将导致多种肿瘤,如Wilm’s 瘤。和印记丢失相关的疾病还有成神经细胞瘤,急性早幼粒细胞性白血病,横纹肌肉瘤和散发的骨肉瘤等。
与基因组印记相关的疾病常常是由于印记丢失导致两个等位基因同时表达,或突变导致有活性的等位基因失活所致。调控基因簇的印记中心发生突变将导致一系列基因不表达,引发复杂综合征。基因组印记的本质仍为DNA修饰和蛋白修饰,所以和印记相关的蛋白发生突变也将导致表观遗传疾病。[2]
染色体失活
X染色体失活 女性有两条X染色体,而男性只有一条X染色体,为了保持平衡,女性的一条X染色体被永久失活,这便是“剂量补偿”效应。哺乳动物雌性个体的X染色体失活遵循n-1法则,不论有多少条X染色体,最终只能随机保留一条的活性。对有多条X染色体的个体研究发现有活性的染色体比无活性的染色体提前复制,复制的异步性和LINE-1元件的非随机分布有可能揭示染色体失活的本质[27]。哺乳动物受精以后,X染色体发生系统变化。首先父本X染色体(paternal X chromosome, Xp)在所有的早期胚胎细胞中失活,表现为整个染色体的组蛋白被修饰和对细胞分裂有抑制作用的Pc-G蛋白(Polycomb group proteins, Pc-G)表达,然后Xp在内细胞群又选择性恢复活性,最后父本或母本X染色体再随机失活。
X染色体随机失活是X失活中心(X inactivation center, Xic)调控的。Xic是一个顺式作用位点,包含辨别X染色体数目的信息和Xist基因,前者可保证仅有一条染色体有活性,但机制不明,后者缺失将导致X染色体失活失败。X染色体失活过程为:Xist基因编码Xist RNA,Xist RNA包裹在合成它的X染色体上,引发X染色体失活;随着Xist RNA在X染色体上的扩展,DNA甲基化和组蛋白的修饰马上发生,这对X染色体失活的建立和维持有重要的作用;失活的染色体依旧持续合成Xist RNA,维持本身的失活状态,但有活性的X染色体如何阻止Xist RNA的结合机制还不明确。
相关疾病 和X染色体失活相关的疾病多是由X染色体的不对称失活使携带有突变等位基因的X染色体在多数细胞中具有活性所致。Wiskott-Aldrich综合征表现为免疫缺陷、湿疹、伴血小板缺乏症,该病是由于WASP基因突变所致。因为染色体随机失活导致女性为嵌合体,携带有50%的正常基因,通常无症状表现,该病患者多为男性。存在女性患病的原因在于不对称X染色体失活,即携带有正常WASP基因的染色体过多失活。但女性体内还存在另一种机制,通过不对称失活使携带有突变基因的X染色体大部分失活。对Pelizaeus-Merzbacher病的研究表明这种机制的存在,它使带有突变PLP基因的X染色体倾向于失活。RTT综合征也和不对称X染色体失活有关,携带有MeCP2突变基因的女性,X染色体失活时倾向于使携带有发生突变的等位基因的染色体失活。
即便是失活的X染色体,也有一部分基因可以逃避失活而存在两个有活性的等位基因,但逃避失活的等位基因的表达水平有很大的差异。由于逃避失活而易使一些抑癌基因丧失功能,这是引发女性癌症的一个重要原因。也有一些逃避失活的基因过量表达而增加某些疾病的易感性,如TIMP1基因随着年龄的增加表达量逐渐增加,导致迟发型疾病。女性易感的自身免疫性疾病也和X染色体失活相关,因为女性为嵌合体,如果自身免疫性T细胞不能耐受两个X染色体所编码的抗原,则会导致自身免疫缺陷性疾病,如红斑狼疮等。
非编码RNA
作用 功能性非编码RNA在基因表达中发挥重要的作用,按照它们的大小可分为长链非编码RNA和短链非编码RNA。长链非编码RNA在基因簇以至于整个染色体水平发挥顺式调节作用。在果蝇中调节“剂量补偿”的是roX RNA,该RNA还具有反式调节的作用,它和其它的蛋白共同构成MSL复合物,在雄性果蝇中调节X染色体活性。在哺乳动物中Xist RNA调节X染色体的失活,其具有特殊的模体可和一些蛋白共同作用实现X染色体的失活。Tsix RNA是Xist RNA的反义RNA,对Tsix起负调节作用,在X染色体随机失活中决定究竟哪条链失活。air RNA调节一个基因簇的表达,该基因簇含有3个调节生长的基因[38]。长链RNA常在基因组中建立单等位基因表达模式,在核糖核蛋白复合物中充当催化中心,对染色质结构的改变发挥着重要的作用。
短链RNA在基因组水平对基因表达进行调控,其可介导mRNA的降解,诱导染色质结构的改变,决定着细胞的分化命运,还对外源的核酸序列有降解作用以保护本身的基因组。常见的短链RNA为小干涉RNA(short interfering RNA, siRNA)和微小RNA(microRNA, miRNA),前者是RNA干扰的主要执行者,后者也参与RNA干扰但有自己独立的作用机制。
疾病 非编码RNA对防止疾病发生有重要的作用。染色体着丝粒附近有大量的转座子,转座子可在染色体内部转座导致基因失活而引发多种疾病甚至癌症,然而在着丝粒区存在大量有活性的短链RNA,它们通过抑制转座子的转座而保护基因组的稳定性。在细胞分裂时,短链RNA异常将导致染色体无法在着丝粒处开始形成异染色质,细胞分裂异常,如果干细胞发生这种情况可能导致癌症的发生。siRNA 可在外来核酸的诱导下产生,通过RNA干扰清除外来的核酸,对预防传染病有重要的作用。RNA干扰已大量应用于疾病的研究为一些重大疾病的治疗带来了新的希望。
非编码RNA不仅能对整个染色体进行活性调节,也可对单个基因活性进行调节,它们对基因组的稳定性、细胞分裂、个体发育都有重要的作用。RNA干扰是研究人类疾病的重要手段,通过其它物质调节RNA干扰的效果以及实现RNA干扰在特异的组织中发挥作用是未来RNA干扰的研究重点。
注释 研究基因的核苷酸序列不发生改变的情况下,基因表达了可遗传的变化的一门遗传学分支学科。表观遗传的现象很多,已知的有DNA甲基化(DNA methylation),基因组印记(genomic impriting),母体效应(maternal effects),基因沉默(gene silencing),核仁显性,休眠转座子激活和RNA编辑(RNA editing)等,国际上表观遗传学已经构成了系统遗传学研究的一个重要方面。
相关
表观遗传学是与遗传学(genetic)相对应的概念。遗传学是指基于基因序列改变所致基因表达水平变化,如基因突变、基因杂合丢失和微卫星不稳定等;而表观遗传学则是指基于非基因序列改变所致基因表达水平变化,如DNA甲基化和染色质构象变化等;表观基因组学(epigenomics)则是在基因组水平上对表观遗传学改变的研究。所谓DNA甲基化是指在DNA甲基化转移酶的作用下,在基因组CpG二核苷酸的胞嘧啶5'碳位共价键结合一个甲基基团。正常情况下,人类基因组“垃圾”序列的CpG二核苷酸相对稀少,并且总是处于甲基化状态,与之相反,人类基因组中大小为100—1000 bp左右且富含CpG二核苷酸的CpG岛则总是处于未甲基化状态,并且与56%的人类基因组编码基因相关。人类基因组序列草图分析结果表明,人类基因组CpG岛约为28890个,大部分染色体每1 Mb就有5—15个CpG岛,平均值为每Mb含10.5个CpG岛,CpG岛的数目与基因密度有良好的对应关系[9]。由于DNA甲基化与人类发育和肿瘤疾病的密切关系,特别是CpG岛甲基化所致抑癌基因转录失活问题,DNA甲基化已经成为表观遗传学和表观基因组学的重要研究内容。