HSF转录因子在模式植物水稻和拟南芥中的进化分析
2024-01-10 09:53:29
论文总字数:18401字
摘 要
: 热激转录因子(HSF)是调节生物体内热激反应应答的主要的转录因子。被子植物的生物水稻的基因组全序列已经测序完成,这些序列数据对进行比较基因组分析提供了极有价值的的资源。对物种中的热激转录因子家族进行进化关系分析,对研究这一基因家族中各成员的功能有着重要的意义。我们鉴定了25个水稻(Orysa sativa japonica cultivar Nipponbare)的热激转录因子基因,它们代表了水稻中所有的热激转录因子基因家族的成员,同时代表了热激转录因子基因家族在单子叶植物和双子叶植物的被子植物中的主要的进化谱系。我们在此基础上作了进化分析,对系统发生树进行进一步的分析,发现了一个双子叶植物特异性的组。这些结果对进一步研究水稻中热激转录因子家族的功能基因组提供了坚实的基础。推测了热激转录因子基因在进化过程中的基因缺失和复制事件,还鉴定出9对旁系同源基因对,为研究水稻热激转录因子家族进化历史和水稻基因组进化提供了证据。我们的分析表明热激转录因子基因在这种模式植物中被广泛的表达,这个结果进一步说明了该转录因子家族的重要性。关键词: 热激转录因子; HSF ; 水稻; 进化分析;
Abstract: The heat shock transcription factors (HSFs) are the major heat shock factors regulating the heat stress response. They participate in regulating the expression of heat shock proteins (HSPs), which are critical in the protection against stress damage and many other impor-tant biological processes. Study of the HSF gene family is important for understanding the mechanism by which plants respond to stress. The completed genome sequences of rice (Oryza sativa) and Arabidopsis (Arabidopsis thaliana) constitute a valuable resource for comparative genomic analysis, as they are representatives of the two major evolutionary lineages within the angiosperms: the monocotyledons and the dicotyledons. The identification of phylogenetic relationships among HSF proteins in these species is a fundamental step to unravel the functionality of new and yet uncharacterized genes belonging to this family. In this study, the full complement of HSF genes in rice and Arabidopsis has probably been identified through the genome-wide scan. Phylogenetic analyses resulted in the identification of three major clusters of orthologous genes that contain members belonging to both species, which must have been represented in their common ancestor before the taxonomic splitting of the angiosperms. Further analysis of the phylogenetic tree reveals a possible dicot specific gene group. We also identified nine pairs of paralogs, as evidence for studies on the evolution history of rice HSF family and rice genome evolution. Expression data analysis indicates that HSF proteins are widely expressed in plants. These results provide a solid base for future functional genomic studies of the HSF gene family in rice and Arabidopsis.
Keywords: heat stress transcription factor; Oryza sativa (rice); phylogenetic analysis;
1 前言
热激转录因子(heat shock factor, HSF)在热激反应中起着非常重要的调节作用,是热激反应中的主要调控因子。热激转录因子的末端组分是信号转导途径, 可以调节基因的活性对热激和其他胁迫作出响应。经过热激活化的热激转录因子可以识别并特异性地结合在热激蛋白(heat shock protein, HSP)基因启动子区热激元件(heat shock element, HSE)的保守基序上,从而开启与关闭热激蛋白基因, 诱导HSPs的转录, 完成其相应的生物学功能[1]。
虽然植物的HSF在种类、功能和分子量大小上各不相同, 但其结构却非常的相似。在已经研究出的HSF中有几个重要的结构域: DNA 结合域、寡聚核定位信号、C端的7元重复及激活域。其中主要的保守结构是DNA结合域和寡聚域,其它区域表现出的同源性只存在于亲关系相近HSF中[2]。
Ritossa (1962)在研究黑腹果蝇时发现了热应激反应(Heat shock response)。之后,很多学者对其进行了深入研究,发现动物、植物、细菌等,都具有这一特性。在生物化学及遗传学技术的进步下,热休克蛋白(Heat Shock Protein , HSP) 及热休克基因被逐渐的发现与探知。如今,人们已经较为清楚的了解HSP的结构及其在热应激反应中的功能。同时, 研究人员也在逐渐的重视热应激反应的调节[3]。
在高于正常生长温度5℃以上的热激条件下, 生物体体内会迅速合成一些热激蛋白。通过研究表明HSPs普遍存在于细菌及高等真核生物的整个生物界,并且在所有的活细胞中都起着非常重要的作用。热激蛋白基因表达调控的主要方式是转录水平的调控,在所有的生物中,经过热激活化后的热激转录因子可以识别并存在于hsp基因上游启动子区域的热激元件上从而诱导hsp的转录。因此,热激基因表达转录调节的中心机制是HSF活性的调节[2]。
由于全球气候不断变暖,高温热害对水稻生产的影响也日益加剧。在高温环境下,植物本身会产生相应的应激反应,其中热激基因表达迅速增加,热激蛋白迅速积累,并帮助相关蛋白重新折叠、稳定、组装、胞内运输和降解,使植物在高温环境中得以存活。在一类专门的转录因子-热激转录因子(Heat stress transcription factors,Hsfs)的调控下,这类热激蛋白在高温环境中得以表达,并且在HSP 基因转录时可以和其启动子区的热激元件保守序列特异性结合,调控热激蛋白基因的开启与关闭,完成其相应的生物学功能[4]。
2 材料与方法
2.1植物HSF超家族转录因子的鉴定
为了对植物HSF超家族转录因子进行功能分析,我们从植物TFDB数据库中下载了相关物种的HSF转录因子超家族序列(http://planttfdb.cbi.edu.cn/)[5]。这些HSF家族序列分别来自拟南芥基因组序列(Arabidopsis)(http://brassicadb.org/ brad/index.php);水稻(Oryza sativa)基因组序列 (http://rice.plantbiology.msu.edu/, release 5.0);短柄草(Brochypodium distachyon)基因组序列 (http://www.brachypodium.org/);高粱(Sorghum bicolor)基因组序列 (http://www.plantgdb.org/SbGDB/)。在得到相关物种的HSF基因家族序列之后,我们的首要工作便是对于这些HSF超家族基因进行结构域鉴定。首先,这些蛋白的结构域都通过Pfam程序(http://pfam.sanger. ac.uk/) [6, 7]进行分析,若存在HSF结构域,则认为该候选蛋白属于HSF蛋白家族,若未能检测出HSF结构域,则认为其不属于该家族。随后,作为最终的序列质量刷选标准,我们将这些HSF超家族转录因子的保守结构域采用SMART 数据库进行进一步的分析(http://smart.embl-heidelberg.de/) [8]。此外,针对水稻HSF基因家族,我们从RGAP中下载每一条记录的基因序列、蛋白质序列、CDS序列,获得每一条记录的外显子数、蛋白质氨基酸数,并且从KOME(http://cdna01.dna.affrc.go.jp/cDNA/)网站中获取其mRNA获取号,从ExPASy数据库(http://www.expasy.org/)中获取其蛋白质等电点。
2.2 蛋白序列的比对和水稻HSF蛋白系统发生的进化树构建
水稻HSF全长蛋白的多序列比对通过ClustalW程序进行分析。HSF蛋白家族特定保守区域氨基酸的保守性我们通过WebLogo程序进行分析[9];系统发生树的构建和分析主要通过Mega5软件进行(http://www.megasoftware.net/)[10]。我们主要挑选HSF蛋白的保守区域进行进化树的构建,我们采用邻接法(Neighbor-Joining Method,NJ)来进行进化树的构建,设置Bootstrap为1000次重复。
2.3 HSF保守结构域的鉴定和分析
我们采用MeMe程序(Multiple EM for Motif Elicitation) (http://meme.nbcr.net/meme/cgi-bin/meme.cgi)[11]对水稻HSF转录因子超家族进行结构域的分析。在线程序MeMe的参数设置为:(1) 基序重复的数量为“any”; (2) 基序的长度为6~200; (3) 预测基序的数量为30。
2.4 HSF转录因子家族在水稻,短柄草,高粱中的同源性分析。
水稻HSF基因在染色体上的复制分析主要通过植物基因组复制数据库进行分析(PGDD) (http://chibba.agtec.uga.edu/duplication/)[12]. HSF家族在水稻染色体上的复制情况我们通过MapInspect (http://www.dpw.wau.nl/pv/pub/MapComp/)软件进行构建。
2.5 水稻HSF转录因子家族的组织表达分析以及根茎组织对于不同激素的响应
我们基于水稻基因芯片数据(http://ricexpro.dna.affrc.go.jp/data-set.html)来分析水稻HSF基因的表达情况。这些组织部位包括叶片和叶鞘、根、茎、穗、花药、雌蕊、外稃、内稃、胚珠、胚和胚乳.最后我们对这些HSF蛋白在不同组织中的表达水平通过Cluster程序 (http://bonsai.hgc.jp/~mdehoon/ software/cluster/software.htm) 进行层次聚类分析,其结果通过TreeView(http://jtreeview.sourceforge. net/)软件对数据结果进行可视化显示[13] ;此外,我们从水稻基因芯片数据获得了水稻根茎组织对于(Abscisic acid (ABA), Gibberellin, Auxin, Brassinosteroid, Cytokinin和Jasmonic acid (JA)六种不同激素的表达数据,并将这些数据通过Cluster程序进行层次聚类分析,其结果通过TreeView软件对数据结果进行可视化显示。
3 结果与分析:
3.1 水稻HSF转录因子家族的鉴定
首先, 我们从NCBI数据库中选取HSF结构域的氨基酸序列, 然后利用Blastp程序, P-value值设为10- 4, 最后我们对水稻全基因组蛋白质数据库进行搜索, 寻找水稻基因组中所有候选的含HSF蛋白。所有符合要求的序列再通过Pfam (蛋白家族数据库, http:/ /pfam. wust.l edu /hmm search. shtml)来验证是否含有HSF结构域( Threshold= 0.9)。第三步, 所有已被选取基因的核苷酸序列通过Clustal X的方法进行多序列排列, 根据排列的结果,去除候选基因中的重复序列。最终我们收集了所有含有HSF保守结构域的转录因子基因(表1)。对25个水稻HSF基因的HSF结构域氨基酸序列进行Clustal X进行多序列比对(图1),我们通过类似的方法对拟南芥、高粱,短柄草的数据库进行了分析,分别得到了这三个物种中的HSF蛋白转录因子家族数据。
3.2 水稻HSF转录因子家族的进化分析
针对水稻HSF转录因子的系统发生关系的研究可以帮助我们判断这些基因进化上的亲缘关系。我们通过ClustalX程序对水稻HSF结构域进行多序列比对,随后又采用Mega5软件针对HSF的保守区域进行了进化分析(图2)。从该结果上来看,虽然水稻中的HSF基因具有较高的同源性,但其仍然可以明显的区分出差异性。为了进一步分析水稻HSF转录因子与其他植物转录因子的进化关系,我们又对水稻、拟南芥、短柄草和高粱四种植物中重要的模式物种的HSF转录因子进行了进化分析。我们采用NJ方法构建了无根进化树(图3),并且初步将这四个不同物种中的HSF转录因子按照其亲缘关系远近分成若干个分支。每一个分支提示其可能在物种演化过程中具有更高的序列相似性。总体而言,基本上每一个物种在这些分支上都存在相关基因,表明这些HSF基因的分化要早于水稻、高粱、拟南芥和短柄草这些物种自身的分化。
3.3 水稻HSF家族全长蛋白的结构性分析
为了进一步对水稻中的HSF基因的分化性做出鉴定,我们利用MEME (Multiple Em for Motif Elicitation) 程序对于HSF蛋白家族进行了研究。根据我们的参数设置,总共30个保守结构域在25个水稻HSF家族中被发现(表2),其中Motif 1代表了HSF本身的保守结构域,这一结构域在所有HSF蛋白中都存在。此外,其他一些在部分蛋白之间共有的结构域也在水稻HSF家族中被发现了,这些结构域可以帮助我们判断水稻HSF亚家族提供了帮助(图4)。同我们的进化树相似的结果,大部分的具有相似的结构域的HSF转录因子在进化树上的位置也相互靠近。
3.4 水稻HSF转录因子家族染色体复制分析
水稻具有25个含有保守HSF结构域的转录因子家族,分布在除11,12号染色体之外的所有染色体上面。其中3号染色体具有最多的HSF转录因子基因(分别具有6个),而最少的则是4,5,10三条染色体,分别只有一个HSF转录因子。为了研究这些同源基因在水稻上染色体区段之间复制情况,我们将这些转录因子的全长蛋白序列输入植物染色体复制数据库网站进行分析。通过我们的分析,我们发现有8对基因在不同染色体之间存在复制情况(表3),随后我们将这些具有染色体复制关系的结果通过Mapinspect软件进行可视化分析(图5)。从我们的结果上看,具有大区间染色体复制的区域有5个,而只有少量基因在染色体上存在复制的区域有3个(表3)。其中,3号染色体上的Os03g53340和Os03g58160分别和7号染色体上的同一个基因Os07g08140具有线性对应关系;4号染色体上的Os04g48030和9号染色体上的Os08g43334则与9号染色体上的Os09g35790具有线性关系。
3.5 HSF转录因子超家族在水稻不同组织中的表达模式分析
HSF转录因子的表达几乎涉及整个植物的生长过程之中,这些组织包括叶片、叶鞘、根、茎、穗,花药、雌蕊、外稃、内稃、胚珠、胚和胚乳。因此,我们希望通过构建Heatmap图来综合分析这些转录因子在水稻中的表达情况。水稻HSF转录因子不同组织中HSF基因的表达水平的数据来自于网站水稻生物芯片数据库(http://ricexpro.dna.affrc.go.jp/data-set.html)。此外,为了更加直观的对表达情况有一个综合认识,我们通过Cluster软件对水稻HSF转录因子家族的表达进行聚类分析,这一结果最终通过Treeviewer所构建的Heatmap图谱进行显示(图6),这一结果可以帮助我们综合化的分析水稻HSF转录因子的基因表达情况,为以后功能分析奠定基础。
3.6水稻HSF转录因子家族的根茎组织对于六种不同植物激素的响应机制
一个基因的表达模式总是和这个基因的功能紧密相关的,因此我们通过生物芯片的数据来综合分析水稻HSF转录因子家族对于不同激素的响应机制。这些激素包括脱落酸(Abscisic acid):脱落酸存在于植物的叶、休眠芽、成熟种子中。通常在衰老的器官或组织中的含量比在幼嫩部分中的多。它的作用在于抑制RNA和蛋白质的合成,从而抑制茎和侧芽生长,因此是一种生长抑制剂,有利于细胞体积增大;赤霉素(Gibberellin):高等植物中的赤霉素主要存在于幼根、幼叶、幼嫩种子和果实等部位,由甲羟戊酸经贝壳杉烯等中间物合成,后来证明其中含有一种能诱导细胞分裂的成分,赤霉素在植物体内运输时无极性,通常由木质部向上运输,由韧皮部向下或双向运输。赤霉素最显著的效应是促进植物茎伸长;生长素(Auxin) :在低等和高等植物中普遍存在,生长素主要集中在幼嫩、正生长的部位,如禾谷类的胚芽鞘,它的产生具有“自促作用”,双子叶植物的茎顶端、幼叶、花粉和子房以及正在生长的果实、种子等;衰老器官中含量极少;油菜素甾醇(Brassinosteroid):油菜素甾醇是甾体类激素,与动物甾体激素的作用机理不同。其具有促进细胞伸长和细胞分裂、促进维管分化、促进花粉管伸长而保持雄性育性、加速组织衰老、促进根的横向发育、顶端优势的维持、促进种子萌发等生理作用。高等植物细胞分裂素存在于植物的根、叶、种子、果实等部位。根尖合成的细胞分裂素可向上运到茎叶,但在未成熟的果实、种子中也有细胞分裂素形成。细胞分裂素(Cytokinin):它的主要生理作用是促进细胞分裂和防止叶子衰老。绿色植物叶子衰老变黄是由于其中的蛋白质和叶绿素分解;而细胞分裂素可维持蛋白质的合成,从而使叶片保持绿色,延长其寿命。细胞分裂素还可促进芽的分化。在组织培养中当它们的含量大于生长素时,愈伤组织容易生芽;反之容易生根。可用于防止脱落、促进单性结实、疏花疏果、插条生根、防止马铃薯发芽等方面; 茉莉酸Jasmonic acid (JA):茉莉酸是存在于高等植物体内的内源生长调节物质,有抑制植物生长、萌发、促进衰老、提高抗性等生理作用。
来自生物芯片的数据提供了根和茎组织在这些不同植物激素不同时间段的响应机制,我们将这些数据收集下来,通过Cluster和treeviewer程序进行HeatMap图显示(图7)。这一结果能够直观的告诉我们,HSF转录因子的不同基因在不同激素处理下对于根和茎的组织的响应,从而帮助我们判断这些基因的生物学功能提供帮助。
表格1:HSF在水稻中的基因号分析
Table 1: Basic information of HSF family genes in rice
序 号 | 基因号 Gene | 染色体位置(Mb) Chromosome localization | 蛋白大小 (Amino acid) | 分子量(Da ) | 等电点(pI) | 基因号2 |
Os01g39020 | 21,938,865 | 402aa | 43912 | 7.4725 | Os01g0571300 | |
Os01g43590 | 24,967,398 | 348aa | 37755.8 | 6.691 | Os01g0625300 | |
Os01g53220 | 30,582,485 | 250aa | 27219 | 8.9496 | Os01g0733200 | |
Os01g54550 | 31,370,225 | 440aa | 49387.4 | 5.0936 | Os01g0749300 | |
Os02g13800 | 7,463,932 | 298aa | 31919.5 | 6.5176 | s02g0232000 | |
Os02g29340 | 17,428,027 | 475aa | 52884.7 | 5.1743 | Os02g0496100 | |
Os02g32590 | 19,309,594 | 498aa | 55098.5 | 4.5033 | Os02g0527300 | |
Os03g06630 | 3,342,254 | 379aa | 43706.6 | 8.902 | Os03g0161900 | |
Os03g12370 | 6,537,569 | 410aa | 45465.6 | 4.8196 | Os03g0224700 | |
Os03g25120 | 14,342,679 | 305aa | 33950.9 | 6.3494 | Os03g0366800 | |
Os03g53340 | 30,603,964 | 376aa | 40847.5 | 4.7183 | Os03g0745000 | |
Os03g58160 | 33,105,828 | 357aa | 40258.9 | 5.8292 | Os03g0795900 | |
Os03g63750 | 35,989,011 | 506aa | 55277.2 | 4.7268 | Os03g0854500 | |
Os04g48030 | 28,574,411 | 305aa | 32809 | 4.9476 | Os04g0568700 | |
Os05g45410 | 26,344,414 | 459aa | 51163.9 | 4.9482 | Os05g0530400 | |
Os06g35960 | 20,996,264 | 278aa | 28971.3 | 8.2372 | Os06g0553100 | |
Os06g36930 | 21,761,304 | 331aa | 36103.3 | 36103.3 | Os06g0565200 | |
Os07g08140 | 4,139,160 | 372aa | 41524.1 | 4.3882 | Os07g0178600 | |
Os07g44690 | 26,673,639 | 310aa | 34450.8 | 7.0637 | Os07g0640900 | |
Os08g36700 | 23,158,296 | 380aa | 41386.7 | 9.6379 | Os08g0471000 | |
Os08g43334 | 27,380,765 | 616aa | 66415.6 | 8.4192 | Os08g0546800 | |
Os09g28200 | 17,109,289 | 394aa | 42036.1 | 8.6417 | Os09g0455200 | |
Os09g28354 | 17,221,426 | 302aa | 32799 | 9.7192 | Os09g0456800 | |
Os09g35790 | 20,591,230 | 454aa | 47014.2 | 4.9112 | Os09g0526600 | |
Os10g28340 | 14,746,101 | 358aa | 40784.6 | 4.6532 | Os10g0419300 |
图1:HSF蛋白结构域在水稻中的保守性分析(图1A,B)
利用ClustalW对水稻中25个典型的HSF结构域的氨基酸多序列比对分析结果(图1A);该HSF结构域的图示化分析结果,氨基酸序列对应与图1A的结果
Figure 1. HSF domains are highly conserved across all HSF proteins in rice (Figure 1a,b).
The sequence logos are based on alignments of all rice HSF domains. Multiple alignment analysis of 30 typical rice HSF domains was performed with ClustalW. The bit score indicates the information content for each position in the sequence.
图2:水稻HSF基因进化分析, 系统进化树采用邻接法由MEGA 5.0程序构建,自举值(Bootstrap)设置为1000。
Fig. 2 Neighbor-joining phylogenetic tree of the HSF gene family
图3:HSF转录因子在水稻,拟南芥,段炳草和高粱中的多基因组进化分析 。每一个HSF基因亚家族通过一种特定的颜色显示,Bootstrap值设置为1000.
剩余内容已隐藏,请支付后下载全文,论文总字数:18401字