一种新兴模型系统的种系基因组学细胞器: ——泥炭藓 (泥炭沼泽)外文翻译资料
2023-01-04 11:00:31
一种新兴模型系统的种系基因组学细胞器:
——泥炭藓 (泥炭沼泽)
A. Jonathan Shaw1,*, Nicolas Devos1, Yang Liu2, Cymon J. Cox3, BernardGoffinet2,Kjell Ivar Flatberg4 and Blanka Shaw
摘要:背景和目标:以泥炭藓为主导的泥炭沼泽占到以部分分解植物物质(泥炭)形式的陆地碳库的30%,因此,目前泥炭藓研究的焦点是关于生物地球化学和控制全球气候。泥炭藓在影响生态系统功能的重要生态特征上存在差异,目前正在对选定的泥炭藓物种进行基因组测序。作为一种新兴的模型系统,泥炭藓的这些资源将促进核苷酸变异与植物功能性状联系起来,并通过这些性状与生态系统过程联系起来。有一个泥炭藓坚实的系统发育框架对于物种特异性特征的比较分析至关重要,但泥炭藓的主要分支之间的亲缘关系一直难以解决,因为该属经历了快速辐射。本文提出了一个基于细胞器基因组序列(质体、线粒体)的系统发育关系假说。
方法:我们从38种(包括3个外群)的两种细胞器基因组中获得了273 753个核苷酸序列。 使用多种方法应用核苷酸和氨基酸序列来进行系统发育分析。 泥炭藓系统发育分析源来自泥炭藓纲,Eosphagnum和Flatbergium相关的序列。
主要成果:数据的系统发育分析集中在以下属关系上;( Rigida(((Subsecunda)(Cuspidata))((Sphagnum)(Acutifolia)))。所有关系都得到了物种在两个主要的进化枝的所有关系都得到了大力支持 (即Subsecunda Cuspidata和Sphagnum Acutifolia),其中包括gt; 90%泥炭藓物种,生态位的差异与影响生物地球化学循环的其他功能特征有关。 泥炭藓纲线粒体内含子的存在/缺失在不同种类和属间存在差异。提出了两种新的命名组合:Eosphagnum和 Flatbergium。
结论:现在新解决的关系允许形态学,生物化学和生物化学的系统发育分析泥炭藓物种间的生态特征。结果澄清了关于子属关系和属内分类的长期分歧。
关键词:苔藓植物; 线粒体基因组; 细胞器基因组;系统发育学
泥炭藓(泥炭藓属)在形态和生态的各个方面都是一种独特的植物。虽然在除南极洲以外的每一个大陆上都有相似的物种,但它们在北部特别突出和多样化,它们是泥炭地植被的关键物种,形成于排水不良的基质上,是这些群落中重要的生态系统工程师。多达20种或更多的同域泥炭地物种可以同时出现在北方泥炭地,并根据其微生境的化学和水文梯度进行分化。由于这些原因,以及泥炭藓主导的泥炭地是相对易于管理的低多样性群落,因此,它们长期以来一直作为研究群落结构和种间相互作用的模型。
近几年来,泥炭藓也成为了扩展微进化研究的焦点,包括种内的系统地理学,多倍体,表型可塑性和繁殖生物学。可以说,对泥炭藓的种群遗传学和分子系统学研究比任何其他苔藓植物属都要多。
而以泥炭藓为主导的生物地球化学的研究,是目前研究的一个热点问题。地球有机碳库中约有30%(455-547 Gt)的有机碳储存在有机碳库中。泥炭地目前的功能是碳汇,几千年来一直如此,但它们也是大气中甲烷的重要来源,每年以二氧化碳和甲烷的形式释放约276 Tg的碳。气候变暖、冻土融化、火灾频发以及与全球气候变化相关的植物与微生物相互作用的变化,都可能导致泥炭地从碳汇向碳源过渡。不同种类的泥沼在影响生物地球化学过程的功能特性上存在差异,因此,改变群落成员,以及可能改变种内基因库,可能会扩大规模,进一步影响全球气候。。因此,泥炭地的生物地球化学和影响生物地球化学循环的泥炭地特征引起了人们的极大兴趣。
尽管众所周知,泥炭藓属的物种很难鉴定,但它很容易与其他苔藓植物区别开来。配子体相对较大,通常具有侧枝束,这些侧枝束被分化为所谓的扩张型和垂型。茎尖附近的分枝聚集成密集的顶生孢蒴;孢蒴的形态影响群体“树冠”的形状,因此影响水关系和其他生态过程。泥炭藓配子体缺少根(像所有其他苔藓一样),也缺少将其他苔藓固定在其底物上的假根。其配子体的叶片是单层的,由二形细胞组成,大的、空的、透明的细胞包围在狭窄的绿细胞网络中。透明细胞储存水,和还有各种微生物,包括固氮型菌,产甲烷型菌和各种小型真核生物。 泥炭藓的孢子体生长在(母体)配子体起源的假足上,而孢子体本身仅由一个由肿胀的足附着在假足上的孢子囊组成。该泥炭藓亚属通常具有良好的形态学意义:区分亚属的特征包括叶绿素糖细胞的横截面形状和透明细胞孔的大小,数量和排列。一些已知北方物种是属于亚种间的异源多倍体。亚属间异源多倍体也可从南半球得知。
为了促进泥炭藓和泥炭地的生态和进化研究,我们需要更多地了解泥炭藓的生物化学和生理学知识,物种和个体植物差异的遗传基础,以及泥炭藓物种间的系统发育关系。为此,联合基因组研究所(JGI;美国能源部)最近批准了对代表性泥炭藓物种的基因组和转录序列进行测序的提议。众所周知,系统发育关系必须考虑到区分遗传自唯一共同祖先的性状与独立获得并与环境参数相关的性状。因此,解决泥炭藓内的系统发育关系是建立和授权泥炭藓作为生态和气候研究模式的一个重要组成部分。最近的一些研究集中在近缘物种之间的亲缘关系上,但该属似乎已经迅速地多样化,因此,它与近缘物种之间的关系也随之发生了变化。因此,由于在基于有限位点的系统发育重建中,主要分支(亚属)之间的内部分支较短,因此它们之间的关系一直难以解决。在这里,我们分析了细胞器基因组序列(质体和线粒体),以基于几乎完全的质体和线粒体序列来解析泥炭藓内的深部分支(总共273753个核苷酸)。整个细胞器基因组序列已被用于解决苔藓植物、被子植物和陆地植物或种子植物的基因组进化和系统发育关系。
我们在本研究中的主要目标是解决泥炭藓内部的深层关系(即主要分支/亚属之间的关系)。虽然我们没有获得完整的细胞器基因组序列,但我们也能够评估泥炭藓属物种的质体和线粒体基因组的基因组成和顺序是否与其他苔藓植物谱系中记录的一致。最后,我们利用泥炭藓的系统发育重建来推断该属的生态演化模式。。
材料和方法:在分析中纳入了35种泥炭藓物种和3种外群物种(补充数据表S1)。shaw识别出的五个亚属中,每个亚属都由2-11个物种表示,三个外群为Eosphagnum rigescens,Flatbergium sericeum 和 F.novocaledoniae.。这三个外群分类群一直都是在泥炭藓中分类的,每一个分类群都是在形态上属于自己的单种亚属(或区段)。然而,多基因系统发育分析表明,Flatbergium sericeum 和 F.novocaledoniae.属于泥炭藓纲,但与所有已知的泥炭藓物种高度不同,且不属于泥炭藓。Eosphagnum rigescens是E.inretortum的一个早期名称,根据本文的系统发育分析,我们还将Sphagnum novocaledoniae转移到Flatbergium。
选择由Shaw等人(2010a)识别的泥炭藓属亚属代表物种进行分析,以及一些未解决的物种,以及一些神秘的物种,在过去有时被包括在它们自己的亚属中[或节-Shaw等人(2010年a)之前的大多数作者使用节而不是亚属来表示泥炭藓主要的属内分支]。Sphagnum wulfianum代表一个特定的类别,Polyclada和S.Aongstroemii是Insulosa类别内的唯一成员。.Shaw等人(2010a)将polyclada和squarrosa(后者在世界范围内约有四种,在这里以S. squarrosum and S. teres为代表)确认为是.Acutifolia亚属中的部分。Mollusca,另一个单特异性的部分,已经在Cuspidata 亚属内得到了强有力的支持。; S. tenellum不包括在目前的分析中。本分析中也没有包括S. macrophyllum 和 S. cribrosum,从Isocladus属中 (Lindberg, 1862),或是Isocladus节Crum (1984)和McQueen amp; Andrus (2007)分离出来,但被Shaw等人证明嵌套在subscunda属内。所有样本的凭证标本信息包括在分析中的表格如表S1所示。在这项研究中包括的35种泥炭藓中,有28种单倍体配子体和6个是基于多个微卫星位点杂合度的异源二倍体。 Sphagnum australe 和 S. falcatulum包括异源二倍体和异源三倍体。S.Contortum是配子体单倍体物种,,先前被假设为基于质体和核DNA序列不一致的同倍体杂交。下面的研究结果表明,S. contortum具有subg.Cuspidata的细胞器基因组,但该种与subg.Cuspidata共有。基于核基因的亚种,根据形态学分类为该亚属。
DNA提取和新一代测序
从38个样本中每一个样本中采集约0.5g干燥的配子体组织。植物材料在液氮中研磨,用Macherey Nagel的核自旋植物II MIDI试剂盒提取总基因组DNA。提取后,用量子荧光计系统定量DNA浓度,并用定量ITTM-DS-DNA-Br分析。对于每个样本,使用100 ng基因组DNA用于使用Trueseq纳米DNA试剂盒制备光源库。为每个样本生成成对的端库,并对库进行索引,以允许样本的多路复用。在对一个hiseq2500快速流动细胞进行测序之前,24个样品以等摩尔浓度进行了汇集,而剩下的14个样品进行了汇集,并且在Illumina hiseq2000流式细胞的一条通道上测序,所有Illumina测序在杜克基因组和计算生物学中心完成,生成100 bp配对的末端序列。所有组装好的质体和线粒体基因组都保存在GenBank中(见表S1genbank登记号)。
重新组装和质体、线粒体基因组注释
每次读取的3 端使用FASTQ质量修剪器根据质量进行修剪,质量分数阈值为25。当有Illumina序列适配器存在时,使用FastQ/A剪接器剪断,仅保留修剪和剪接后两个序列均长于40 bp的成对末端读数,以便重新组装或参考注释。为了产生质体和线粒体基因组的参考序列,原始读取可以被映射到样本的原始序列。使用CLC基因组工作台和默认参数将ND2735(S.Palustre)从头组装成Contigs。从头组装的质体和线粒体基因组进行Geneious注释并用作其余37个样品/物种的原始读数的参考。使用CLC基因组工作台中的映射算法,将原始读取映射到质体和线粒体参考基因组。由原始reads映射得到的一致的质体和线粒体序列被导出到每个样本中,并在参考序列的覆盖率低于4个reads阈值的地方插入“N”。
序列比对与系统发育重建
构建了6个数据集,每个数据集有38个分类群,包括三个外群:(1)质体基因组序列(130953个核苷酸);(2)86个质体蛋白质(24741个氨基酸);(3)线粒体基因组序列(142800个核苷酸);(4)37个线粒体蛋白质(10315个氨基酸);(5)质体和线粒体基因组组合序列(273个,753个核苷酸);和(6)结合质体和线粒体蛋白质(123个蛋白质,35 056个氨基酸)。基因组序列,包括质体和线粒体的,都是由肉眼调整的。蛋白质编码基因使用TranslatorX进行排列,并使用P4和Biopython库结合使用特殊的Python脚本。以Akaike信息准则(AIC1)为选择准则,利用模型生成器确定了最优替代模型。此外,还采用了链菌特有的验证蛋白模型,即gcprev和stmtrev,分别对质体蛋白和线粒体蛋白进行分析。使用400个引导复制用RAxML7.0.4版本软件进行最大似然(ML)分析,每一次进行两次搜索。利用MrBayes(Ronquist and Huelsenbeck, 2003),Phylobayes (Lartillot and Philippe, 2004) 和 P4进行贝叶斯推理。马尔可夫链蒙特卡罗(MCMC)链在MRBayes中重复运行500万代,在P4中重复运行200万代,直到满足收敛诊断(运行之间最大分支差异lt;0.3)。通过计算分裂支持的平均标准偏差(asdoss),确定了MrBayes和p4独立运行之间的收敛性:将lt;0.01的值视为足够低,以表示独立运行之间的收敛性,并将结果合并。辅助模型参数除替代率外,还包括一定比例的不变位数(I)和近似于四个离散率的伽玛分布的位置速率(Г4)变化。使用P4进行的MCMC分析采用了多分支(PP; Lewis et al., 2005),在叶绿体和线粒体数据分析中使用了相对速率参数(RR)。模型组合或者通过最大似然估计(Fest),或者固定到模型规格(Fmod)。在P4中,通过添加成分向量(cvs)使用ndc
剩余内容已隐藏,支付完成后下载完整资料
英语原文共 12 页,剩余内容已隐藏,支付完成后下载完整资料
资料编号:[278838],资料为PDF文档或Word文档,PDF文档可免费转换为Word