兰花研究的后基因组学时代外文翻译资料
2022-12-30 11:17:54
兰花研究的后基因组学时代
摘要:兰科植物是30万余种被子植物中最大的一科,约有3万余种。兰花几乎可以在地球上任何一处栖息地繁殖,这表明兰花具有重要生态与进化重要性。当前已经对四个兰花基因组进行了测序,包括了蝴蝶兰、铁皮石斛、黑节草、剑兰。在这里,我们回顾了后基因组学时代兰花研究的最新进展和方向。这些包括兰花基因组进化,基因组图谱(全基因组关联分析,遗传图谱,物理图谱),比较基因组学(特别是受体样激酶和萜烯合酶),次级代谢组学和基因组编辑。
关键词:比较基因组学;基因组编辑;基因组进化;全基因组关联分析;兰科;蝴蝶兰;后基因组时代;受体样激酶;次级代谢组学;萜烯合酶
1背景
兰科植物约有30000种,占被子植物总数的十分之一(Xiao等)。超过70%的兰花是附生生长,具有明显的生理特性(Xiao等)。兰花对不利的环境适应性很强。他们成功地开拓了地球上每一个阳光普照的栖息地。根据蝴蝶兰全基因组测序所揭示的分子钟(Cai等),兰花的出现发生在晚白垩世(76mya),并使兰花越过侏罗纪大灭绝的边界(66mya)。这与最古老化石记录(76-84mya)的日期观测结果一致(Ramirezetal)。据推测,兰花的物种形成率极高(Gill.),即使是现在,世界范围内仍有兰花新品种的记录,这表明兰花的进化从未停止过。兰科植物种类繁多,可分为五个亚科:拟兰亚科、香荚兰亚科、杓兰亚科、红门兰亚科、树兰亚科(图1)。它们是不同种类的花,这种异质性与传粉媒介和兰花之间的特殊相互作用有关(Cozzolino和Widmer)。兰花的独特特征包括兰花与菌根真菌之间的专一性相互作用(Otero和Flanagan)以及C3和/或景天酸代谢光合作用(Mascher)和附生生长形式(Silvera等.2009年)。兰花具有独特的繁殖策略,有助于成功地适应其生态开发(Yu和Goh)。
台湾的兰花种植和杂交技术在全球兰花市场上非常受欢迎。蝴蝶兰外形优雅,有些甚至带有迷人的香气,兰花寿命长,对育种家、苗圃和消费者有很强的吸引力。在过去的20年中,兰花研究人员致力于建立兰花基因组学研究的基础。这些包括核型分析(Kao等;Lin等),基因组大小分析(Chen等),表达序列标签(EST)的建立(Hsiao等),基因组学和转录组学数据库(Fu等人;Su等;;Tsai等),细菌人工染色体末端测序(Hsu等),叶绿体基因组测序(Chang等;Pan等),miRNA(Lin等)和全基因组测序(Cai等;Yan等;Zhang等)。此外,兰花功能基因组学研究已可通过使用兰花叶病毒感染克隆,用于病毒诱导的基因沉默,来评估花色、花形态发生和花香研究中涉及的基因功能(Lu等;Hsieh等)。在微繁殖中,已开发出多倍体诱导技术来规避杂种不相容性(Sattler等)。
本文综述了后基因组时代兰花研究的相关进展和兰花研究的未来方向。其中包括兰花基因组进化、基因组图谱、比较基因组学、次级代谢组学和基因组编辑。
2兰花基因组进化
2.1基因组大小变异
被子植物的基因组大小的变异范围从旋刺草(狸藻科)(仅0.065pg)到日本重楼(藜芦科)的巨大基因组(152.23pg),范围将近2400倍,Leitch等在单子叶植物中观察到许多具有大基因组的物种,如石蒜科、天门冬科、百合科、藜芦科和兰科植物。其中,基因组大小为168倍(1C=0.33-55.4pg)的兰科植物可能是最具多样性的被子植物家族(Leitch等)作为物种最丰富的亚科,树兰亚科的基因组含量超过60倍(1C=0.3-19.8pg),是兰科植物中基因组大小变化最大的亚科植物。兰科中最大的子代来自兰科亚科的物种,其基因组的范围更为有限(1C=2.9-16.4pg),变化不超过6倍。杓兰亚科的基因组大小只有10倍(1C=4.1-43.1pg)。在所有亚科中,杓兰亚科的平均基因组大小最大(1C=25.8pg)。仅估计香荚兰亚科少数物种的基因组大小,范围从1C=7.3pg到55.4pg。在这个亚科中,朱兰的基因组大小最大(1C=55.4pg)(Leitch等)。原始亚科拟兰亚科包含计算出的1C值,拟兰的范围从0.38pg到NeuwiediaZolligivar.javanica的5.96pg,接近16倍的范围。台湾本地蝴蝶兰的亲本为台湾本地蝴蝶兰,其基因组相对较小,分别为1.6和1.4pg/1C(Chen等)。
2.2兰花转录序列的最新进展
由于全基因组表达信息中涵盖的许多数据,高通量EST测序提供了通往基因组的途径。在开发下一代测序技术(Zhang等)之前,最流行的测序方法是Sanger法,该方法已应用于EST测序项目。Tan等从文心兰的假鳞茎减法EST文库中获得了1080个减法EST。Tan等发现多数EST与碳水化合物代谢和调节功能、甘露糖、果胶和淀粉的生物合成、压力以及运输有关。为了说明蝴蝶兰生殖器官中表达的基因,Tsai等收集了马尾疟原虫的成熟花芽,并对5593个EST进行了测序和注释。此外,从有气味的拟南芥花芽cDNA文库中测序了2359个EST,推断出与气味生物合成途径有关的EST(Hsiao等)。
快速而低成本的下一代测序技术的迅速兴起极大地提高了我们在细胞中以无与伦比的分辨率和深度全面检查序列信息的能力(Delseny等)。该技术被迅速用于兰花转录组分析(表1)。454技术被独立应用于从三种蝴蝶兰的混合组织中产生8233个重叠群和34,630个单子序列(Tsai等),以及从O.GowerRamsey的六个不同组织中释放的50,908个重叠群(Chang等)。这些数据集广泛地增加了蝴蝶兰和文心兰中表达基因的信息,并加快了与多种生物过程相关的EST的快速鉴定集(Chang等;Hsiao等;Huang等)。通过使用454焦糖测序和Illumina(Solexa)技术鉴定对传粉媒介吸引力有响应的基因,从Ophrys物种中获得了总计121,917个独特的EST(Sedeek等)。传统中草药与454焦磷酸测序和Illumina技术一起能够产生大量EST,用于挖掘铁皮石斛生物碱生物合成途径和多糖生物合成中涉及的基因(Guo等;Zhang等)。Rao等为了提供研究香荚兰的荚果发育的一般资源,结合了454和IlluminaRNA序列技术,为这一重要的兰花经济作物生产了具有高质量组装的从头转录组等。另外,为了提高蝴蝶兰和兰花的园艺价值,研究了蝴蝶兰外植体的褐化叶的转录组(IlluminaHiSeq2000测序)和蝴蝶兰的可变颜色的转录组(454焦磷酸测序)。2015;Zhuetal.2015)。为了研究兰花与真菌的共生关系和兰花种子萌发的分子机制,分别采用454和Illumina来研究长药兰(Perotto等人,2014),杓兰(Zhao等),开唇兰(Liu等)和天麻(Tsai等)的转录组。。
在兰科中,约40%的物种通过景天科酸代谢(Mascher等)固定二氧化碳,表明兰科是植物中最大的CAM进化枝(Silvera等)。为了阐明CAM途径的起源和进化,在不同的时间间隔对源自CAM兰花蝴蝶兰、刀叶石斛和硬叶兰叶片的转录组进行采样,并通过IllumineHiSeq2000进行了测序(Deng等;Zhang等)。他们的结果表明,关键的碳固定途径基因可能主要通过CAM植物中转录水平的变化而进化。应用了多种技术来研究壮观的兰花花形态。这包括来自蝴蝶兰(Hsiao等)、香荚兰(Zhang等;Li等;Yang和Zhu)以及兰花(Orchis,DePaolo等)的发育中的花卉转录组。提出并讨论了与花发育相关的MADS-box基因的分子模型。
最近,也生产了来自兜兰的根转录组,以探索与兰花根发育有关的基因(Li等)。揭示了超过1195个参与次级代谢途径的独特基因,以及参与植物激素生物合成和植物信号转导的609个EST。积累的转录序列可直接用于开发微阵列平台。它也是系统发育分析的资源。例如,基于从蝴蝶兰兰花中收集的EST信息,开发了一种具有14732个独特表达序列的寡核苷酸微阵列,用于比较萼片,花瓣和唇瓣之间的转录组(Hsiao等)。以兰花科的所有五个亚科中分布的10个物种的转录组为特征的三百一十五个单拷贝直系同源物用于研究兰花的系统发生关联(Deng等。结果表明,该策略似乎比使用一些基因标记进行系统发育分析更可靠,更有效,特别是对于那些DNA序列难以扩增的兰花或嗜盐菌物种(Deng等)。
NGS技术不仅用于兰花转录体的鉴定,还用于兰花中小RNA的系统分析(表1)。本文研究了小分子RNA对春药和丹毒开花的调控作用(AnandChan;Chou等;Lin等)。意大利桔梗和青花蕙兰的花发育(Aceto等;DePaolo等;Li等),以及梨状孢子菌与文心兰杂交种之间的相互作用(Ye等)。后来,对来自阿芙罗狄蒂假单胞菌(Chao等)和刀叶石斛(Meng等)的小RNA进行了全面收集。这些努力为小RNA的表达组成和功能提供了有价值的信息,有助于我们更好地了解兰花的功能基因组学。
为了保存和管理兰科植物中大量表达的基因序列,兰花基地从蝴蝶兰属植物的11个不同组织器官和兰科植物5个亚科10种植物的花组织中收集转录组序列(Fu等;蔡等;Niu等)。采用ABI3730、Roche454和Illumina/Solexa的深度测序,获得兰花碱中的EST序列。兰花基地可以在http://兰花基地.itps.ncku.edu.tw/访问。该数据库为兰花生物学和生物技术的数据挖掘和实验研究提供了突出的遗传资源特征。通过Illumina/Solexa和Roche454平台,建立了另一个兰科植物转录组数据库sinica.edu.tw,收集了233924个独特的阿佛洛狄体转录组序列。应用RNA序列分析对具有组织倾向性表达模式的基因进行分类(Su等)。此外,利用Roche454平台从文心兰各器官产生的50908个序列片段被组装到文心兰基因组碱基(http://predictor.nchu.edu.tw/oogb/)(Chang等)。这些EST数据集对于兰花的特异性鉴定、基因组测序的基因注释以及兰花基因组的组织具有重要价值。
兰花基因组测序的现状随着NGS的快速发展和成本的降低,可以实现非模型物种的全基因组测序。第一个里程碑是对蝴蝶兰(一种热带附生兰花)进行测序,并经常用作兰花育种的亲本物种(Cai等)。马术疟原虫基因组是全基因组shot弹枪,并通过Illumina技术测序。基因组大小估计为1.16Gb,包含29,431个预测的蛋白质编码基因(Cai等)。对蝴蝶兰基因组的分析表明,基因组的大部分(约62%)被重复的DNA占据,大部分是转座因子(TEs)。另外,在辐射大多数兰花进化枝之前,发现了兰花特有的古多倍体事件。该物种也是第一个进行全基因组测序的CAM植物,并且CAM途径中涉及的基因家族(alpha;碳酸酐酶)具有明显的扩展。结果表明,蝴蝶兰中CAM光合作用的进化可能与基因复制有关。另外,位于杂合区的基因可能与自身不相容性有关。II型MADS盒进化枝中的基因,包括
E级,C/D级,B级AP3和AGL6进化枝包含比其他植物种类更多的直系同源物。这些扩展的进化枝参与了兰花花器官的发育,可以提供这些花器官身份基因的独特进化途径,从而与兰花的唇和柱的创新发展相一致。此外,蝴蝶兰基因组序列可用于鉴定控制花卉色素沉着模式的MYB基因(Hsu等),TCP基因参与胚珠的发育(Lin等)。
铁皮石斛具有观赏和治疗双重价值,是通过加入NGSIlluminaHiseq2000和第三代PacBio机械而序列化的第二种兰花植物(Yan等)。铁皮石斛的组装基因组的预测基因数为35567,高于蝴蝶兰基因组。在铁皮石斛中,B类MADS-box基因的数量远高于蝴蝶兰,蝴蝶兰有4个成员,为B类AP3样亚科,1个成员为B类PI样亚科。相比之下,石斛基因组中存在19个AP3样基因和5个PI样基因。可能用于全基因组测序的药用植物是杂种而不是本地物种。后来,利用IlluminaHiSeq2000平台对另一种石斛物种进行了全基因组测序(Zhang等)。所预测的28910个蛋白编码基因与蝴蝶兰相当,整个基因组复制事件可与蝴蝶兰共享。石斛对多种生态位的适应可能与许多抗性相关基因的扩展有关。此外,似乎与药物多糖合成相关的葡甘聚糖合成酶基因的广泛重复。研究还发现,MADSbox基因的ANR1、StMADS11和MIKC*在石斛中得到了扩展,这表明这些基因的功能可能与石斛中惊人的植物结构多样性有关(Zhang等)。
最近,对原始兰花深圳兰进行了全基因组测序,该兰花是与兰花科其余部分形成姊妹谱系的两个属之一的代表,为提高我们对兰花起源和进化的理解提供了参考(Zhang等)。通过使用包括Illumina,PacBio和10x基因组学技术在内的不同方法的组合,对深圳农杆菌的基因组进行了测序。基因组组装的总长度为349MB,包含21841个蛋白质编码基
剩余内容已隐藏,支付完成后下载完整资料
英语原文共 22 页,剩余内容已隐藏,支付完成后下载完整资料
资料编号:[275355],资料为PDF文档或Word文档,PDF文档可免费转换为Word