频率域中生物进化树的构建及其应用文献综述
2020-06-29 20:40:12
文 献 综 述
1、 选题目的和意义:随着各种基因组计划的持续开展和模式生物基因组计划的蓬勃发展,生物数据呈指数级增长,对这些生物数据进行科学的分析和研究不仅在人类疾病及重大疫情的预防、诊断、治疗、新药开发等领域有着广阔的应用背景,而且促进了生物信息学这一交叉性学科的兴起和发展。因此如何结合现代计算机技术挖掘大量而有用的生物数据信息,并对其进行严谨有力的分析是当前的研究热点,其中包括生物数据挖掘体系架构的设计、各种分析算法的研究以及针对生物数据挖掘分析的功能研究等。
构建生物进化树是生物信息学研究的热点问题之一,也是现代分子进化研究的重要问题。生物学家和进化论者根据各类生物间的亲缘关系的远近,把各类生物安置在有分支的树状的图表上,有助于通过分析构建系统发育树的过程揭示出有关生物进化的顺序、有助于通过物种间隐含的种系关系揭示进化动力的实质、有助于我们了解生物进化的历史和进化机制。同时研究生物进化树对解决现代分子生物学中的许多问题也是非常关键的,如多序列比对、蛋白质结构和功能预测以及药物设计等。
目前,生物进化树的研究成果已广泛应用于人类科学的各个领域,如推测病毒的进化模型,辅助药靶设计和疫苗开发,分析生物多样性热点,指导生态保护区选址等等。
2.文献综述
对于如何构建生物进化树,构建进化树的实质是蛋白质序列分析,构建方法主要有三种:距离法,最大节约法和最大似然法考察数据组中序列的多重比对结果,优化出拥有一定拓扑结构和树枝长度的进化树,这个进化树能够以最大的概率导致考察的多重比对结果。国内外不少科学家为构建更加完美的进化树做出了不可斗量的贡献。
Gerardo、Israel等人使用信号处理手段来分析基因组数据,该方法是将基因组数据转换或映射到数字表示。他们列出了九个最常用的DNA数字表示法(DNR)的特点的实验研究,当测量给定的一对DNA序列的相似性时,评估每个表示的行为,使用快速傅立叶变换(FFT)获得频率功率谱。他们开展的对现有DNR特征的探索,有助于深入了解提出新的DNR和GSP方法可能需要的特征。他们的研究结果表明,像Voss和四面体这样的多维DNRs比其他DNRs更适合计算DNA序列之间的相似性。