Smith-Waterman算法的FPGA实现文献综述
2020-04-18 19:59:41
文 献 综 述 1.引言 21世纪以来,计算机科学推动传统学科向前发展并不断形成新的学科,其中生物信息学就是一典型的学科,它对生物信息进行收集、处理、分析和解释,随着生命科学和信息技术的迅猛发展,尤其是信息技术中半导体技术的飞速发展,大大提高了传统生物学对生物数据的收集、分析、处理速度。
分析序列的相似性是生物信息学当中最基本的问题,而分析序列相似性的最基本的方法是序列比对,序列比对是为确定两个或多个序列之间的相似性乃至于同源性,而将它们按照一定的算法排列得到结果的一个过程。
比如有双序列比对、多序列比对,上述两种比对内部又分为全局比对和局部比对,涉及的处理算法有针对全局比对的Needleman-Wunsch算法和针对局部比对的Smith-Waterman算法、BLAST算法等,而涉及的工具软件主要有BWA,Bowtie,SOAP等。
因为新一代测序技术的长足进步,大大降低了这十几年以来人类全基因组的测序成本,较低的测序成本导致测序数据的大量快速积累,而现有的计算资源以及计算速度已经跟不上测序数据的积累速度,因此数据生成与数据处理发生了矛盾,两者产生了速度失配的问题。
使用传统的软件方法进行序列比对已不能满足需要。
近年来,国内外学者在基于FPGA平台的Smith-Waterman算法加速器方面做了大量研究工作,硬件加速算法已成为一种解决速度失配问题的研究方向。
2.研究基础 #8226; Smith-Waterman算法是一种进行局部序列比对(相对于全局比对)的算法,用于找出两个核苷酸序列或蛋白质序列之间的相似区域。
该算法的目的不是进行全序列的比对,而是找出两个序列中具有高相似度的片段。
该算法主要分两步,计算得分矩阵和寻找最优比对序列。
可以简单描述为: a) 确定置换矩阵及空位罚分方法。