倒普分析在语音识别的应用研究文献综述
2020-04-14 16:18:47
1.1目的及意义
声音(sound)是物体在振动时产生并通过介质(空气或固体、液体)传播后被人耳感知到的一种现象。而由人的发音器官发出的具有一定社会意义的声音又称作为语音。我们知道,语言人类最重要的交际工具,也是人们保存和传递人类文明的成果的重要方式。而语音则是语言的一种重要形式,是最直接地记录人的思维活动的众多方式中的一种。
通过语音传递信息是人类最重要、最有效、最常用和最方便的交换信息方式。同时,语音也是人与机器之间进行通信的主要工具,它是一种理想的人机通信方式。近年来人们致力于使机器能够听懂人类的话语,从而通过语音实现对机器的控制。机器是通过对语音的某些特征的感知来理解其中的含义的,所以找到语音中具有更高性能的特征参数是提高系统语音识别性能的基础。利用算法对语音信号进行处理后可以方便人们提取到这种具有更高性能的语音参数特征。于是,各种科学的算法应运而生,倒谱法作为信号处理的重要的方法之一,能够得到比较好的识别性能。
1.2研究现状分析
语音信号处理是一门新兴的、综合性的、多学科领域的交叉学科。虽然从事这一领域研究的人员主要来自信号与信息处理及计算机应用等学科,但是它与语音学、语言学、声学、认知科学、生理学、心理学等许多学科也有非常密切的联系。20世纪60年代中期形成的一系列数字信号处理的理论和算法,如数字滤波器、快速傅立叶变换(FFT)等是语音信号数字处理的理论和技术基础。随着信息科学技术的飞速发展,语音信号处理取得了重大的进展:进入70年代之后,提出了用于语音信号的信息压缩和特征提取的线性预测技术(LPC),并已成为语音信号处理最强有力的工具,广泛应用于语音信号的分析、合成及各个应用领域,以及用于输入语音与参考样本之间时间匹配的动态规划方法;80年代初一种新的基于聚类分析的高效数据压缩技术—矢量量化(VQ)应用于语音信号处理中;而用隐马尔可夫模型(HMM)描述语音信号过程的产生是80年代语音信号处理技术的重大发展,目前HMM已构成了现代语音识别研究的重要基石。近年来人工神经网络(ANN)的研究取得了迅速发展。{title}2. 研究的基本内容与方案
{title}
2.1研究(设计)的目标
(1)学会MATLAB的使用,掌握MATLAB的程序设计方法;
(2)掌握在Windows环境下语音信号采集的方法;
(3)掌握数字语音信号处理的基本概念、基本理论和基本方法;
(4)了解倒谱分析算法在数字语音处理中的使用方法;