语音共振峰估计算法研究与实现毕业论文
2021-05-06 12:22:49
摘 要
语音信号处理技术是计算机智能接口与人机交互的重要手段之一。而语音信号特征参数的精确提取是语音信号处理技术的关键所在。 语音信号是一个复杂的非线性、非平稳随机过程,这使得基于线性和平稳性系统理论发展起来的传统语音信号处理技术性能难以进一步提高。目前的提取语音共振峰的方法比较多,常用的方法如倒谱法、线性预测法等等,但每一种提取方法都有其优缺点。本文的主要内容如下:
(1)讨论共振峰频率提取的目的及意义,并分析其发展以及国内外研究现状。
(2)分析提取共振峰频率时主要用到的语音信号处理的基本方法,主要包括同态处理、倒谱以及线性预测分析的基本原理。
(3)分别采用倒谱法、线性预测内插法、线性预测求根法对汉语单个元音进行共振峰频率的提取,并用MATLAB仿真实现。
(4)用一般的线性预测分析方法、改进的线性预测分析方法以及基于Hilbert-Huang变换法实现对连续语音的共振峰轨迹的检测。
(5)对本文的研究内容作总结,讨论存在的不足和需要改进的地方,并对以后的改进方向进行预测。
关键词:语音信号处理;共振峰;倒谱法;线性预测;希尔伯特变换
Abstract
Speech signal processing technology is one of the important means of computer interface and human-computer interaction. The voice signal accurate extraction of characteristic parameters is the key of the speech signal processing technology. Speech signal is a complex nonlinear and non-stationary random process. It makes the traditional voice signal processing technology which based on the theory of linear and stability system is difficult to improve. So far there are many methods of extracting formant, but each method has its advantages and disadvantages. In this paper,the research content is as follows:
(1)Discuss the purpose and meaning of the formant extraction, and analyzes the research status at home and abroad.
(2)Analyzes the basic formant extraction ways of speech signal processing, mainly including homomorphic processing, cepstrum and linear prediction analysis.
(3)Extracting the Chinese single vowel formant frequency with the method of cepstrum, linear interpolation and linear prediction for root,and use the MATLAB simulation to implemented.
(4)Detected the continuous speech formant trajectories with the ways of general linear prediction,improved linear prediction and based on the Hilbert-Huang transform.
(5)Summary the research content of this paper, discussed the deficiencies and the improvement,and predicted the improvement of later.
Key words: speech signal processing; formant; cepstrum; Linear Prediction; Hilbert Transform;
目 录
第1章 绪 论 1
1.1课题研究的目的及意义 1
1.2语音共振峰提取的发展与研究现状 1
1.3本文研究的主要内容和章节安排 3
第2章 其它变换域的语音分析 4
2.1语音信号的同态处理原理及倒谱原理 4
2.1.1同态处理的基本原理 4
2.1.2复倒谱和倒谱原理 5
2.2语音信号的线性预测分析 7
2.2.1线性预测分析的原理 7
2.2.2线性预测方程组的求解 9
第3章 汉语语音单个元音共振峰的提取实现 12
3.1预加重和端点检测 12
3.2倒谱法对共振峰估算 12
3.3 共振峰的LPC估算 15
3.3.1 LPC内插法估算共振峰 15
3.3.2 LPC求根法估算共振峰 18
第4章 连续语音的共振峰检测 20
4.1 一般的LPC共振峰检测 20
4.2改进的LPC共振峰检测检测 21
4.3基于Hilbert-Huang变换的共振峰检测 22
4.3.1 EMD的基本原理 22
4.3.2 AM-FM模型 24
4.3.3用HHT方法检测共振峰轨迹 25
第5章 总结及展望 28
5.1论文工作总结 28
5.2未来工作展望 29
致 谢 30
参考文献 31
第1章 绪 论
1.1课题研究的目的及意义
将语音信号用数字信号处理的技术进行处理的过程,即语音信号处理。语音信号处理的目的是为了获得语音信号的特征参数用以研究语音在其他方面的作用;还可与用于语音合成、识别、编码等等。语音信号处理与其他学科和应用有着十分密切的联系,比如语言、心理学、统计学等各个方面。语音编码是将模拟语音信号转化为数字语音信号,这样可以使语音信号能够更好地传输和存储;语音合成的目的是使人类的自然语言能够被机器人生成;语音识别是通过机器识别人类的语言,使机器人完成相应的任务和服务。
当今世界正处于信息时代,计算机技术、通信技术和电子技术的高速发展,推动人类社会进入了信息社会。因特网和移动通信的普及、电子购物的兴起、多媒体通信及其应用的蓬勃发展,改变了人类生活、工作、娱乐的方式。这对语音信号数字处理的要求愈来愈高愈来愈迫切,比如将传统的键盘书入改为说话人输入,实现人工智能和交互,高效软硬件在语音信号处理方面实现也存在可能。
1.2语音共振峰提取的发展与研究现状