基于matlab特定人语音识别算法研究毕业论文
2021-05-15 23:21:44
摘 要
语音识别技术在智能设备发展迅猛的今天得到广泛的应用。包括智能移动设备,如手机,平板电脑等、汽车电子、智能家居等都随处可见到语音识别技术。广泛的应用,对语音识别技术有了细分的要求。特定人语音识别技术主要应用在语音密码锁,汽车控制、智能家居的控制等。
由于特定人语音识别技术实际应用中多是用孤立词,所以本次设计采用基于动态时间规整的算法(DTW),DTW算法相对于HMM,拥有简单、有效的优点。HMM算法在训练阶段需要提供大量的语音数据,而DTW算法则不需要额外的计算。所以DTW算法在特定人语音识别中得到广泛应用。
本次设计是利用了MATLAB平台进行特定人的语音识别系统的设计研究,并且使用MATLAB用户图形界面设计了一个可实时录音并保存和读取文件的简易GUI界面,对语音文件进行预处理及端点检测,再依次进行特征提取、模式匹配。最后通过MATLAB平台将结果输出。
关键词:特定人、语音识别、DTW算法、MATLAB
Abstract
Nowadays, with the rapid development of smart devices Speech Recognition technology has been widely used.voice recognition technology is widely applying in automotive electronics and intelligent household, smart mobile devices, such as mobile phones, tablet computers, etc. The wide application of the speech recognition technology require a detailed classification of the speech recognition technology.
Speaker-dependent speech recognition technology is mainly used in speech combination lock, auto control, intelligent household, etc.
In most cases,Speaker-dependent speech recognition is a isolated word in the practical application , and in this study we use DTW algorithm that based on Dynamic Time Warping, DTW algorithm is more simple and more effective than HMM.. HMM algorithm needs to provide a large number of voice data in the training phase. The DTW algorithm does not require additional computation.So the DTW algorithm is widely used in the speech recognition of the specific person.
This design uses the MATLAB platform to carry on the specific person's speech recognition system design research, And the use of MATLAB graphical user interface design of a real-time recording and storage and reading files of a simple GUI interface. In order to deal with the voice files and endpoint detection, feature extraction, pattern matching. Finally, the results are output by MATLAB platform..
key word:Speaker-dependent、speech recognition、DTW algorithm、MATLAB
目录
第1章 绪论 1
1.1语音识别技术历史背景 1
1.1.1国外研究历史及现状 1
1.1.2国内研究历史及现状 2
1.2语音识别技术的分类及应用 2
第2章 语音识别系统的构成 5
2.1语音信号预处理 5
2.2端点检测 6
2.3特征参数提取 9
第3章 DTW算法 13
3.1 DTW原理 13
3.2DTW算法流程 16
3.3结果分析 16
第4章 GUI设置 19
第5章 总结 21
5.1后续工作及展望 21
参考文献 22
致谢 23
第1章 绪论
随着通信技术和只能一起设备的发展,语音识别技术识别技术在过去十年已成为一项热门研究。人们希望机器听懂人的声音,解放双手,提高工作效率。语音识别功能的普及是大势所趋。人们希望拥有愈加发达的人机交互技术。迫切希望语音信号处理能够再次取得突破,语音识别技术更加成熟。
MATLAB是美国MathWorks公司出品的商业数学软件,用于算法开发、数据可视化、数据分析以及数值计算的高级技术计算语言和交互式环境。在语音信号处理中MATLAB软件使用非常广泛,本次设计也是基于MATLAB的特定人语音识别算法的研究,对语音信号进行预处理,端点检测,提取特征参数,然后用DTW算法进行匹配,输出结果。
1.1语音识别技术历史背景
语音识别技术正式开始于1952年,其标志是美国的贝尔研究所成员设计实现的语音识别系统,它是世界上第一个能够识别是个英文数字发音的语音识别系统。到了1960年,更为先进计算机语音识别系统成功实现。60年代,计算机技术开始得到普及。这极大的推动了语音识别的发展。在这一时期,最大的突破就是线性预测编码计算(LPC)以及动态时间规整算法(DTW)。这是语音信号处理一个巨大的里程碑。到了70年代,语音识别中另外两个关键的算法矢量量化(VQ)和隐马尔可夫(HMM)取得了很大的进展。八十年代,语音识别技术再一次取得影响深远的成就,基于统计模型的隐马尔可夫(HMM)得到得到应用,大词汇量、非特定人语音识别技术有了重大进展。人工神经网络研究又再一次兴起,隐马尔可夫模型技术的欠缺得到改善日渐成熟,在商业上的用途更加的广泛。到了九十年代,新兴的多多媒体技术起让语音识别技术的运用领域范围愈加普遍。越来越多的产品出现在世人的眼中。
1.1.1国外研究历史及现状