基于MATLAB的语音识别系统设计毕业论文
2021-03-13 23:45:20
摘 要
语音识别作为人工智能的核心项目,经过长时间的发展,已经在各个领域取得了重大成果。语音识别最终目的就是让机器理解人说的话,并做出反应。目前语音识别已经成为人工智能领域的一大研究热点。
本文以MATLAB为开发平台,主要是对DTW算法进行了学习,DTW算法主要是运用在孤立词以及特定人的语音识别上面,本文运用该算法实现了对阿拉伯数字的识别,该算法是通过计算累计距离,然后找到最短的距离来实现识别的,是较为简单的一种算法。本文中,在特征参数提取主要运用了Mel频率到谱系数,端点检测是运用二级判决的方法来实现的。在语音识别的算法上,选着了DTW算法来进行识别,最后通过GUI搭建了识别界面,实现了识别和显示的功能。
本文对DTW算法进行了研究学习,并运用该算法进行了实验设计,实现了在MATLAB平台上的语音识别,并构建了图形用户界面,完成了对阿拉伯数字的识别。
关键词:语音识别;DTW算法;MATLAB;图形用户界面
Abstract
Speech recognition as a core project of artificial intelligence, after a long period of development, has made significant achievements in various fields. The ultimate goal of speech recognition is to let the machine understand what we say and react. At present, speech recognition has become a hot topic in the field of artificial intelligence.
This paper uses MATLAB as the development platform, mainly on the DTW algorithm for learning, DTW algorithm is mainly used in isolated words and specific human speech recognition above, this paper uses the algorithm to achieve the identification of Arabic numerals, the algorithm is calculated by accumulating Distance, and then find the shortest distance to achieve recognition, is a relatively simple algorithm. In this paper, the feature frequency extraction is mainly used Mel frequency to spectral coefficient, endpoint detection is the use of two decisions to achieve the method. In the speech recognition algorithm, select the DTW algorithm to identify, and finally through the GUI to build a recognition interface, to achieve the identification and display functions.
In this paper, the DTW algorithm is studied and studied, and the algorithm is used to design the experiment. The speech recognition on the MATLAB platform is realized, and the graphical user interface is constructed, and the recognition of the Arabic numerals is completed.
Keywords:speech recognition, DTW algorithm, MATLAB, graphical user interface
目 录
第1章 绪论 1
1.1 研究目的 1
1.2 研究意义 1
1.3 语音识别发展历史 2
1.4 国内外发展现状 3
1.5 MATLAB开发平台 4
1.6 论文主要内容和章节安排 4
第2章 语音信号分析及仿真 5
2.1 语音信号分析及处理过程 5
2.2 语音信号预处理 5
2.2.1 语音信号采样与量化 5
2.2.2 预加重 6
2.2.3 语音信号的加窗分帧 6
2.3 语音信号的短时时域处理 7
2.3.1 短时能量 7
2.3.2 短时平均过零率 8
2.3.3短时自相关函数 8
2.4 端点检测 8
2.5 语音信号的频域处理 10
2.5.1 短时傅里叶变换 10
2.5.2 语谱图 10
2.5.3 Mel频率到谱系数 11
2.5.4 MFCC特征参数提取过程 11
2.6 本章小结 12
第3章 基于DTW算法的实验结果及分析 13
3.1 动态时间弯折算法原理 13
3.1.1 识别过程 13
3.1.2 动态规划过程 14
3.2 实验结果及分析 14
3.2.1 语音实验数据及预处理 14
3.2.2 距离测量 15
3.2.3 识别实现 16
3.2.4 识别结果分析 17
3.3 本章小结 18
第4章 语音识别实验系统界面的实现 19
4.1 MATLAB的图形用户界面 19
4.1.1图形用户界面组成 19
4.1.2 对控件属性设置 19
4.2 界面实现 20
4.2.1 控件的构建及属性设计 20
4.2.2 GUI编程 21
4.2.3 系统实现 24
4.3 本章小结 25
第5章 总结与展望 26
5.1 总结 26
5.2 展望 26
参考文献 28
致 谢 29
第1章 绪论
1.1 研究目的
在信息化发展迅速的今天,越来越多的智能化设备出现在人们的视野中,而语音作为人机交互的一种重要方式也随之发展起来了。与机器对话,让它知道你说了什么,并把你说的话转化为指令,并让机器运行是语音识别的一种简单的实现[1]。通过语音来控制机器的运行,解放了人们的双手,对提高人们生活质量有着重大的意义。
语言是人类特有的功能,是人类最基本的交流方式,如果机器可以听懂人们的话,那么键盘就不会存在,同时人们的生活效率也会提高。语音识别作为智能领域一大核心项目,其涉及到多门学科,出现在多个行业中。语音识别过程流程图如图1.1所示。