基于matlab孤立词语音识别算法研究毕业论文
2021-05-15 23:17:47
摘 要
语言作为人与人交流沟通最为普遍的方式,在人们日常的生活中有着不可或缺的地位。随着科学技术的发展,人与计算机交互的方式也不再局限在键盘上。就是在这样的背景下,语音识别技术被提了出来,让计算机也能“听懂”人类的语言。经过数十年的发展,语音识别技术已日趋成熟,并广泛地应用于人们生活的方方面面,为人们的生活带来了许多便捷。
本论文首先对课题背景和意义以及国内外的研究现状进行了介绍,然后重点描述了语音识别的处理流程和基本原理。对语音信号的预处理、特征提取、识别方法做了较为详细的分析。其中预处理包括:预加重、分帧加窗、端点检测。
特征提取方法使用的是MFCC特征参数提取法。语音识别方法中,对DTW算法和HMM算法原理的进行了说明和比较。然后在MATLAB的环境下,完成了基于HMM的对非特定人孤立词语音识别系统的设计和程序的实现,该系统包括语音的录取、模板库的训练建立、语音识别。
关键词:非特定人;孤立词;语音识别;预处理;特征提取;HMM
Abstract
Language, as one of the most common ways of communication, has an indispensable role in people's daily life. With the development of science and technology, the way of interaction between human and computer is no longer limited to the keyboard. It is in this context, speech recognition technology is proposed, so that the computer can "understand" the human language. After decades of development, speech recognition technology has become more mature, and widely used in all aspects of people's lives, to bring a lot of convenience for people's lives.
Firstly, this paper introduces the background and significance of the subject and the current research situation both at home and abroad, and then describes the process flow and the basic principle of speech recognition. The speech signal preprocessing, feature extraction and recognition methods are analyzed in detail. Pretreatment including: pre emphasis, framing and window, endpoint detection.
Feature extraction method using MFCC feature parameter extraction method. In speech recognition method, the applicability of DTW algorithm and HMM algorithm principle is explained. Then, in the MATLAB environment, the design of isolated word speech recognition system and the implementation of the program are completed. The system includes the speech recognition, the loading of the template library, the result of speech recognition. Finally, the recognition rate of the system is tested.
Keywords: non-specific person; isolated words; speech recognition; preprocessing; feature extraction; HMM
目 录
第1章 绪论 1
1.1 研究背景及意义 1
1.2 国内外研究历史与现状 2
1.3 本文的研究内容 3
第2章 系统设计相关原理 4
2.1 语音信号的预处理 4
2.1.1 预加重 4
2.1.2 分帧加窗 4
2.1.3 端点检测 5
2.2 语音信号的特征提取 6
2.2.1 LPCC系数 6
2.2.2 MFCC系数 6
2.3 模板匹配技术 7
2.3.1 相似性度量 8
2.3.2 动态时间规整 8
第3章 基于HMM的语音识别技术 11
3.1 HMM在语音识别中的三个问题 11
3.2 HMM语音识别的基本原理 11
3.3 Baum-Welch算法 12
3.4 Viterbi算法 12
3.5 分段K值法 13
第4章 基于HMM孤立词语音识别系统设计及仿真 14
4.1 系统结构 14
4.2 系统的模块设计 15
4.2.1 语音输入模块 15
4.2.2 预处理模块 16
4.2.3 特征提取模块 17
4.2.3 训练模块 18
4.2.4语音识别模块 19
4.3 HMM算法在语音识别中的优缺点 20
4.4 本章小结 20
第5章 总结与展望 21
5.1 全文工作总结 21
5.2 后续工作展望 21
参考文献 22
致 谢 23
第1章 绪论
1.1 研究背景及意义
语言是人类所独有的能力,是人与人之间日常交流、传递信息最为自然和有效的方式,同时也是人类从外界获取信息、增长见闻的重要途径之一。语音中既包含了声音又包含了意义,是语言的声学体现。[1]语音中除包含实际发音内容的语言信息,还包括发音者是谁以及所要传递的各种信息。现在人们除了相互之间要进行交流外,还会大量地接触各种机器设备,如何使计算机听懂人类的语言是一项很有意义的课题。
现代信息科学技术经过几十年的快速发展使人类踏入了信息化时代,通过对语音处理技术的研究可以使人们进行信息交流的方式更加方便、高效,这对于人们生活的智能化提高有着十分重要的意义。语音识别是语言信号处理中大的研究方向,可以实现人和计算机通过语音来直接进行交流,形象地说就是赋予了机器以“听觉”功能,让人类能够通过说话的方式对机器发放指令,然后机器识别人所要传达的信息做出相应的操作来为人类服务,从而使人类的工作和生活更加便利化。
语音识别技术是一门包含计算机科学、数字信息处理、语言学、生理学、概率与数理统计、人工智能等诸多学科的综合学科,涉及的学科内容很广。[2]对语音识别技术的研究可以完成人和计算机之间的“语言交流”,对于实现人工智能有极大的意义和帮助。