基于QT的语音命令识别系统的设计与实现毕业论文
2021-04-05 00:38:00
摘 要
现如今各类智能设备的使用使得人们越来越迫切地需要具有实用性、高精度的语音识别系统,语音识别系统就是让计算机或者其他嵌入式设备通过检测、识别和理解等主要步骤,把人们发出的自然语音信号或指令转换为相应的文本命令或程序指令。语音识别技术是一项复杂的多任务信号处理技术,包含了前期对语音信号的检测、处理、特征提取,后期对语音信号识别、理解。语音识别技术可广泛应用于智能手机助手、智能玩具、智能语音控制仪器及翻译机等现代化设备中。语音识别技术目前在嵌入式系统中的应用也越来越广泛,越来越成熟,使众多嵌入式系统脱离传统机械操作,主要的应用为语音命令控制,使语音控制代替传统的手工操作。本次设计的识别系统正是为了实现在工程中自动焊机的操作臂脱离手工干预。传统的语音识别技术使用的方法主要有动态时间归正技术(DTW)、矢量量化技术(VQ)、隐马尔可夫模型(HMM)。
关键词:语音识别 嵌入式系统 动态时间规整 矢量量化
ABSTRACT
Speech recognition technology is a technology that allows machines to transform human speech signals into corresponding texts or commands through recognition and understanding processes. It belongs to the category of multi-dimensional pattern recognition and intelligent computer interfaces. Voice command control can be widely used in portable devices such as smart speakers, toys, smart instruments and mobile phones. The current application of speech recognition technology in embedded systems is mainly voice command control, which makes voice control replace manual operation. The speech recognition methods mainly include dynamic time correction technique (DTW), vector quantization technology (VQ), hidden Markov model (HMM), and artificial neural network technology. The speech recognition technology is further matured, and the speech recognition system moves from the laboratory to practical.
Keywords:Speech recognition embedded system dynamic time warping vector quantization
目 录
第1章 绪论 1
1.1 前言 1
1.2 语音识别系统发展历史和现状 2
1.2.1 国外语音识别技术发展历史与现状 2
1.2.2 国内语音识别技术发展历史与现状 3
1.3 Qt应用的介绍 4
第2章 语音识别的技术原理 6
2.1 动态时间规整技术 6
2.2 隐马尔可夫模型 8
2.3 矢量量化 10
2.4 人工神经网络 12
2.5 支持向量机 13
第3章 系统总体设计 14
第4章 系统中语音识别过程 18
4.1 预处理 18
4.2 音量监听 18
4.3 录音过程 19
4.4 录音结束 21
4.5 语音段识别 21
第5章 总结与展望 25
5.1 总结 25
5.2 展望 25
参考文献 26
致谢 27
第1章 绪论
1.1 前言
受现代科技技术发展影响,各类具有众多功能的电子产品蔓延到社会各类人群,现代社会的高速发展已经离不开以信息科技产品和各类针对特定功能的嵌入式产品。目前多数的计算机类电子产品是将字符、图片、语音等媒介作为个体与设备、设备与设备之间进行信息传递,传统的人机交互方式需要使用者通过键盘敲击指令,或用鼠标等其他输入设备将信息或者是命令传输给计算机,计算机通过人们所发出的指令进行信息处理、计算,最后进行输出,以字符或图片的形式将需要的信息传递给个人用户。受信息技术高速发展的影响,智能语音识别技术开始发展,并在各个领域发挥巨大的作用,在很大程度上改变了传统信息传递方式,用自然的语音指令代替了传统的手工输入,从而大大提高了信息传播的便利性与高效性。
语音识别技术的具体内容是将人们说话的内容通过计算机的麦克风收集到,然后经过内部的信号处理系统和识别系统转换成相应的文字文本或特定的计算机内部指令,从而指导计算机完成一系列的操作,比如识别语音发出的“关闭计算机”,计算机通过麦克风输入该段语音,通过内部语音识别系统中包含的算法,从而识别该段语音的语义,从而发出相应的指令,即关闭计算机的指令,这整个过程即语音识别。语音识别的另一个分支是对说话人身份的识别,与识别语音的语义不同,说话人识别是计算机通过麦克风收集到这段语音,通过提取该段语音的特征参数,如共振峰频率、音色、发音特征、音调频谱范围等参数,与计算机内部数据库中事先存储的说话人参数特点相比对,从而识别出说话人的身份。语音识别的目的就是让计算机听懂并理解人类口述的语言,这其中包括了两个方面的含义:一是逐字逐句听懂并将语音转换为相应的文本文字,不需要对该段语音做出相应的指令;二是对口述语音中所包含的指令或请求加以识别和理解,并转换成计算机内部的指令,从而做出正确回应,这不仅仅只是拘泥于相关词汇的正确转换,还要理解语音中包含的语义。语音识别技术作为现代智能识别技术的一大分支,与信息技术、信号处理技术、语言学、语音学、生物学及深度神经网络学等领域有密切关联。21世纪语音识别技术向着两个方向继续发展。一是应用到计算机的听写系统和通信与物联网产业结合的连续语音识别系统中,这些系统的特点是词汇量大、语义复杂、识别难度更大,需要与相应的操作系统结合使用。另一方面是应用在小型嵌入式便携式产品中,如移动通信系统中的语音自动拨号、汽车设备上的语音控制及智能音箱等。以汽车语音控制为例,由于车辆在行驶中,驾驶人必须将精力高度集中在驾驶行为上,如果在开车时接电话或发短信,稍有不慎必然会造成严重交通安全事故,因此,为将安全性和便利性相结合,在汽车上拨打电话或发送短信可以使用具有语音拨号和语音编辑功能的免提电话。本次设计的语音识别系统用于自动焊机的操作臂上,正是要解决在工业工程中冗余的人员配置,用语音控制焊机操作臂从而大大降低人工操作量,更能降低成本和提高生产力。将语音识别技术合理应用在各个领域,既要充分发挥语音识别技术优势,也要不懈的促进语音识别技术的进一步发展,从而促进技术水平和应用水平整体进步与发展。
1.2 语音识别系统发展历史和现状