面向语音识别的听觉单元设计毕业论文
2021-11-05 19:24:45
摘 要
基于对特定语音识别的目的,开发了面向语音识别的听觉单元设计。设计使用电容式麦克风对语音信号输入采集,然后信号经过LM358模块进行音频信号放大,输出的ADC信号由STM32ZET6单片机ADC采集模块接收进一步处理;同时设计识别操作,进行语音信号特征提取;通过对每个语音指令采集多个语音样本并获取其特征的方法,结合动态时间规整(DTW)算法进行语音识别匹配实验,得出该系统能初步满足面向语音识别的听觉单元设计要求。
关键词:语音识别;单片机;DTW算法
ABSTRACT
Based on the purpose of specific speech recognition, the design of auditory unit for speech recognition is developed. The design uses the condenser microphone to collect the speech signal input, and then the signal is amplified by the lm358 module. The output ADC signal is further processed by the stm32zet6 single-chip ADC acquisition module. At the same time, the recognition operation is designed to extract the speech signal characteristics. The method of collecting multiple speech samples and obtaining their characteristics for each speech instruction is combined with the dynamic state Time warping (DTW) algorithm is used in speech recognition matching experiment, and the result shows that the system can meet the requirements of speech recognition oriented hearing unit design.
Keywords: Speech recognition; Single chip microcomputer; Dynamic time bending (DTW) algorithm
目 录
摘 要 I
ABSTRACT II
目 录 1
第1章 绪论 3
1.1 国外研究发展状况 3
1.2 国内研究发展状况 5
1.3 研究的意义及面对的问题 6
1.4 语音识别的算法和应用 6
1.5 本文的结构 7
第2章 语音识别的硬件单元设计 8
2.1 系统总体方案设计 8
2.2 单片机的选择 9
2.3 低通滤波模块选择 10
2.4 语音采集模块的选择 11
2.5 滤波器 11
2.6 语音采集与信号放大模块设计 12
2.7 单片机最小系统设计 13
2.8通信接口设计 14
第3章 语音识别算法及其实现流程 16
3.1 语音识别算法 16
3.1.1 语音识别预处理 16
3.1.2 语音信号端点检测 18
3.1.3 语音信号特征提取 18
3.1.4 DTW 19
第4章 样机开发与系统测试 21
4.1样机开发 21
4.1.1 样机开发硬件设计 21
4.1.2 样机开发软件流程 24
4.1.3 语音信号采集工作流程 25
4.1.4 语音训练工作流程 25
4.2样机测试 27
4.2.1算法范例 27
4.2.2样机试验 29
第5章 总结与展望 33
参考文献 34
致 谢 35
附 录 36
第1章 绪论
当今,电子化的很多的技术不断的进步,单片机的控制技术的不断更新迭代,面向语音识别的听觉单元设计也得到了很广泛的发展。
从技术上讲,语音识别属于多维模式识别和智能接口的范畴。它是一项集声学、语音学、计算机、信息处理、人工智能等于一身的综合技术,可广泛应用在信息处理、通信和电子系统、自动控制等领域[1]。
时间的车轮在技术开发上是不会停止的,电子科技、计算机硬件研发、电子方面的自动化,还有普遍使用的通信技术等非常多的技术,已经改变了人们的生活,为了人类更好的生活而服务,于是硬件各个方面对面向语音识别的听觉单元设计需求明确性还有环保好用等诸多方面的需求都进一步的严格。同时由于在这些技术的投入比较大,技术得到迅速提升,让面向语音识别的听觉单元设计相关的一些技术也得以站在巨人的肩膀,技术得到更好升华[2]。而另一方面,这也进一步扩大了单片机等市面上普遍使用的电子仪器、传感器的市场买卖交易量。单片机在电子产品设计中的应用正好发挥了两者的技术优势,提升语音识别准确性、稳定性的同时也为单片机应用发展提供了更多可能。未来单片机这种集成化的硬件技术已经成为信息化时代下的发展趋势,单片机在语音识别设计中的应用正好发挥了两者的技术优势,提升传感器准确性、稳定性的同时也为单片机应用发展提供了更多可能[3]。目前51系列单片机实验箱众多,但其部分I/O口无输出能力、AD需要靠扩展、运行速度较慢[4],而STM32F103具有Cortex-M内核,输出脚驱动能力强,更耐用[5]。
本课题基于STM32单片机技术,在分析了特定语音识别开发使用的智能需求的基础上,开发了面向语音识别的听觉单元设计。同时加入了多种电子技术辅助开发,利用比较低成本的单片机及其他硬件实现设计要求,采用AMS1117-3.3稳压模块,把5V电压信号经过LM1117降压模块以及二阶低通滤波器后输出3.3V电压供单片机使用,语音信号输入使用电容式麦克风采集,然后信号经过LM358模块进行音频信号放大,输出的ADC1信号由STM32ZET6单片机ADC采集模块接收进一步处理,同时设计训练与识别操作,进行语音信号特征提取,通过对每个语音指令采集多个语音样本并获取其特征的方法,结合了CNN神经网络识别语音算法进行语音朗读识别的样机实验,得出该系统能够很好的满足面向语音识别的听觉单元设计的设计要求,为以后开发特定语音识别有着重大意义。
1.1 国外研究发展状况
由于语音识别本身所固有的难度,人们提出了各种条件下的研究任务,并有此产生了不同的研究领域。这些领域包括:针对说话人,可分为特定说话人语音识别和非特定说话人语音识别;针对词汇量,可划分为小词汇量、中词汇量和大词汇量的识别,按说话方式,可分为孤立词识别和连续语音等。最简单的研究领域是特定说话人、小词汇量、孤立词的识别,而最难的研究领域是非特定人、大词汇量、连续语音识别[6]。
长时间的发展,国外的面向语音识别的听觉单元设计行业已经比较的成熟,特别进入了21 世纪,行业有了很多的必然良好发展: