针对非特定人声的语音识别系统设计毕业论文
2021-10-27 22:22:12
摘 要
伴随着人工智能的到来,语音识别技术成为了新的人机交互方式,非特定人声语音识别(SI-ASR:Speaker-Independent Automatic Speech Recognition)已被广泛应用。为了验证语音识别的实用性,本文通过学习语音识别原理并设计非特定人声语音识别系统来进行相关研究。
在理论方面,本文分析了语音识别技术流程,介绍了语音识别系统的分类、声学特征、语言模型,研究了梅尔倒谱频率系数提取的过程和隐马尔可夫模型的建模。在应用方面,结合市面的语音识别芯片,提出了搭建嵌入式智能声控风扇的方案并加以实施。通过使用51单片机和ICRoute公司设计的LD3320语音识别芯片完成语音识别功能,加以继电器、电机和舵机从而完成了模拟声控风扇的设计。
研究结果表明该非特定人声语音识别系统关键词语音识别准确率高,I/O扩展能力强,控制结构简单,并且该系统可识别的关键词多达50条,适用于控制多个电器,所以非常适合作为家居系统的识别控制中心。本文结合实际,从理论方法进行分析,再从实际应用进行设计应用,对语音技术的原理和应用有了深刻的认识,为学习语音识别提供了方法,也为设计智能家居系统提出了可行的方案。
关键词:语音识别,声控风扇,梅尔倒谱频率系数,隐马尔可夫模型,LD3320
Abstract
With the advent of artificial intelligence, automatic speech recognition (SI-ASR) technology has become a new way of human-computer interaction. In order to verify the practicability of speech recognition, this paper studies the principle of speech recognition and designs a speaker independent speech recognition system.
In theory, this thesis explores the process of ASR , introduces the classification, acoustic characteristics and language model of speech recognition system, studies the extraction process of MFCC and the HMM. In application, combined with the speech recognition chip on the market, the scheme of building embedded intelligent voice control fan is proposed and implemented. Through STC11L08XE and LD3320 to complete speech recognition function, motor and steering engine are used to complete the design of analog voice control fan.
The research results show that the SI-ASR system has high recognition accuracy , strong expansion ability and simple control structure, and the system can recognize as many as 50 key words list, which is suitable for controlling multiple electrical appliances, so it is very suitable for the control center of the intelligent home system. Based on the practice, this paper analyzes the theory and method, and then designs the application from the practical application. It has a deep understanding of the theory and use of ASR, provides a method for learning ASR, and also provides a feasible plan for the design of intelligent home system.
Key Words:automatic speech recognition, voice control fan, MFCC, HMM, LD3320
目录
摘 要 I
Abstract II
第1章 绪论 1
1.1 研究背景及意义 1
1.2 国内外语音识别技术发展现状 2
1.2.1 国外语音技术发展 2
1.2.2 国内语音技术发展 3
1.3 语音识别发展趋势 4
1.4 论文结构安排 5
第2章 系统总体方案设计 6
2.1 设计目标 6
2.2 方案设计分析 6
2.3 本章小结 8
第3章 语音识别技术 9
3.1 语音识别技术介绍 9
3.1.1 语音识别系统分类 9
3.1.2 音频的声学特征 10
3.1.3 语音识别声学模型和语言模型 10
3.1.4 语音识别技术应用 11
3.2 梅尔倒谱频率系数(MFCC) 12
3.3 隐马尔可夫模型(HMM) 17
3.4 本章小结 20
第4章 硬件系统设计 21
4.1 语音识别系统 21
4.1.1 LD3320语音识别芯片 21
4.1.2 STC11L08XE单片机 25
4.1.3 咪头转换电路 26
4.1.4 电源电路 26
4.1.5 USB下载电路 27
4.2 语音控制系统 28
4.2.1 继电器控制模块 28
4.2.2 舵机PWM控制模块 29
4.3 本章小结 30
第5章 软件系统设计 31
5.1 主程序 31
5.2 语音识别程序 35
5.3 PWM调速程序 37
5.4 本章小结 38
第6章 实验结果分析 39
6.1 平台搭建及识别率 39
6.2 本章小结 40
第7章 总结与展望 41
7.1 本文总结 41
7.2 设计展望 41
参考文献 42
致谢 44
第1章 绪论
1.1 研究背景及意义
随着移动智能平台的快速发展,各种识别手段层出不穷,指纹、人脸、语音、虹膜等等识别方法都在相关领域展现出便捷、快速的特点,密码锁、开关锁在越来越多的平台被取代。随着人们生活水平的上升,各种科技性的嵌入式应用进入人们的生活,人们对家居生活有了更高的要求,智能家居系统得以快速发展。
在体验到电脑和手机带给人们生活巨大的便捷之后,人们逐渐感觉墙上的开关不够近、电视的遥控距离不够远、电风扇空调不够智能,“随叫随到”的家居生活理念逐渐流行。伴随着人工智能的出现,人们希望家中能有一个像仆人一样的人工智能来为其服务,而要做到像仆人一样,那么首先就是要会沟通交流,至少要能听懂人的语音,然后进行对应的操作,从而表现为不需要聘用保姆但却有无形中的“保姆”来为人们服务。传统家居中,各类电器都是分别独立的单元,控制它们都需要找到对应的开关,不够便捷。而智能家居则可以将各类电器开关汇总,从而只要在一个手机上就可以控制家中任何一个电器,相比传统家居无疑进步很大。而为了满足“随叫随到”的理念,通过语音来控制家中的电器无疑是最人性化的控制方式。语音控制将成为硬件智能化的一个关键交互控制技术。
本毕业设计目的是设计针对非特定人声的语音识别系统,非特定人就是指任何一个人只要说出了设定的识别关键词即可进行识别,无需关注其声音特点,只需关注其说话内容是否为设定的语音识别关键词。所以声色、响度、年龄和性别并不会影响识别结果。现代人民身处在微处理器技术和互联网技术高速发展的时代,人工智能的出现为人们科技发展提供了新的方向。而更接近人的交互手段正是体现人工智能优点的地方,语音识别技术可以帮助人们摆脱键盘、鼠标、触摸屏,完全通过交流来控制机器,使操作更加智能。