基于STM32的智能语音助手毕业论文
2022-02-06 18:36:19
论文总字数:21252字
摘 要
随着人工智能、电子技术、自动化技术的迅速发展,语音识别技术也成为了一个热门的行业,在智能家居、公共医疗服务、工业自动化等领域发挥着重要的作用。本课题基于STM32设计了一款交互式语音助手,该语音助手采用LD3320语音识别模块实现对特定关键词的采集与识别,并将处理后的结果发送给MCU,由MCU对语音识别模块发送过来的信号进行处理,然后根据关键词信息控制BY8001-16P模块播放不同的音乐、调节LED灯的亮度以及控制OLED模块的显示,语音助手还具有自动唤醒功能,当有人从它面前经过时,HC-SR501人体感应模块会给MCU一个触发信号,实现系统的待机自动唤醒,随后即可进行基本的语音交互。本系统经过调试,表现出良好的实际性能,具有识别率高、音质好、功耗低、成本低、操作简单等优点,在智能控制领域具有良好的实用价值和应用前景。
关键词: 语音识别 音乐播放 人体感应
Intelligent voice assistant based on STM32
Abstract
With the rapid development of artificial intelligence, electronic technology and automation technology, voice recognition technology has also become a hot industry and plays an important role in smart furniture, public medical services, and industrial automation. This subject is designed an interactive voice assistant based on STM32. The voice assistant adopts LD3320 speech recognition module to achieve the collection and recognition of specific keywords, and the processed results are sent to the MCU. The signal sent by the speech recognition module is processed by the MCU. According to the keyword information, the MCU controls the BY8001-16P module to play different music, adjusts the brightness of the LED and controls display of the OLED module. The voice assistant also has an automatic wake-up function. When someone passes by it, the HC-SR501 human body induction module will give the MCU a trigger signal to realize the system's standby automatic wake-up and then followed by basic voice interaction. The system has been debugged and shows good practical performance. It has the advantages of high recognition rate, good sound quality, low power consumption, low cost and easy operation. It has good practical value and application prospect in the field of intelligent control.
Keywords: Speech recognition; Play music; Human body induction
目 录
摘 要 I
Abstract II
第一章 绪 论 1
1.1研究背景和意义 1
1.2国内外研究现状 2
1.2.1国外研究现状 2
1.2.2国内研究现状 2
1.3主要研究内容 3
第二章 系统总体设计 4
2.1系统总体功能设计 4
2.2各部分功能介绍 4
2.2.1语音识别功能 4
2.2.2音乐播放功能 5
2.2.3待机唤醒功能 6
2.2.4信息显示功能 6
2.2.5灯光调节功能 6
第三章 系统硬件设计 8
3.1系统总体硬件设计 8
3.2控制单元介绍 8
3.2.1 STM32F103C8T6 9
3.2.2最小系统 11
3.3电源电路设计 12
3.4语音识别模块 13
3.5音乐播放模块 15
3.6人体感应模块 15
3.7显示模块 17
第四章 系统软件设计 19
4.1系统总体程序设计 19
4.2系统各功能程序设计 20
4.2.1语音识别程序 20
4.2.2音乐播放程序 23
4.2.3待机唤醒程序 25
4.2.4信息显示程序 26
4.2.5灯光调节程序 27
第五章 系统调试与分析 29
5.1系统功能调试 29
5.1.1硬件电路调试 29
5.1.2程序功能调试 30
5.2结果分析 33
结语 34
参考文献 35
致谢 37
附录1:系统电路原理图 38
第一章 绪 论
1.1研究背景和意义
随着科技的不断进步,人工智能、物联网、计算机技术、电子技术的日趋成熟[1],各种各样的电子产品已经应用于日常生活中,人们深深感受到科技带来的便捷,真正进入到一个智能时代[2]。以往对于设备的控制方式有按键控制、触摸控制等接触式控制,为了更好地提高人机交互体验,需要深入地改进设备的控制方式。语音控制即通过语音来控制外部设备的各种功能,不需要人与设备的直接接触,因此,它是最理想也是最具有发展潜力的控制方式。
如今,一些现代化科技公司为了提高人们在家庭环境中的生活质量,采用先进的语音识别和机器学习等技术研发出了一套语音智能控制系统[3]。该系统依靠其强大的软件管理方案,在智能照明、智能电器、智能遮阳、节能控制等方面发挥着重要的作用[4]。由于语音识别技术使得机器能够听懂人类的语言,一些知名公司采用语音识别技术、信息检索技术相结合,研发出一种语音信息检索系统,该系统可以通过语音输入直接从数据库中得到搜索结果,这种信息检索方式不仅使用方便而且极大的提高了搜索效率[5]。
在现代化社会,语音识别技术扮演着越来越重要的作用,采用该技术所研发的各种产品,正在逐渐进入人们的日常生活中。在教育领域,基于语音识别技术所研发的自助问答系统,可以在无实际老师指导的情况下,帮助学生解决问题;在医疗领域,有语音自助问诊系统,该系统可以让人们在家里就能初步了解自身存在的病情[6]。这些产品的应用提高了办事效率,改善了生活品质,给人们的日常生活带来了巨大变化。可以预测,语音识别技术将来会有更多的应用产品,更加智能地服务于每个人的生活[7]。
1.2国内外研究现状
1.2.1国外研究现状
在语音识别技术方面,国外的研究相对较早,经过几十年的技术积累,诞生了一些优秀的专门致力于语音识别的公司。在语音识别领域,Nuance公司拥有用户数达到20亿,超过了80%的市场股份,它的成功得益于强大的语音识别引擎,该引擎支持超过50种语言,识别效果显著,该技术被广泛应用于智能手机、PC机、汽车等产品中[8-9]。苹果公司的Siri语音助手最早应用于iphone4s中,该语音助手不仅能够识别整个短语的语音,而且能够通过大量的短语辅助理解上下文内容,赋予智能手机人的思维[10]。2015年,苹果公司加大对语音识别技术的投入,收购了英国初创公司VocallQ,致力于提高用户与机器对话的体验。在语音识别方面的技术积累,苹果公司更是将语音技术整合到智能家具设备和可穿戴设备中。谷歌公司在语音识别领域也投入了巨大的资金,先后收购了多家语音技术公司,例如在语音识别方面拥有多项专利的SRTech Group公司[11]等并将这些技术应用于市场,推出了谷歌智能语音助手等软件,支持将语音信息直接转换为文字信息,还可以进行语音的实时翻译。谷歌公司还将语音识别技术应用于智能手表中,能进行语音控制拨打电话,打开App等功能。微软作为全球最大的科技公司之一,其在PC领域拥有用户量最大的Windows操作系统,近几年微软在语音识别方面的研发也投入很大精力,最为成功的是微软的Cortana和微软小冰。Cortana和小冰都加入了人工智能、机器学习等领域的先进研究成果,能够通过学习用户电脑或手机中各种类型的信息,以此来判断词语的意思和上下文关系,较大程度上理解用户想表达的真实含义[12]。
1.2.2国内研究现状
近年来,我国在语音识别领域上的表现非常出色。科大讯飞作为我国最具影响力的智能语音技术提供商[13],虽然成立时间较晚,但是依靠中科大的语音识别技术以及国家的大力支持,经过几十年的发展,在语音识别领域站稳了脚跟,国内市场占有率超过了60%。在我国的教育领域,各个省份的口语考试中用的都是科大讯飞的语音识别引擎。百度语音助手作为百度公司在语音识别技术领域的应用产品,它能够实现对声音信息的识别并直接进行网页搜索,使得搜索变得更加智能、快速。百度还将语音识别引擎应用于百度输入法,能够实现语音信息直接转换成文本文字,这一种语音输入功能具有识别率高,识别速度快等优点被广大用户所认可。近年来,小米公司也投入巨大精力致力于研发基于语音识别技术的产品。在2017年下半年推出了基于语音识别技术的音箱“小爱同学”,该音箱融入了人工智能、深度学习等技术,支持语音交互[14],可以实现在线点歌、广播电台、提供新闻、闹钟、天气等信息。同年,由阿里巴巴集团所属人工智能实验室研发的天猫精灵发布,该产品运行AliGenie操作系统,能实时与用户进行对话,并能通过语音进行网上购物,在线订餐,还可以控制家庭中的各种智能设备,由于加入了人工智能技术[15],天猫精灵可以记录用户的生活习惯,能够更加智能地与用户互动。
1.3主要研究内容
本课题设计了一种智能语音交互助手,该系统选用STM32作为主控单元,选用LD3320芯片进行语音识别。LD3320语音识别模块采集并识别特定的关键词信息并进行处理,然后将信号发送给MCU,MCU根据关键词的不同从而控制BY8001-16P模块播放不同的音乐、调节LED灯的亮度以及OLED模块的显示。该系统还具有自动唤醒功能,当有人从它面前经过时,HC-SR501人体感应模块会给MCU一个触发信号,实现系统的待机自动唤醒,随后便可以进行基本的语音对话。
第二章 系统总体设计
2.1系统总体功能设计
如图2-1所示,智能语音助手的总体功能可以分为语音识别、音乐播放、待机唤醒、灯光调节以及信息显示等五大功能,每一个功能模块都有各自的处理过程,接下来分别对五大功能进行具体说明。
请支付后下载全文,论文总字数:21252字