关键词语音识别技术仿真分析研究开题报告
2021-03-10 23:58:02
1. 研究目的与意义(文献综述)
语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的技术。简单来说,就是与机器进行语音交流,让机器明白你在说什么,中国物联网校企联盟形象得把语音识别比做为“机器的听觉系统”。随着语音处理技术的飞速发展,语音识别技术开始慢慢渗入工业、家电、通信、医疗、消费电子产品等领域中。目前微软,谷歌和国内的百度,搜狗各自在语音识别上都有了大的突破,2016年搜狗第三季度财报报导称搜狗语音输入法每天被人使用了快两亿次。近几年来,借助机器学习领域深度学习研究的发展,以及大数据语料的积累,语音识别技术得到突飞猛进的发展。
1)将机器学习领域深度学习研究引入到语音识别声学模型训练,使用带rbm预训练的多层神经网络,极大提高了声学模型的准确率。在此方面,微软公司的研究人员率先取得了突破性进展,他们使用深层神经网络模型(dnn)后,语音识别错误率降低了30%,是近20年来语音识别技术方面最快的进步。
2)目前大多主流的语音识别解码器已经采用基于有限状态机(wfst)的解码网络,该解码网络可以把语言模型、词典和声学共享音字集统一集成为一个大的解码网络,大大提高了解码的速度,为语音识别的实时应用提供了基础。
2. 研究的基本内容与方案
本研究主要内容和基本目标如下:
1)分析语音识别的原理,阐述语音识别系统的组成框架,研究关键词语音识别的关键技术。
2)通过matlab对输入语音信号进行分析并提取特征参数,包括语音信号波形的幅值、短时能量、过零率、基音周期等,及检测语音信号起始点。
3)基于hmm模型技术建立小词汇量关键词模型库和小词汇量垃圾模型库,进行语音识别并分析识别结果。
3. 研究计划与安排
第1-3周:收集、研读选题相关的文献资料,完成、完善方案论证,撰写开题报告;
第4-5周:认真学习选题相关的知识、理论和算法等,熟悉掌握项目所需工具、软硬件环境等;
第6-9周:结合前期学习,完成项目方案初步实现,并做好相关记录;
4. 参考文献(12篇以上)
[1] 崔天宇.基于hmm的语音识别系统的研究与实现[d].吉林大学,2016.
[2] 李敏.基于关键词检测的人机交互研究[d].北京交通大学,2016.
[3] 姚慧.情感语言的非线性特征研究[d].太原理工大学,2016.