基于循环神经网络的语音识别方法设计开题报告
2020-02-20 09:38:55
1. 研究目的与意义(文献综述)
近几年“人工智能”话题持续火热,其中,让机器听懂人类说话是实现机器智能的一个重要部分,机器语音识别的发展,让机器在识别二进制数的“一维语言”和识别高级语言的“二维语言”提高至识别语音的“三维语言”,作为人工智能的关键技术之一,人机语音交流技术一直以来备受各国科学界的关注,从智能手机的出现,手机语音助手一直是智能手机智能的一大表现,其技术也一直得到各手机厂商的研发投入和更新,听懂人说话已经是家常便饭,帮助人类完成部分操作,可能有的人使用频率较低,但不可否认的是,该技术已经走进人们的生活,也正在开发其在更多场合的功能,例如医院、公安局、超市等场合。
语音识别技术可以按照任务的不同分为四个方向:
⑴说话者识别:主要是通过声音识别说话人的身份,由于每个人的生理特征不同,每个人的声音都不一样,而且由于每个人的说话的方言、韵律、腔调影响,可以实现说话人的识别,生活中,支付软件支付宝已经把声纹识别加入安全锁的一部分。
⑵关键词检出:在一些特定的场合,只关注包含特定关键词的句子,实现特定功能。
2. 研究的基本内容与方案
众多科研人员经过多年研究,基于神经网络的语言模型已经在一定程度上让语音识别技术的性能更优秀。本设计将循环神经网络应用至现有数据上,搭建语音识别平台,使用现有的数据训练,并达到一定的识别率。
本设计将会介绍循环神经网路的发展进程、发展现状及其工作原理,也会根据文献介绍其算法结构,对循环神经网络进行自我学习认识,参考学术期刊文献,选取合适的框架,最后实现语音识别。
结合实际情况分析如何在合适场景使用语音识别技术和方法,用uml完成关键算法的概要设计,选取合适的框架实现该识别方法,对训练或识别过程进行加速与优化。
3. 研究计划与安排
(1)12月到1月,查阅相关资料,调研国内外研究现状。
(2)1月到2月,阅读相关书籍和文献,找到合适的语音识别方法。
(3)2月到3月,搭建基于循环神经网络的语音识别框架,并使用现有的数据进行训练。
4. 参考文献(12篇以上)
[1]玄扬. 基于LSTM神经网络的语音模型优化研究[D].广西师范学院,2018.
[2]胡涛. 基于卷积神经网络的异常音频事件检测的研究[D].安徽大学,2018.
[3]古典. 语音识别中神经网络声学模型的说话人自适应研究[D].中国科学技术大学,2018.
[4]张校非. 机器学习在语音识别和图像识别中的应用[D].中北大学,2018.
[5]吴兴铨. 基于卷积神经网络的歌唱语音识别[D].西南科技大学,2018.
[6]Boes, M.,Oldoni, D.,De Coensel, B.,Botteldooren, D. Long-term learning behavior in a recurrent neural network for sound recognition[C]. IEEE会议论文,2014.
[7] 赵淑芳、董小雨. 基于改进的LSTM深度神经网络语音识别研究[J].郑州大学学报(工学版),2018
[8]石颖. 基于循环神经网络的语音识别方案的优化与设计[D].北京交通大学.2017.
[9] Jürgen Schmidhuber. Deep learning in neural networks: An overview[J] . Neural Networks . 2014
[10]邵娜;李晓坤等,基于深度学习的语音识别方法研究[J].智能计算机与应用.2019.
[11]陈硕. 深度学习神经网络在语音识别中的应用研究[D].华南理工大学.2013.
[12]陈先昌. 基于卷积神经网络的深度学习算法与应用研究[D].浙江工商大学.2013.
[13]李宏松;苏健民等. 基于声音信号的特征提取方法的研究[D].信息技术.2006.
[14]张晴晴;刘勇等. 基于卷积神经网络的连续语音识别[J].工程科学学报.2015.
[15]张仕良. 基于深度神经网络的语音识别模型研究[D].中国科学技术大学.2017.