基于深度神经网络的语音识别系统设计开题报告
2020-02-20 09:38:50
1. 研究目的与意义(文献综述)
1.1 选题背景及意义
语音识别是将人类所发出的语音转化为文字或符号的技术。从40年前开始对声学特征的抽取.到如今使用深度神经网络作为主体的自动语音识别系统,语音识别技术已经逐步完善。但语音识别技术也面临着一些问题.比如在语音识别中单纯地提取出声音频谱作为特征并不能达到很高的识别率.模型具有较高的时间或空间复杂度会限制语音识别技术的应用以及导致环境噪声问题等。
基于深度神经网络的语音识别系统具有很强的非线性处理能力,相比于高斯混合模型,其可以显著提高系统性能并减少时间和空间复杂度。在性能.上可以通过无监督训练的方法提升抗噪性能,hes-sian free优化可以减少训练过程消耗的时间刀;异步随机梯度下降法习、随机数据丢弃,基于平均随机梯度下降法的单次迭代算法司、奇异值分解、节点修剪( node-pruning)刀等方法都可以在一定程度上减少时间和空间的复杂度。深度神经网络在高斯混合模型作为基础上与隐马尔科夫模型( hid-den markov model, hmm)相结合,在连续语音识别上得到了很好的实验结果。此后,研究者发现即使没有高斯混合模型作为基础,深度神经网络同样可以取得良好的性能。另外深度神经网络还被应用于自然语言理解。
2. 研究的基本内容与方案
2.1 本论文的主要工作和内容
神经网络语言模型是利用深度神经网络建立的语言模型,也是目前语言模型领域的一个研究热点。众多科研人员经过多年研究,基于神经网络的语言模型已经在一定程度上让语音识别技术的性能更优秀。本设计应将深度神经网络应用至现有数据上,搭建语音识别平台,并达到一定的识别率。
3. 研究计划与安排
(1)12月到1月,查阅相关资料,调研国内外研究现状。
(2)1月到2月,阅读相关书籍和文献,找到合适的语音识别方法。
(3)2月到3月,搭建基于深度神经网络的语音识别框架,并使用现有的数据进行训练。
4. 参考文献(12篇以上)
[1]张德良. 深度神经网络在中文语音识别系统中的实现[d].北京交通大学,2015.
[2]戴礼荣,张仕良. 深度语音信号与信息处理:研究进展与展望[j]. 数据采集与处理. 2014(02)
[3]刘旺玉,shiraishi hiroshi. 基于gmm-hmm和深层循环神经网络的复杂噪声环境下的语音识别[j]. 制造业自动化. 2016(05)