基于神经网络的声音信号的识别系统设计开题报告
2021-08-14 03:03:45
1. 研究目的与意义(文献综述)
人工神经网络是一种模拟人脑神经元细胞的网络结构和功能,运用大量的处理部件,由人工方式建立起来的自适应非线性动态系统。它是在生物神经网络研究的基础上建立起来的,能在一定程度上模仿生物神经系统的智慧和功能。因此广泛应用于信息处理、医学、经济、控制、交通、心理学等领域。语音识别是机器通过识别和理解过程把人类的语言信号转换为文本或命令的技术。其根本目的是研究出一种具有听觉功能的机器,这种机器能直接接受人的语言,理解人的意图,并作出相应的反应,从技术上来看,它属于多维模式识别和智能接口的范畴,语音识别是一项集声学、语音学、计算机、信息处理、人工智能等为一身的综合技术,可广泛应用在信息处理、通信与电子系统、自动控制等领域。
神经网络方法用于语音识别最为突出的优点是,它省去了传统识别方法的建立模板的过程。它不需要建模,只需通过大量的学习来修改网络的权值,因而对于非特定人语音识别,尤其是大词汇识别来讲,神经网络方法所需内存小,加上神经网络的容错性好,因此识别率高。另外,传统的识别方法,如多模板技术,识别时,需将输入模式与所有模板进行配准,然后再采用一定的判别准则才能得到识别结果,在大量词汇和多个模板情况下,计算量很大,识别速度很慢。而神经网络方法虽然随着词汇量的增加,网络的拓扑结构可能要复杂一些,但识别速度比传统方法还是要快得多。
我国语音识别研究工作一直紧跟国际水平,国家也很重视,并把大量词汇量语音识别的研究列入“863”计划,由中科院声学所、自动化所及北京大学等单位研究开发。鉴于中国未来庞大的市场,国外也非常重视汉语语音识别的研究。美国、新加坡等地聚集了一大批来自大陆、台湾、香港等地的学者,汉语大词汇量语音识别都达到了相当高的水平。
2. 研究的基本内容与方案
本文主要以语音识别与神经网络的基本理论为基础,研究基于神经网络的语音识别问题。基本内容包括,研究语音识别技术的核心,即语音训练和识别,还有bp神经网络的结构和算法,及bp神经网络训练和识别的具体过程。此外,还将研究语音信号的初步处理,如预处理、端点检测、加帧等,并针对特征参数提取各个方法进行对比。应用仿真软件matlab7.0对语音系统进行仿真,将几种不同的语音识别方法进行性能分析比较。基本方案包括:建立语音样本库,包括对语音信号进行采集和预处理,获取语音特征值,对特征值进行规划;确立神经网络模型;使用特征参数训练神经网络;使用语音测试样本进行语音识别。
bp算法和它的改进算法对网络训练问题仍然存在不可预见性。而且其中不少改进算法是采用启发式的方法对传统bp算法进行改进。因此,对这类算法除了实验手段外还没有严密的理论方法能够预计他们的有效性。然而尽管目前神经网络理论还存在这样或那样的不足,但仍然有了许多成功应用的例子,不失为一种研究非线性系统和语音识别系统的有力工具。
不同语音识别系统,虽然具体实现细节有所不同,但所采用的基本技术相似。典型语音识别系统的实现过程如图所示:
3. 研究计划与安排
第1-2周:完成题目调研,查阅参考资料,完成开题报告。第3-7周:学习matlab、声音识别、神经网络的相关知识,完成相关文献的翻译。
第8-9周:对声音进行特征提取得到声音的特征向量,通过模式匹配得到声音识别的最终结果。设计多类声音的识别方案,应用matlab软件进行声音的分组和识别。
第10-11周:完成系统的设计、调试及性能分析。
4. 参考文献(12篇以上)
[1]朱恒军,于泓博,王发智.小波分析和支持向量机相融合的语音端点检测算法[j].计算机科学,2012(06):244-246.[2]高美娟,杨智鑫,田景文.移动机器人实时语音控制的实现[j].电子测量技术,2011(07):50-53.
[3]张宇波,邢立钊.基于小波分析与pso-elm的语音端点检测算法研究[j].中北大学学报(自然科学版),2016(01):33-38.
[4]黎林,朱军.基于小波分析与神经网络的语音端点检测研究[j].电子测量与仪器学报,2013(06):528-535.