语音信号特征提取算法的研究与实现开题报告
2020-04-13 15:22:21
1. 研究目的与意义(文献综述)
语音信号处理是语音学与数字信号处理技术相结合的交叉学科,它和认知科学、心理学、语言学、计算机科学、模式识别和人工智能等学科联系紧密。语音信号处理技术的发展依赖于这些学科的发展,而语音信号处理技术的进步也会促成这些学科的进步。语音信号处理的目的是要得到某些语音特征参数以便高效地传输或存储;或者是通过某种处理运算以达到某种用途的要求,如人工合成语音、辨识出讲话者、识别出讲话的内容等。语音合成技术、语音编码技术及语音识别技术作为语音信号处理的三个分支。
语言作为人类最重要的交流工具,是人类获得信息的重要来源之一,让计算机能“听懂”人类的语言,也是人与计算机之间进行沟通最方便的形式之一。用语音来实现人与计算机之间的交互,主要包括三项技术,即语音识别、自然语言理解和语音合成。随着计算机处理能力的迅速提高,语音识别技术得到了飞速发展。20世纪90年代,语音识别技术从实验室走向应用,今天,语音识别技术受到了国内外研究机构的广泛关注和高度重视,其应用也必将带来良好的社会和经济效益。其中语音特征参数的提取是语音识别的一个重要步骤。所谓特征提取,即对不同的语音寻找其内在特征,由此来差别出未知语音,所以每个语音识别系统都必须进行特征提取。特征的选择对识别效果至关重要,选择的标准应体现对异音字之间的距离尽可能大,而同音字之间的距离应尽可能小。同时还要考虑特征参数的计算量,应在保持高识别率的情况下,尽可能减少特征以减小存储要求和利于实时实现。语音的特征提取实质上是起降维的作用,用较少的维数来表示说话人的特征。常用的语音特征包括Pitch(基音)、Formant(共振峰)、LPCC(线性预测倒谱系数)、MFCC(Mel频率倒谱系数)。近几年,科学工作者在研究语音识别时,用的最多的特征提取方法就是基于线性预测倒谱系数方法。
随着科技的发展和人们对语音识别理论的逐渐深入化的研究,理论体系的日趋成熟,随着数字信号处理技术的发展,在未来20年,语音识别技术将逐渐的进入工业、家电、通信、汽车电子、医疗以及各种电子设备中。可以肯定地说,语音识别技术必将成为未来信息产业中的一项关键的技术。但是也不可否认,它还有很长的一段路需要走,要真正的商业化,还需要在多方面取得突破性的进展,还需要借助于其它相关学科的发展。2. 研究的基本内容与方案
1)研究(设计)的基本内容
①基于语音信号识别系统原理的研究;
②基于语音信号特征提取预处理的研究与实现;
3. 研究计划与安排
第1-3周:收集、整理选题相关的文献资料,完成、完善方案论证,撰写开题报告;
第4-5周:认真学习选题相关的知识、理论和算法实现等,熟悉软硬件环境;
第6-9周:建立软硬件仿真模型、完成程序编写、仿真实验等,并做好相关记录及分析;
4. 参考文献(12篇以上)
[1] 基于gmm-hmm和深层循环神经网络的复杂噪声环境下的语音识别[j]. 刘旺玉,shiraishi hiroshi. 制造业自动化. 2016.5
[2] 基于深度学习的语音识别应用研究[d].张建华.北京邮电大学 2015
[3] hierarchical deep belief networksbased point process model for keywords spotting in continuous speech[j]. yi wang,jun‐an yang,jun lu,hui liu,lun‐wu wang. int. j. commun.syst. . 2015.3