数字语音信号变换技术的研究与实现毕业论文
2021-08-02 20:56:05
摘 要
本文中对于数字语音信号变换技术的研究与实现主要有两个方面:语音增强和语音识别。语音增强主要是指当语音信号被各种各样的噪声干扰、甚至淹没后,从噪声背景中提取、增强有用的语音信号,抑制、降低噪声干扰的技术。语音识别主要是从多个语音信号中检测出自己所需信号,通过制定一定的规则,使得计算机可以有效地选取所需信号。实验内容与计算机技术应用的结合主要在于Matlab仿真软件的使用,Matlab是一个拥有强大数据分析处理功能的实用软件,它拥有的数字信号处理能力与数据分析工具箱为数字语音信号的分析提供了十分丰富的函数数据,因此充分的利用Matlab中的函数公式和强大的数据处理能力,能有效地实现算法条件下的数字语音信号处理功能,完成所要达到的语音处理效果,从而达到方便迅速而又有效地对于数字语音信号的处理和分析。
关键词:语音识别 语音增强 Matlab仿真
Abstract
In this paper, the research and implementation of digital speech signal transformation technology mainly has two aspects: speech enhancement and speech recognition. Speech enhancement is mainly refers to when the speech signal is all kinds of noise interference, or even submerged, from the noise background to extract, enhance the useful speech signal, suppression, reduce noise interference technology. Speech recognition is mainly from a number of voice signals to detect their desired signal, through the development of a certain rules, so that the computer can effectively select the desired signal. The content and application of the computer technology combined with mainly lies in the use of MATLAB simulation software MATLAB is a powerful data analysis and processing function of utility software. It has digital signal processing ability and data analysis toolbox of digital speech signal analysis provides very rich function data, so full of using matlab function formula and powerful data processing ability, effectively implementation algorithm of the digital speech signal processing functions, complete to achieve the result of speech processing, so as to achieve the purpose of convenient, rapid and effective for digital speech signal processing and analysis.
Keywords: Speech recognition, Speech enhancement, The Simulation of Matlab
目 录
第1章 绪论 1
1.1背景和意义 1
1.2国内外的研究现状 1
1.3本文框架及结构安排 2
第2章 语音信号的分析与原理综述 4
2.1语音信号的特点 4
2.2原始信号特征的提取 4
2.3语音信号的分析方法 5
2.4本章小结 6
第3章 语音信号增强的分析与实现 7
3.1 传统减谱算法 7
3.1.1 功率减谱的原理 7
3.1.2 幅值减谱的原理 8
3.1.3 经典减谱形式的实现流程 8
3.1.4 减谱经典形式的缺点 10
3.2 维纳滤波算法 10
3.2.1 维纳滤波的原理 10
3.3 仿真结果 11
3.3.1减谱法仿真结果: 11
3.3.2维纳滤波仿真结果: 12
3.4 本章小节 13
第4章 语音识别的原理与分析 14
4.1 语音识别的原理 14
4.2 语音识别的任务分类 15
4.2.1 根据识别的对象不同分类 15
4.2.2 根据针对的发音人分类 15
4.2.3 根据语音识别的方法分类 16
4.3 仿真过程设计 16
4.3.1 仿真流程设计 16
4.3.2 语音信号的获取 18
4.4仿真结果分析 19
4.5本章小结 20
第5章 总结与展望 21
1.总结 21
2.展望 22
参考文献 23
致 谢 24
第1章 绪论
1.1背景和意义
语言是人与人之间交流所需的,是人们天生就拥有的一种能力,语音信号则是语言存在的一种介质,使得人们可以无论何时何地都能进行交流通信。让计算机可以听懂并传输人类的语言,将之转换成数字语音信号,使人们在计算机诞生出来后所向往的方向,人们为之努力了几个世纪,它在人们的日常生活中变得越来越重要,人们交流通信、旅游、金融等多方面,都有它的影子。
语音变换技术是保持原有语义不变将之语音信号特征转变的方法,应用的方面也多种多样,比如手机通信,手机音量的大小,手机音质的高低,手机转变过来的说话人语音特征是否改变,是否能通过手机语音分辨出说话人。
随着科技的发展,人们的生活水平在日益高涨,但也随着时代的进步,语音通信的质量也受到了一定程度上的干扰,比如在工厂中,各种机器运行时产生的机械噪声;在飞机场,飞机起降时的噪声;在街道上,人群吵杂的噪声;在家中,电视音响家电等产生的噪声。如何有效的避免这些噪声的干扰,增强语音通信的质量,是我们现在所要做的首要任务,如果不解决这个问题的话,语音通信的存在就会变得可有可无了,我们与其费心思在嘈杂的语音信号中找出自己想要的结果,不如直接去找原始语音信号更快捷方便[1]。
想要实现语音信号的传输就要先实现语音信号的识别出理,只有先识别了语音信号才能进行后续的一些转换技术,数字语音信号识别就是让计算机将人们所说的话转变成计算机语言,在网络上进行传输。
数字语音信号的转变技术的研究与实现,是现代世界上人们所需要的也是必须具备的,缺少了这个技术的支持,人们日常生活上的进度就会变得缓慢,有了语音转换技术,信息的交流才能更加的迅速以及准确,才能避免出现过多的失误。
1.2 国内外的研究现状
有关语音增强抗噪声技术的研究以及实际环境下的语音信号处理系统的开发,在国内外作为语音信号处理的一个重要的研究课题,已经做了大量的研究工作,取得了丰富的研究成果。
20世纪50年代,这是语音技术研究开始进行的时候,在这个时期,贝尔实验室研制成功可以识别10个英文数字的出现,标志着语音技术的开始。20世纪60年代,动态规划以及线性预测分析技术的出现,标志着计算机应用中语音技术的成长。20世纪70年代,伴随着线性预测倒谱和动态时间规整技术的特定人孤立语音技术研究成功,相继提出了矢量量化以及隐马尔科夫模型理论,这标志着语音技术取得了突破性的发展。20世纪80年代,随着语音技术深入的发展,人工神经元网络在语音技术上的提出以及成功的应用,标志着计算机语音技术发展的进程加快了。20世纪90年代,计算机语音技术逐步的进入了人们的日常生活当中,这标志着语音技术研究的方向与人们息息相关。至今,语音技术还在随着科技的发展而进步,各种各样的语音处理技术也在与日增多。
语音处理技术现在还面临着许多的技术问题,例如:世界上有很多的国家,也就存在着很多种语言,这就使得语音技术系统在世界上的适应性变得很差,很难处理全世界每个地方上的语音信号,这就使得世界各国的人们难以及时的进行语音上的交流。还有就是现代社会科技发展,各种各样的科技产品日益增多,而这些科技产品或多或少都会产生一定的噪声,而这些噪声会在语音信号传输过程产生干扰,是的语音信号变得与原始信号有很大的区别,甚至噪声的存在会掩盖住原始语音信号,这就使得我们不能随时随地的后的我们所需的纯净的原始语音信号。再有,语音信息的传输会随着地域的不同,人们对之也会有不同的理解,这就使得不同文化,不同信仰,不同习惯的人们在交流上产生一定的隔阂,这样的现象是的语音信号的传输存在着难以跨越的鸿沟,只有充分解决了这些问题,语音技术的应用才能最大程度上满足人们的日常生活所需。
到目前为止,国内外的科研人员们经过了一个世纪的艰苦奋斗,终于研究出了一些语音信号处理方面的解决方法。可以将这些方法大致上分为三类,其中之一就是数字语音信号的增强算法,这种方法可以提高语音信号处理的抗噪声能力,并且提高信号的信噪比。第二类方法就是找寻出抗噪信号的语音特征参数,了解了这类信号的语音特征参数,就可以将之范围化,是大众的语音信号传输拥有相似的抗噪性能。最后一类方法是噪声补偿算法,这类方法是在一定的知识基础上,建造一个稳态环境,在这里语音信号可以平稳的传输,噪声的干扰可以看作是恒定的,但是,这样一个稳定的环境并不存在,所以最终的实验效果并不理想[2]。
1.3 本文框架及结构安排
全文主要对语音信号处理问题及各类相关算法进行了研究,并通过MATLAB实现。各章节内容安排如下: