基于线性预测编码的语音合成设计毕业论文
2022-06-12 20:22:42
论文总字数:32245字
摘 要
目前,语音合成越来越广泛地应用到社会生活的方方面面,是人机语音通信的一个重要组成部分。从技术方式上分常用的语音合成方法主要有三种:即波形合成法、参数合成法和规则合成法。作为参数合成法的一种方法,线性预测编码(LPC)是实现语音合成的一项重要技术。本文介绍了语音信号的线性预测分析的基本原理,以及求解线性预测方程的自相关法。根据已有语音文件,在预处理、语音端点检测、自相关函数的主体-延伸基音检测的基础上,得到语音信号每一帧的预测系数和模型增益,利用Matlab设计出的递归型合成滤波器合成每一帧语音,再用线性比例重叠相加法将语音连接,从而获得连续的一段合成语音。实验结果表明,线性预测可提供一种简单而有效的用少量参数来表示语音信号的方法,但同时要求合成语音样本需要较高的计算精度。
关键字:语音合成 线性预测编码(LPC) 自相关函数 Matlab 递归型合成滤波器
Design of speech synthesis Based on Linear Predictive Coding
Abstract
At present, speech synthesis is more and more widely used in all aspects of social life. It is also an important part of Man-Machine Speech Communication. According to the present technology , there are three kinds of commonly used speech synthesis method: waveform synthesis method, parameter synthesis method and rule synthesis method. As a method of parameter synthesis method, linear predictive coding (LPC) is an important technology to realize speech synthesis. This article introduces the basic principle of linear prediction analysis of speech signal and the solution of linear prediction equation with autocorrelation method. According to the existing voice file, in the pre emphasis, the endpoint detection, the autocorrelation function of the body - extension of pitch detection and linear proportional overlap add method ,getting prediction coefficient and gain model of each frame of the speech signal, then using Matlab to design a recursive filter synthesis, so as to obtain the synthetic speech. The experimental results show that, the linear prediction can provide a simple and effective method with a small amount of parameters that the speech signal, and require higher calculation accuracy in synthetic speech samples.
Key Words:speech synthesis;linear predictive coding (LPC);autocorrelation function;Matlab;recursive filter synthesis
目 录
摘 要 I
ABSTRACT II
第一章 绪论 1
1.1 课题的研究背景及意义 1
1.2 国内外研究现状 1
1.3 语音合成技术 2
1.3.1 语音合成方法的分类 2
1.3.2 语音合成的发展方向 4
1.4 本文的研究工作及内容 5
第二章 预备知识 7
2.1 引言 7
2.2 语音信号的数学模型 7
2.2.1 激励模型 8
2.2.2 声道模型 9
2.2.3 辐射模型 10
2.3 语音信号的数字化和预处理 10
2.3.1 预滤波、采样、A/D变换 10
2.3.2 预加重 10
2.3.3 分帧处理 11
2.3.4 加窗函数 11
2.4 语音信号短时时域处理 12
2.4.1 短时能量 12
2.4.2 短时平均过零率 13
2.4.3 短时自相关函数 13
2.5 语音端点检测 14
2.5.1 双门限法 14
2.5.2 能熵比法的端点检测 15
2.6 本章小结 16
第三章 一种改进基音检测的主体-延伸基音检测法 17
3.1 引言 17
3.2 基音周期提取的预处理 17
3.2.1 基音检测中的端点检测 17
3.2.2 基音检测中的带通滤波器 17
3.3 短时自相关函数法的基音检测 18
3.3.1 短时自相关函数法基音检测原理 18
3.3.3 简单的后处理方法 18
3.4 主体—延伸基音检测法 19
3.4.1 主体—延伸法的原理及方法 19
3.4.2 主体—延伸基音检测法的步骤 20
3.4.3 端点检测和元音主体的检测 21
3.4.4 元音主体的基音检测 22
3.4.5 计算延伸区间和长度 22
3.4.6 在延伸区间进行基音检测 23
3.5 本章小结 24
第四章 语音信号的线性预测编码 .25
4.1 引言 25
4.2 线性预测分析的基本原理 25
4.2.1 信号模型 25
4.2.2 线性预测方程的建立 26
4.2.3 语音信号的线性预测分析 27
4.3 线性预测分析自相关的解法 28
4.3.1 托普利兹矩阵 28
4.3.2 莱文逊—杜宾算法 29
4.4 本章小结 30
第五章 语音信号的合成算法 31
5.1 引言 31
5.2 数据叠接技术 31
5.2.1 重叠相加法 31
5.2.2 线性比例重叠相加法 31
5.3 线性预测合成模型 33
5.3.1 递归型合成滤波器 33
5.3.2 格型合成滤波器 34
5.4 语音合成 35
5.4.1 语音信号源的产生 35
5.4.2 语音合成算法实现过程 35
5.4.3 语音合成结果 37
5.5 本章小结 39
第六章 总结与展望 40
6.1 总结 40
6.2 展望 40
参考文献 41
致谢 43
附录 44
第一章 绪论
1.1 课题的研究背景及意义
语言作为人类特有的功能,在人类传递信息中,具有着特殊的历史性的重要的地位,是人们传递思想与分享感情的主要手段。语音合成技术使智能机器能够像人类一样产生高度自然、清晰的连续语音,或者使一些以文字表示的信息能转化为语音信号,使人们只通过听觉就能够从容地获得外界信息。
在如今这个信息爆炸的时代,如何运用现代科学技术研究分析语音处理技术,从而更有效地产生、传输、存储、获得及应用语音信息,对社会的生产与生活都具有重大意义。线性预测分析能够迅速地估算出一段语音信号的特征参数,并能够根据特征参数给出一个良好的语音模型,即线性预测合成模型,而且该方法模型简单、算法简便。一般在语音信号的传输过程中,该技术能减小信号的传输带宽,从而提高信号的传输速率。随着科技的进步,该技术已成为语音分析的一个重要分析基础。
1.2 国内外研究现状
计算机技术越来越广泛地运用到语音合成的研究当中。相比较之前语音信号处理技术的发展,计算机技术不仅缩短了语音研究的周期,随之还减少了语音研究的经费。从近几十年来的发展来看,对文-语转换系统的探索已经逐渐成为国内外的研究主攻方向。同时随着国内外对语音学统计建模的不断研究,有理由相信对连续语音识别系统的开发、对语音情感的处理以及将隐马尔可夫模型(HMM)与人工神经网络(ANN)的结合在不远的将来大放异彩。
请支付后下载全文,论文总字数:32245字