登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 毕业论文 > 电子信息类 > 电子科学与技术 > 正文

语音情感的维度特征提取方法的研究

 2022-11-26 12:57:31  

论文总字数:23574字

摘 要

随着现代计算机和互联网技术的不断进步与发展,语音和情感识别已经成为现代计算机科学技术进步的一个重要因素。语音信号的预处理、特征参数的提取与情感识别语音库等就是语音情感识别最基础、也是关键内容。本文主要对多种情感语音的特征提取与多种情感语音识别的算法进行了研究,对研究应用对象多种情感语音进行了预处理、预加重、加窗式检测以及端点式检测四个环节的流程化处理,在多种情感语音中分别选择高兴、愤怒和悲伤3种特殊情感语音,分析其短时能量、过零率、短时幅值等相关参数,使用语音情感识别算法识别3种语音情感。用MATLAB进行仿真实验,得出不同情感语境下的识别结果。

关键词:语音预处理;情感特征提取;语音情感识别

Research on dimension feature extraction of speech emotion

Abstract

With the continuous progress and development of modern computer and Internet technology, speech and emotion recognition has become an important factor in the progress of modern computer science and technology. Speech signal preprocessing, feature parameter extraction and emotion recognition speech database are the most basic and key content of speech emotion recognition. This paper mainly studies the feature extraction and recognition algorithm of multi emotion speech. Through the preprocessing, pre emphasis, windowed detection and endpoint detection of multi emotion speech, three kinds of special emotion speech including happy, angry and sad are selected, The short-term energy, zero crossing rate, short-term amplitude and other related parameters are analyzed, and the speech emotion recognition algorithm is used to recognize three kinds of speech emotion. Matlab is used to carry out simulation experiments, and the recognition results in different emotional contexts are obtained.

Keywords: Speech preprocessing; Emotion feature extraction; Speech emotion recognition algorithm.

目 录

摘 要 I

Abstract II

第一章 绪 论 1

1.1研究背景及意义 1

1.2语音识别的现状 1

1.3语音情感识别中面临的挑战 2

第二章 语音情感识别技术 3

2.1语音情感识别的基础流程 3

2.1.1预处理 3

2.1.2语音情感信号的加窗处理 4

2.1.3语音情感信号的端点检测 4

2.2语音情感特征的提取 5

第三章 语音情感及语音情感库 8

3.1语音情感的分类 8

3.2情感语句的采集 9

3.3目前国际上具有代表的语音数据库 9

第四章 语音情感识别算法研究 11

4.1模糊K近邻算法 11

4.2语音情感识别实验过程 11

4.3实验结果分析 11

4.4结论 13

第五章 总结与展望 14

5.1论文研究的章节总结 14

5.2展望 14

致 谢 15

参考文献 16

附录 17

第一章 绪 论

1.1研究背景及意义

随着科技的发展,当苹果公司的语音识别“siri”诞生时,人机交互的深度发生了颠覆式的改变,人们开始不断拓展机器对于语音处理的能力,让机器能按照人类的意愿发声。小到智能家居的语音音箱,大到智能汽车的人工驾驶,这一切的前提都是基于语音识别,AI智能汽车语音助手“小度”是一家汽车公司打造的一款适合用户与汽车进行语音动态交流的智能语音助手,通过主人的发声,对其语音情感进行识别,从而提供诸多人性化服务。例如可以实时查询天气、车流状况,日内新闻等信息,为你制定最完备的出行攻略,躲避拥堵顺畅出行。只需开口无需动手,智能出行随心掌控。而研究语音情感学习的目标最终也就是为了使得电脑变成一个更有人性化的东西。

语音能成为人类情感表达的窗口,对于语音情感识别的研究近些年得到世界各国的广泛关注,目前将语音情感大致分为,开心,难过,恶心,害怕,惊讶,生气六大类别,不同的情绪其语音的各类参数均有不同,通过对语音情感参数的研究,然后对其进行处理建模,计算机就可以大致识别出人类语音所表达的特有情感。为了让计算机分析这些情感,需要对语音的几个维度进行处理和分析,最常用的是arousal和valence,arousal代表消极情绪的高低,valence代表积极情绪的高低,这两个维度都是通过数值来代表他的高低程度。研究者通过数值变化;来得出情绪的高亢还是低迷,数值波形就是情绪波动,通过计算机的拟合可以清晰的变化,然后计算机通过自主学习,从而将人类情感语音建立库,当出现类似的情感,计算机能第一时间察觉出来。

研究计算机语音情感识别的意义就是更好的服务于生活,随着语音情感的不断深入,其在刑侦中可以测谎,在医学中可以了解病人的其情绪和心里状态,在智能家居中可以更加人性化的了解用户需求。

1.2语音识别的现状

语言是文明的载体,信息传递需要语言,因此,为了让计算机了解人类世界,语音情感识别成为重要的研究方向,让机器成为人是人类的梦想,我们期望机器能够拓展人类的能力,从而实现人类的梦想。有时候我们做不到的事情,总期望机器能够做到,所以语音智能事实上承载的是几千年来人类的伟大梦想,让机器听懂人类语言,这已经是最近技术和市场上非常潮流的事情,也是全世界科学家为之奋斗了几十年的事业。语音识别的历史可以说是相当悠久。最初,计算机能分辨不同类型的音调大家就已经不可思议。随着计算机技术的发展,从80年代到90年代再到现阶段,技术的迭代更新也越来越快。90年代,计算机能够实现存储大量的数据并进行较为复杂的处理。随着人们对语音的研究也逐渐深入,开始追求让计算机模仿人类的声音,从音调到音色,计算机在慢慢学习和了解人类声音所蕴藏的情感奥秘,科学家通过各种语音算法让计算机自主学习,慢慢从不同的音调和音色中了解人类声音中所包含的情感,通过训练和建模,逐渐建立起一套完整的语音系统,其中主要包含的就是情感语音识别以及声纹识别,通过对语音的处理,让计算机能将声音转化成数字,将情感拟合成特定的参数,然后对此做出分析,对不同的语音识别其中所夹带的情感。要想计算机能更好的了解语音情感,首先就要对语音进行训练,训练阶段我们会针对音库的数据以及对应的标注文本进行建模(包括基频的提取、特征提取,以及短时长提取等),训练成时长模型、基频模型、谱模型等。从而为后续的语音情感识别打下基础。

1.3语音情感识别中面临的挑战

1、单从一个语料的声音就已经能够准确地识别和表现出一个讲话人的情绪时,先对语音信号进行预处理,提取出一种情绪的特点和参数,其中包括基于声学的特点和参数:LPCC的基频和能量等多个方面的特点,另外还是我们可以从每一个说话的持续时间、振幅等参数入手来综合考虑每一个语音所需要表达的情绪。然而这些参数的提取都有一定的难度。需要实验者谨慎处理。

2、当我们认为需要从这些语料中准确得出被听说话者的内涵意思来准确判断被听说话人的具体语言表达情绪时,就可能会因此遇到很大的心理疑惑,这就可能会直接引起我们对于语料内涵意思的错误理解。对于这次测试的话在语料库的每个相关句子中它都会自动提取一个新的关键字,比如一个说话多的人没有任何带强烈的的感觉心理情绪的话,就可以说:这些日子天气真好,这主要目的是发出一种感慨,应为中性的感觉情绪,把这些平淡的话,做成一个说话模板,当其他几个说话多的人再次表示拥有此类的相关语句,且其话语音调正常时,表达的这种反映也应该是中性的感觉情绪。

剩余内容已隐藏,请支付后下载全文,论文总字数:23574字

您需要先支付 80元 才能查看全部内容!立即支付

企业微信

Copyright © 2010-2022 毕业论文网 站点地图