阵列语音采集系统开发设计开题报告
2022-12-04 10:26:28
1. 研究目的与意义
语言是人类特有的功能,声音是人类常用的工具,是相互传递信息的最主要的手段。现在,人类已开始进入了信息化时代,用现代手段研究语音处理技术,使人们能更加有效地产生、传输、存储、获取和应用语音信息,这对于促进社会的发展具有十分重要的意义。语音是人机交互的一个重要方式,而如何得到高质量的语音信号一直是一个值得深入研究的课题。麦克风是最常见的语音采集工具,但单个孤立的麦克风的使用要求说话人必须在物理上接近麦克风,以减少环境噪声的影响,这种使用方式限制了人的活动,十分不便。为提高语音质量,解脱人们手持、或佩戴麦克风的束缚,基于麦克风阵列的语音处理技术逐渐成为一个新的研究热点。麦克风阵列是利用多个麦克风排列成的一定形状的阵列,用阵列信号处理的方法,确定声源的位置、进而定向采音,提高信噪比,以获得高质量的语音信号,实现说话人方向的实时跟踪,相当于在一定范围内为每个人生成了一个虚拟的麦克风。随着计算机的广泛应用和微电子学科的高速发展,数字系统已被广泛地应用于国民经济、国防建设和科学试验的各个领域。与模拟系统相比,数字系统有着精度高、稳定性好等一系列优点,但是数字系统却存在着只能处理离散的数字信号这样一个问题。外部环境下的各种被检测量,如声音等,通过相应的各种类型的感器转换成便于进一步处理的物理量(一般为电压、电流或电脉冲等信号),除了一部分传感器可以将外部环境下的被检测量直接转换为数字信号或开关信号,绝大部分传感器输出的仍是电压或电流等模拟信号,所以往往需要将这些模拟信号转换为便于处理和存储的数字信号,这就需要一块数据采集卡来完成这项工作。而在数据采集系统中,利用PC机作为数据采集平台,通过PC机的数据总线将采集的数据高速的传输到PC机内存中,是实现采集系统数据存储的有效处理手段。声音信号的采集与分析处理在工程中是经常需要解决的问题,如何实时采集声音信号并对其分析处理,找出声音信号的特征在科学研究中是一项非常有意义的工作。声音数据采集系统是指将特定的声音信号真实的记录,以供人们进行进一步分析的电子系统。语音信号的采集和传输在语音通信等领域有着广泛的应用,在很多场合下需要对声源进行声音信号的采集、传输和分析。其中为了达到实用的程度,麦克风阵列语音数据采集系统必须具备各通道间同步实时采集、信噪比高、扩展性好等特点。基于麦克风阵列的语音处理技术,在时域和频域的基础上增加了空域处理,可以有效的滤除空间噪声,利用时延估计来对声源做定位。
国外主要将语音阵列技术用于语音获取、语音识别、声源定位等方向。1985年Flanagan将麦克风阵列引入到大型会议的语音增强中,并开发出很多实际产品。1987年Silverman将麦克风阵列引入到语音识别系统,1992年又将阵列信号处理用于移动环境下的语音获取,后来将其应用于说话人识别。1995年Flanagan在混响环境下用阵列信号处理对声音进行捕获。1996年Silverman和Brandstein开始将其应用于声源定位中,用于确定和实时跟踪说话人的位置。尤其在声源定位这一领域,国外的研究确实比我们先走一步:日本的F A sano等人提出了一种基于空间的近场声源定位算法,该算法用于办公室智能机器人系统中,基本上能够实现三维空间近场声源定位问题,但是距离分辨率和准确性均较低。美国的Joe C、Chen等人提出了用极大似然估计算法来实现声源定位,该算法可以对近场和远场的声源进行定位,在单声源系统中定位性能较好,但是对于多声源系统运算量较大,性能较低。基于时延的定位方法在导航系统、声纳系统等领域都有广泛的应用。该方法主要估计各麦克风之间的相对时延,但是这类算法一般只用于单声源定位系统。日本的Futoshi ASANO和 Hideki ASOH等人把传统的MUSIC算法用到了声源定位系统中,提出了基于麦克风阵列的近场一维MUSIC算法,该算法实现了声源的水平角和声源麦克风阵列之间的距离的估计。近年来,音/视频通信/会议系统发展很快,Polycom, Lifesize等公司推出了基于麦克风阵列的音/视频会议产品。其中Lifesize公司的Lifesize Phone采用16个麦克风组成均匀圆环麦克风阵列,16KHz采样,集成VoIP, PSTN等通信模块。国内主要将语音阵列技术用在视频监控等方向。如中国兵器工业集团、海康威视公司等都有相关产品的研发。而在声探测和识别方面相对于国外较为落后,到目前为止还没有自主产权的麦克风阵列产品。因此,研究我国自主的基于麦克风阵列的声音数据采集具有重要的意义。
2. 研究内容与预期目标
研究内容:设计一套阵列语音采集系统,要求制作pcb,完成硬件电路设计、加工、制作及软件编程。此系统为基于stm32的5通道语音采集系统,通过5个麦克风采集语音信号,再经过放大电路放大微弱的语音信号,然后通过a/d转换将放大的语音模拟信号转换为数字信号,最后通过串口发送到pc机,即实现了语音信号的采集和存储。使用matlab对采集的语音数据进行后续的消噪、分离和处理,获得高质量的语音信号。
预期目标:本设计要求在理解语音信号处理的理论及应用的基础上,设计出一套能检测完成阵列语音信号分析与处理的系统。
1、完成一套阵列语音信号分析与处理系统;
3. 研究方法与步骤
本课题要求熟练stm32单片机编程,熟悉掌握信号与系统、数字信号处理的基本理论,了解语音信号处理和盲信号处理的方法,能使用matlab软件将算法实现。
1、准备阶段:学习课题相关资料,学习相关学科的基础知识,学习实验所需软硬件的相关知识。
2、用altium designer设计阵列语音采集系统的电路原理图;
4. 参考文献
1]宫正.基于mems麦克风阵列的四通道语音采集系统设计[j].电子技术与软件工程,2014,(24):133-134.[2]陈立春.实时语音采集系统中语音端点检测和增强方法[j].电声技术,2013,(05):42-44 53.
[3]吴立锋,田莎莎.基于单片机的语音采集系统设计与实现[j].电脑知识与技术,2012,(17):4235-4238.
[4]邵富杰,张国利,周勇.基于i2s总线实现嵌入式语音采集与回放[j].微计算机信息,2011,(06):72-74.
5. 工作计划
2022年1月5日-2022年3月1日,有针对性的学习课题相关资料,学习相关学科的基础知识,学习实验所需软硬件的相关知识。
2022年3月2日-2022年3月20日,设定实验方案,采集实验数据。
2022年3月21日-2022年4月25日,进一步理论分析,进行实验,开发相关软硬件系统。