基于时频分析的乐音识别算法研究开题报告
2022-01-12 22:40:20
全文总字数:1932字
1. 研究目的与意义及国内外研究现状
近年来,随着多媒体技术的发展与进步以及互联网的不断普及,各类多媒体应用层出不穷,不断丰富了人们的日常生活与娱乐活动。其中音乐随着技术的提高不断深入人们生活的方方面面,特别是音乐识别类应用,满足了人们系别出未知音频的详细信息的需求,例如歌曲名字、歌手、作曲人等信息。
但是,由于网络环境和收音条件的包容性与复杂性,音频文件通常会经过压缩、编辑、删减等操作,导致音频文件出现失真或不完整等问题,除此之外,音频文件在传输过程中还可能产生噪音,则如何在各种环境下提高识别音频文件的鲁棒性和高效性成了音频指纹提取技术的一大难点。音频指纹技术通过提取音频信号的特征对音频进行识别操作,音频指纹是数字音频信号经过哈希函数压缩后的一种紧致表现,能够唯一地标识音频信号。因此本论文的目的就是为了研究指纹算法以及相应的匹配算法,提高指纹的精度,减小指纹数据库空间,使乐音识别适用于音频文件退化或者有一定噪声背景的环境。
国内外研究现状
音频指纹技术是一种通用的音频处理技术。音频指纹是数字音频信号经过哈希函数压缩后的一种紧致表现,较为客观的将音频文件中的声学特征,例如音高、音调、能量等信息转换成文本数据。目前,大部分指纹提取方案都是基于傅里叶系数、短时傅里叶变换、梅尔频率倒谱系数等基础音频特征提取操作,也有一些基于不同特征的指纹提取方法。这些算法使用的音频特征各不相同,适用的领域也各不相同,包括音频识别领域、音频版权保护领域等。当前国内外音频领域已经提出了很多的音频指纹算法,也有不少算法已经投入到实际应用当中,但很多技术并不够成熟,每种算法都有各自的缺点,仍处在不断的探索和研究过程中。因此,音频指纹算法需要进行更深入的研究。
2. 研究的基本内容
本文主要对现有音频指纹识别技术展开研究,并提出了新的指纹提取算法以及相应的匹配算法。
研究音乐信息检索中常用的时频变换与分析方法,总结哈希函数在音频识别领域的发展与应用,指出音频领域中的哈希函数与传统哈希函数的区别。研究现有的音频指纹提取算法中的常用手段,并对经典的音频指纹提取算法以及后期的改进进行分析。
3. 实施方案、进度安排及预期效果
!--[if !supportlists]--1、!--[endif]--查阅音乐信息检索额研究发展,以及乐音识别的技术进展;
!--[if !supportlists]--2、!--[endif]--总数在音乐信息检索中常用的时频分析方法,然后基于这种时频表示对音乐信号进行时域和频域的同步分析;
!--[if !supportlists]--3、!--[endif]--查阅现有的音频指纹提取算法并进行算法分析;
4. 参考文献
[1]. 魏泽峰,聂超,陶卿.基于傅里叶短时分析的敏感语音信号提取[j].微计算机信息,2007,02x.
[2]. 张贤达,保铮主编.非平稳信号分析与处理[m].北京:国防工业出版社,1998.9.
[3]. 倪养华,王重玮编著.数字信号处理:原理与实现[m].上海:上海交通大学出版社,1999.12(2002年重印)