基于空间金字塔稀疏编码的图像分类算法开题报告
2021-12-12 18:32:52
1. 研究目的与意义及国内外研究现状
在互联网高速发展的二十一世纪,多媒体技术如数码相机、智能手机等应用在慢慢影响着人类生活的方方面面,智能化的时代显然已悄然进入了我们的生活。计算机技术、数据库技术和数字图像处理技术的不断发展,使得当今数字网络中每天都出现大量的数字资源。这些资源在人们的生活、学习和工作等各方面都起到了重要的作用,在这些数字资源中,数字图像作为一种重要的视觉信息载体,对信息内容的描述更准确直观,它所扮演的角色也不断被人们所重视。但不可否认的是,丰富的数字资源也给人们带来了很大的不便,面对如此海量的图像数据,要快速又准确地从数字图像库如人物图像、景色图像、建筑图像等图片中寻找到自己感兴趣的图片变得非常困难。 对大规模图像库中的图像进行合理分门别类,可以提高图像库的访问效率,继而为用户提供方便快捷的浏览、检索、存储等功能。最初,人们识别一副图像总是先找到图像之间的外部形状或颜色等一些特征来进行对比分析,然后再分门别类来最终识别这些图像。然而仅靠人工进行大规模的图像分类已经被慢慢淘汰。计算机对图片进行分类相对于人工分类有很多独特优势。比如,计算机通过固定的特性对图片进行分类,因此不会出现二义性;计算机处理和反应速度比人脑要迅速的多,可以节约事假提高效率;计算机不会和人一样在长时间工作后出现疲劳的现象,所以工作时间长,并且不会出现因疲劳操作不当而导致的分类错误;计算机运行成本相对于人力成本来说低廉的多,节约实验成本。
国内外研究现状
图像分类于 20 世纪 60 年代开始兴起,80 年代后开始受到众多领域的重视,各类理论和算法层出不穷。图像分类的处理过程主要为:首先建立图像目标的描述,然后通过机器学习的方法学习得到目标模型,最后利用得到的目标模型对待测图像目标进行分类识别。图像分类技术也受到了国内外许多著名大学和研究机构的关注,如国内的中国科学院计算机研究所、北京大学计算机研究所、浙江大学图像技术研究与应用(ITRA)团队、清华大学智能图文信息处理实验室、中国科学技术大学等;国外的南加州大学的计算机视觉研究所、普林斯顿大学的计算机系、斯坦福大学、卡内基梅隆大学、美国 Massachusetts 视觉实验室等,至今为止已产生大量的研究文献和方法。目前的图像分类算法仍具有一些不足,还需要通过不断地研究对算法进行完善。
2. 研究的基本内容
本文主要研究的是大量图片的类别分类问题,工作的重点是基于空间金字塔模型稀疏编码进行图像的分类。本文将从基础理论和实验分析方面对基于空间金字塔稀疏编码的图像分类技术进行一些研究。本课题研究在收集和分析了近年来国内外关于图像分类的学术论文及研究报告的基础上,对基于scspm的图像分类算法进行了深入研究。本文主要研究内容如下:
1.分析图像分类技术出现的原因并且了解当今国内外对图像分类的研究现状。
2.了解基于空间金字塔稀疏编码的图像分类算法流程与具体实现方法。
3. 实施方案、进度安排及预期效果
实行方案:
4. 参考文献
[1] s. lazebnik, c. schmid, and j. ponce. beyond bags of features:spatial pyramid matching for recognizing natural scene categories. in cvpr, 2006.
[2] a.bosch,a.zisserman,andx.munoz. imageclassication using random forests and ferns. in iccv, 2007.
[3] t. serre, l. wolf, and t. poggio. object recognition with features inspired by visual cortex. in cvpr, 2005.