基于机器视觉的3D物体识别与定位开题报告
2020-03-18 16:50:55
1. 研究目的与意义(文献综述)
1.1 研究目的及意义
近年来,机器视觉以其非接触式、较宽的光谱响应范围、定位、测量和缺陷检测的优势,在军事目标识别、人脸识别、指纹识别、发票号码识别、农作物质量检测和医学图像检测等领域得到了广泛的应用。在自动化拆卸中,机器视觉是自动获取零部件特征信息和特征参数的一种较为可行的技术方案,对于一些高要求、高负荷的重复性和智能性的工作,比如细微缺陷检测和零部件测量,人眼很难持续、稳定地完成,机器视觉可以高效、高质量地完成检测任务。
目前基于二维rgb图像的3d目标识别主要面临的问题有:1)容易收到光照等外界条件的影响;2)图像在投影过程中,丢失了实际场景的三维结构信息,导致无法提取表征3d物体本质属性的特征;3)难以解决类内差异和类间相似的3d目标识别问题,目标识别精度不高。近年来,人们研究发现depth信息不仅能够表征物体的3d几何特性,而且不受光照、物体表面颜色、物体形态变化等的影响,能够提供比二维rgb图像更加可靠的识别信息。微软公司2010年推出的kinect相机价格适中,并能够同时获取物体的高分辨率rgb图像和低分辨率depth图像,使得利用kinect相机获取的depth信息来解决3d目标识别问题称为一个新的研究热点。
2. 研究的基本内容与方案
本文主要研究内容是针对单独利用rgb信息和深度信息进行目标识别存在的局限性以及目标间存在类内差异、类间相似等不确定性问题,结合rgb图像和深度图像的特点,在特征层上,实现一种基于多核学习的雜合rgb特征和深度特征的3d目标识别方法,通过在rgb-d数据集上进行多组实验,验证所研究方法在特征层上可以较好地实现rgb特征和深度特征的融合,有效解决样本类内差异、类间相似的识别问题,提高3d目标识别的识别率。
本研究基于python-opencv平台,拟结合rgb图像和depth图像各自的优势,提取目标物体的rgb特征和depth特征,并根据两种特征的类内、类间相似性均值和方差,为特征自适应分配不同的权重,最后利用多核学习(mkl)中的方法对特征进行加权融合,并结合svm分类器,实现3d目标识别,并在rgb-d数据集上进行实验,验证目标识别方法的有效性。其中在特征提取时需要选择具有仿射不变性的特征作为rgb图像和深度图像的特征描述子,利用类内、类间相似性均值和相似性方差的比值作为衡量特征判别能力大小的权重,从而将对两种特征的融合转换为对其相应的特征核的融合,从而形成对3d物体的识别方法。
3. 研究计划与安排
第1-3周:查阅相关文献资料,明确研究内容,了解研究所需理论基础。确定方案,完成开题报告。
第4-5周:熟悉掌握基本理论,完成英文资料的翻译,熟悉开发环境。
第6-9周:编程实现各算法,并进行仿真调试。
4. 参考文献(12篇以上)
[1]杨慧,胡良梅,张旭东,陈仲海,董文菁.一种基于d-s证据理论的融合rgb特征和depth特征的3d目标识别方法[j].计算机应用与软件,2016,33(07):162-166.
[2]杨慧. 融合rgb特征和depth特征的3d目标识别方法研究[d].合肥工业大学,2015. [3] 李辉.混沌数字通信[m].北京:清华大学出版社,2006
[3]肖楚珍. 基于d-s证据理论的信息融合方法研究及军事应用[d].中南大学,2012.