基于深度视觉的机器人插孔识别和测量研究开题报告
2021-12-02 13:05:12
1. 研究目的与意义(文献综述)
计算机视觉是一门研究如何使机器能看见的科学,就是指用相机和电脑代替人眼对目标进行识别、跟踪和测量等的机器视觉,并且对图像做进一步处理,处理成更适合人观察或给仪器检测的图像。换言之,计算机视觉是以图像或视频为输入,以对环境的表达和理解为目标,研究研究图像信息组织、物体和场景识别,进而对事件给予解释的学科。计算机视觉的发展有4个主要阶段:马尔计算视觉、主动和目的视觉、多视几何与分层三维重建和基于学习的视觉。
一、 计算机视觉的国内外发展状况
20世纪80年代初,马尔(david marr)的《视觉》(marr,1982)一书问世,标志着计算机觉成为了一门独立学科,马尔的计算视觉分为三个层次:计算理论、表达和算法以及算法的实现。计算理论需要明确视觉目的,或者说视觉的主要功能是什么,认为图像是物理空间在视网膜上的投影,所以图像信息蕴含了物理空间的内在信息,因此任何计算视觉计算理论和方法都应该从图像出发,充分挖掘图像所蕴含的对应物理空间的内在属性。马尔视觉计算理论的“物体表达”是指“物体坐标系下的三维形状表达”,要注意的是同一物体,选用的坐标系不同,表达方式亦不同。马尔将“观测者坐标系下的三维几何形状表达”称为“2.5维表达”,物体坐标系下的表达为“三维表达”。所以在后续的算法部分,马尔重点研究了如何从图像先计算“2.5维表达”,然后转化为“三维表达”的计算方法和过程,马尔认为,从图像到三维表达,要经过三个计算层次:首先从图像得到一些基元(primal sketch),然后通过立体视觉(stereopsis)等模块将基元提升到2.5维表达,最后提升到三维表达。
2. 研究的基本内容与方案
2.1基本内容及目标
本设计的目标是通过深度视觉识别出插孔,给机器人发送插孔的位置坐标。在系统中建立完机器人及视觉模型后,对相机进行标定,通过模式识别对插孔分类,并进行轮廓几何提取,实现对插孔的识别和几何位置测量。在这过程中,需要深入了解当前机器人视觉的技术和发展趋势,要熟悉相机标定、机器人标定、机器人于相机相对位置标定(手眼标定),尤其需要掌握基于机器视觉的插孔模式特征识别和轮廓几何特征提取。
设计主要内容有:
3. 研究计划与安排
第1-2周 广泛查阅文献,明确选题,撰写开题报告
第3-4周 修改完善开题报告,并完成英文文献翻译
第5-7周 学习所需的有关理论知识与软、硬件使用技能
4. 参考文献(12篇以上)
[1] 美. 伯特霍尔德·霍恩等 berthold klaus. 机器视觉[m]. 中国青年出版社, 2014.
[2] corke等 澳. peter. 机器人学、机器视觉与控制[m]. 电子工业出版社, 2016.
[3] 熊有伦等. 机器人学[m]. 华中科技大学出版社, 2018.