基于立体视觉的物体快速定位算法文献综述
2020-06-09 22:37:04
一、课题研究背景及意义
本课题的研究意义
双目立体视觉是一种由多幅图像获取物体三维几何信息的方法。现阶段双目视觉技术的研究目的主要是三维重建(环境建模),即使计算机具有通过二维图像认知三维物体信息的能力,而这种能力不仅仅是使机器能感知三维环境中的物体几何信息(包括它的形状、位置、姿态、运动等),而且能对它们进行描述、存储、识别与理解。双目视觉系统的研究涉及到机构设计、摄像机标定、主动视觉、视觉伺服、视觉信息处理模型,模式识别等内容。
立体视觉是计算机视觉中的一个重要分支,一直是计算机视觉研究的重点和热点之一,是获取三维信息最重要的途径之一。在 20 多年的发展过程中,逐渐形成了自己的方法和理论。获取空间三维场景的距离信息是计算机视觉研究中最基础的内容。目前,获取目标信息的方法和技术很多,学术思想非常活跃,新技术、新方法不断涌现。立体视觉是计算机被动测量方法中最重要的感知技术,它直接模拟了人类视觉处理景物的方式,可以在多种条件下灵活地测量景物的立体信息,其作用是其它计算机视觉方法所不能取代的,对它的研究,无论是从视觉生理的角度还是在工程应用中都具有十分重要的意义。应用立体视觉进行导航的自主机器人车利用多个(一般两个)摄像机获得场景的二维图像信息,通过立体视觉算法,确定自主机器人车所在位置的三维路况信息,从而起到导航作用。双目立体视觉技术是人工智能的研究课题,利用立体视觉技术建立专家系统有广阔发展前景。
二、国内外发展现状
由于计算机技术、超大规模集成电路技术、人工智能技术以及知识工程等学科的飞跃发展,另一方面由于民用和军事工业生产的急需,使得上述学科的技术成果有了在机器人智能化研究领域得到实现的可能。世界各国都很重视智能机器人视觉系统的研究工作,并且投入了大量的人力和物力。
2.1国外发展现状
美国Carnegie-Mellon大学研制的NAVLAB自主车(Autonomous Vehicle),它采用了多传感器信息处理和理解系统,系统包括声纳、激光测距、双彩色摄像机平台及目标识别与跟踪摄像机等多种传感器。 美国斯坦福研究所(StanfordR esearchI nstitute)早期研制的机器人Shakey(沙克依),它是一种典型的”眼一车”系统。Shakey的主要感觉器官是”眼”,也就是它的视觉系统,安装可动头部的摄像机和光学测距器。Shakey的主要功能是在视野范围内识别对象,依靠积累的经验求解行动规划,以及对识别出的目标物体进行跟踪。
日本大阪大学自适应机械系统研究院研制了一种自适应双目视觉伺服系统,利用双目立体视觉的原理,如每幅图像中相对静止的三个标志为参考,实时计算目标图像的雅可比短阵,从而预测出目标下一步运动方向,实现了对运动方式未知的目标的自适应跟踪。该系统仅要求两幅图像中都有静止的参考标志,无需摄像机参数。而传统的视觉跟踪伺服系统需事先知道摄像机的运动、光学等参数和目标的运动方式。
日本奈良科技大学信息科学学院提出了一种基于双目立体视觉的增强现实系统(AR)注册方法,通过动态修正特征点的位置提高注册精度。该系统将单摄像机注册(MR)与立体视觉注册(SR)相结合,利用MR和三个标志点算出特征点在每个图像上的二维坐标和误差,利用SR和图像对计算出特征点的三维位置总误差,反复修正特征点在图像对上的二维坐标,直至三维总误差小于某个阈值。该方法比仅使用MR或SR方法大大提高了AR系统注册深度和精度。