登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 文献综述 > 电子信息类 > 通信工程 > 正文

基于无序图像集的运动恢复结构研究与实现文献综述

 2020-04-14 19:50:43  

1.目的及意义

人眼通过接收外界可见光,经人脑中枢有关部分进行加工处理后获得外界环境的信息,称为视觉信息,占总获取总信息的七成。眼睛是人类认识和理解世界的主要器官。在计算机科学领域,人们尝试使用相机、手机等图像获取设备获得场景图像,然后通过计算机将图像场景还原,由此形成了一门新的学科——计算机视觉。随着时代的发展,各行各业的信息化程度在逐步提高,使用三维模型展示目标对象或场景结构的需求越来越大,如何逼真、简洁的通过计算机重建三维模型成为计算机视觉的研究方向之一。上世纪80年代以来,应用激光扫描技术对场景扫描,采集场景的点云信息并重建三维模型的方法得到广泛应用,但三维扫描设备成本高昂,采集范围不大,不能满足大场景三维重建的需求。随着计算机视觉技术的发展,从二维图像的像素信息中提取相关几何信息的研究不断发展,基于多视图的三维重建方法为三维重建提供了新途径。

运动恢复结构(SfM)是一种从一组2D图像估计场景的3D结构的过程。人类通过它来感知有关环境中三维结构的大量信息,当观察者移动或者观察者周围的物体移动时,从随时间感测的图像获得立体信息。可靠的运动恢复结构算法在地球科学、文化遗产保护、机器人视觉导航、地图生成、航空勘测、目标识别以及计算机图形学中的虚拟现实等领域都有很好的应用价值。

SfM是重建的第一步,以图像集合作为输入,经过一系列估计算法,输出场景结构(即三维点云)和相机轨迹(即相机位姿的集合)。SfM主要的方法有两种:增量式重建和全局式重建。增量式重建精度高、重建方法具有很好的健壮性,但是有三个缺陷:其一,重建结果依赖于初始图像对的选取;其二,需要不断对场景中大量的参数进行迭代,重建速度较慢;其三,误差会随着图像的增加不断累积,累计到一定程度会出现场景漂移,也就是如果场景本身是闭环的话,重建结果因为累积的误差无法闭环。全局式重建将增量式重建中出现的误差或者互相抵消,或者均分到整个场景,可以有效避免无法闭环的问题。同时,由于全局式重建没有初始图像对的依赖问题,而且只需要迭代优化少量的几次就能收敛,所以速度较快。但是,全局式重建本身的方法导致了它的优点也是它的缺点,由于误差均分和迭代次数少导致精度不高,而精度无法通过简单的增加迭代次数就能提升。2017年提出的混合式SfM(Hybird SfM,HSfM)结合了增量式重建和全局式重建的优点,并克服了它们的缺点,取得了很好的重建效果。

{title}

2. 研究的基本内容与方案

{title}



人类通过四处移动来感知环境中三维结构的大量信息。当观察者移动并且观察者周围的物体移动时,从随时间感测的图像获得信息。

从运动中寻找结构提出了从立体视觉中寻找结构的类似问题。在这两种情况下,都需要找到图像与3D对象重建之间的对应关系。

为了找到图像之间的对应关系,从一个图像到下一个图像跟踪诸如角点(具有多个方向上的梯度的边缘)的特征。最广泛使用的特征检测器之一是尺度不变特征变换(SIFT)。它使用来自高斯差异(DOG)金字塔的最大值作为特征。 SIFT的第一步是找到显性梯度方向。为了使其旋转不变,旋转描述符以适应此方向。追踪从一个图像到另一个图像的特征的匹配算法之一是Lukas-Kanade跟踪器。

有时,某些匹配的功能不正确匹配。这就是为什么匹配也应该被过滤。 RANSAC(随机样本共识)是通常用于去除异常值对应关系的算法。RANSAC用于解决位置确定问题(LDP),其目标是确定投影到图像上的空间点到具有已知位置的一组地标。

然后使用随时间变化的特征轨迹来重建它们的3D位置和相机的运动。通过所谓的直接方法给出替代方案,其中直接从图像估计几何信息(3D结构和相机运动),而没有中间抽象到特征或角落。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

企业微信

Copyright © 2010-2022 毕业论文网 站点地图