渐增式在线网格构建算法研究开题报告
2020-04-12 08:47:03
1. 研究目的与意义(文献综述)
视觉是人类获取外界信息的最主要方式[1],让计算机和人一样能感受三维环境信息是计算机视觉领域的最高目标之一。三维重建的研究目标是使计算机具有通过二维图像认知三维环境信息的能力,使机器感知三维环境中物体/场景的几何信息以及运动和位置信息[2],三维重建技术是构建客观世界的虚拟现实的关键技术。在过去的几十年中,三维重建技术不断发展,从最初的基于离散图片序列的三维重建[3][4][5],到伴随着深度相机的运用而发展的基于rgb-d数据的三维重建。而随着slam系统以及基于cuda框架的gpu并行计算的出现,使得实时三维重建成为可能。三位重建可广泛应用于人机交互[6],无人驾驶、机器人技术、虚拟城市、遥感测绘等高科技领域。
目前常用的三维重建的方法主要有基于深度相机以及基于图像,深度相机获取的深度图像数据大大降低三维重建的难度,但是其受到距离的限制,比较适合室内场景的构建。基于多视图的三维重建首先对摄像机进行标定,然后利用图像中的二维信息计算出目标物体/场景的三维信息,但是目前几乎所有的基于多视图的三维重建方法速度有待提高,其更适合离线重建,并且从视频中增量实时三维重建的工作较少。实时重建一般包括两步,第一步,对于每个新的视频帧增量计算摄像机的摄像机矩阵和相机中心,获取该帧上的特征点;第二步根据特征点计算3d模型。第一步中,slam或ptam系统可以很好的获取结果。
针对第二步的模型重建,有学者提出采用合并部分几何来进行增量模型重建,merrell等人和pollefeys等人提出一种实时重建的方法[7][8],该方法主要是将快速和含噪声的深度图融合到一个自由空间一致的网格中。但是他们借用了一种摄像机校准的惯性导航系统以及强大的cpu和gpu,对硬件的要比较高,而本文只需要用到笔记本电脑的cpu。hilton提出一种在有效时间内从稀疏特征逐步构建3d模型的方法[9],该方法主要是在每个视图上运行2d的delaunay剖分算法,并将其反投影以及合并到自由空间一致网格中。但hilton的方法只考虑到关键帧的增加,具有一定的局限性,而本文除了考虑关键帧的增加还考虑到异常值删除、几何优化等,因此本文提出的方法相比于hilton的方法更具有动态性,可以与slam或类slam系统集成。
2. 研究的基本内容与方案
基本内容:
1)利用现有技术对输入图像进行特征标定、立体匹配、三维重建,得到目标物体的三维稀疏点云。
2)通过阅读文献,了解三维重建中网格构建的各个过程。研究现有网格构建方法,同时分析比较当前网格构建算法的速度与精确度,以及其适用范围。
3. 研究计划与安排
第一阶段(第1周—第3周):查阅有关的参考资料并完成开题报告;翻译英文资料(不少于5000汉字),并交予指导教师检查。
第二阶段(第4周—第9周):熟悉所选用的算法,运用所学的数学以及计算机理论知识,完成算法的实现,提出改进方案。
第三阶段(第10周—第13周):实现算法的改进,在公共数据集上测试算法性能,完成与已有的同类算法的比较实验,对算法的结果进行分析。
4. 参考文献(12篇以上)
[1]scharstein d, szeliski r. a taxonomy andevaluation of dense two-frame stereo correspondence algorithms. internationaljournal of computer vision, 2002, 47(1-3): 7-42.
[2]seitz s m, curless b, diebel j, et al. acomparison and evaluation of multi-view stereo reconstruction algorithms.cvpr,2006 ieee computer society conference on. ieee, 2006, 1: 519-528.
[3]strecha c, von hansen w, van gool l, et al. onbenchmarking camera calibration and multi-view stereo for high resolutionimagery. cvpr 2008. ieee conference on. ieee, 2008: 1-8.