用于快速几何采集的开源结构光扫描系统外文翻译资料
2022-12-31 12:47:23
arXiv:1406.6595v1 [cs.CV] 2014年6月25日
3DUNDERWORLD-SLS:用于快速几何采集的开源结构光扫描系统
基里亚科斯(Kyriakos)Herakleous和Charalambos Poullis1
塞浦路斯科技大学沉浸式创意技术实验室
2014年6月26日
摘 要
近来,代表现实生活对象的虚拟3D对象的需求增加了。已经提出了许多方法和系统来获取现实生活中的物体的几何形状,其范围包括采用主动传感器技术,被动传感器技术或各种技术组合的物体。
在本文中,我们介绍了一种基于结构化光原理的3D扫描系统的开发,而对专用设备没有特殊要求。我们讨论结构化光扫描技术的内在细节和内在困难,并提出我们的解决方案。最后,我们介绍实现所提出技术的开源扫描系统“ 3DUNDERWORLD-SLS”。我们已经对各种模型进行了广泛的测试,并报告了结果。此外,我们对系统进行了全面评估,并与高端商用3D扫描仪进行了比较。
0.1引言
近年来,对3D模型,尤其是表示/复制现实世界对象的3D模型的需求不断增长。在许多可用的技术中([21], [4])([1],[7]), 结构光扫描(SLS)([8]) 系统已成为捕获3D几何图形和真实对象外观的最经济高效且最准确的方法。
SLS系统采用有源传感器(例如投影仪和激光发射器)来投射已知结构(图案)的光。扫描过程包括在从一个或多个摄像机捕获场景的同时,将一系列这些已知图案投影到被扫描的对象上。投影的图案会根据被扫描物体的几何形状而变形。然后可以通过识别由一个或多个摄像机捕获的图像中的像素之间的对应关系来计算对象的几何形状。为了能够识别这些像素对应关系,对投影图案进行编码,使得可以在由照相机捕获的图像中唯一地标识投影图案中的每个像素。这提供了在相机捕获的图像之间映射对应像素的有效且非常准确的方法。最终,使用相应图像像素之间的这种映射,可以计算其准确的3D位置。
已经提出了SLS系统的许多变体,每个变体都是针对特定任务而定制的。尽管SLS系统背后的理论已有很好的文献记载和理解,但是在开发或使用SLS系统时仍然需要考虑许多问题,而目前尚缺乏文档。在本文中,我们提出了与SLS系统的设计,开发和应用相关的所有固有细节,局限性和解决方案。此外,我们介绍了开源scannins系统“ 3DUNDERWORLD-SLS”,并提供了广泛测试的结果。
本文的组织如下:0.2 简要概述了3D扫描领域的最新技术,以及0.3 概述了扫描系统。本节介绍了模式编码的不同方案。
0.4 摄像机的校准在第0.5. 部分0.6 描述数据获取。所捕获的图像按照本节中的说明进行解码0.7 并按第15节所述计算重建点0.8. 部分0.9 描述了如何最终将点转换为网格。在节中0.10 我们报告了广泛测试的结果,并在0.11 我们提供扫描系统的综合评估。
相关工作
在扫描领域,尤其是结构化光扫描领域,已经做了大量的工作。下面我们简要概述了以下领域的最新技术
扫描系统:
微软的Kinect[22] 目前正在吸引该地区研究人员的注意力。该设备采用红外摄像头和图案投影仪系统来实现3D视觉,以便识别场景中的人物。已经提议将该设备用于快速3D几何采集的许多用途,甚至用于全身扫描。[5] [24] 用于3D化身和3D人体动画的目的。
还可以将该设备与其他技术结合使用以获得更高分辨率的结果,例如在[23] 将传统的立体声匹配与Kinect的信息集成在一起,从而充分利用了两者的优势。在[6] 提出了一种用于密集3D点云计算的多摄像机系统。该系统使用5个摄像机和Kinect设备。在这种情况下,Kinect设备不是直接用于3D采集,而是用作IR投影仪在场景中嵌入特征的光源,该场景中4个红外敏感摄像机正在观察,而第5个用于运动定位。同样,在[20] 提出了一种基于相机闪光灯的投影仪,用于立体相机系统(带有两个相机),以改善立体声匹配。
如今,由于计算系统的改进,真实场景的3D几何形状[15] [16] [18] [14] 或对象[19] [17] 可以找到虚拟和增强现实应用程序的用途,甚至可以用于家庭应用程序。Kinect融合[10] 是一个允许通过移动的Kinect设备进行3D重建的系统,此外,它还可以用于基于其重建的几何体来增强真实场景。
在[11] 作者提出了一种系统,该系统使用户能够使用照相机,投影仪和红外笔与现实世界中的表面粒子进行交互。所提出的系统采用SLS 3D扫描技术,以便重建场景的3D几何形状,以便用投影仪适当地增加表面粒子。在[3] 讨论了将考古发现数字化用于开发综合虚拟展览的问题。
系统总览
数字1 显示系统概述。首先,给定投影仪的分辨率作为输入,对一系列图案进行编码。本节介绍了两种最有效的编码此类信息的方法0.4. 其次,对相机-投影仪系统进行几何校准,并按照本节中的描述计算内在和外在参数。0.5. 第三,将图案序列投影到对象上,并由相机针对序列中的每个图案捕获图像,如本节所述。0.6. 最后,对捕获的图像进行解码,以便得出摄像机捕获的图像之间的像素到像素映射,如本节所述。0.7 然后使用三角剖分法重建对象的点云,如本节所述0.8.
时域编码
该过程的第一步是将信息编码为时域中的模式。这涉及编码模式的生成,在投影时
按顺序在被扫描物体上,它们可以对投影机的每个像素进行唯一标识。为了实现这一点,在时域中进行信息的编码,即,编码是时间的函数,并且序列中的所有编码模式都是必需的,以便唯一地标识每个像素。
存在几种用于将信息编码为模式序列的方案,最流行的是在时域中执行的二进制码和格雷码编码。在两种情况下,有关两个图像轴X,Y的信息都分别编码为不同的图案。分辨率为Presx,Prexy的投影仪P将产生代表列的Ncols= log2(Presx)编码模式,并且Nrows=log2(Presy)表示行的编码模式。例如,
分辨率为1024x768的投影仪将导致Ncols= 10和Nrows = 10,即总共20个图案。
二进制编码
在二进制编码中,对应于每列ci的十进制数字D词其中索引iisin;Presx转换为其二
k
序列,如果其值为0,则为黑色;如果其值为1,则为白色。请注意,
二进制形式Bci的长度等于模式数Ncols。类似地,对每行rj重复此过程,其中jisin;Presy。
图中显示了该过程的一个示例2 其中位置(209、660)处单个像素p的二进制形式在时域中被编码为两个1x1模式序列;一个序列代表列,另一序列代表行信息。列序列代表列十进制数的二进制形式,即Bcp= 1000101100,行序列代表列十进制数的二进制形式,即Brp=0010100101。可以看出,每个模式对应于二进制模式中的一位,用黑色或白色表示。
b
图2:将位置(209、660)处的单个像素p的编码在时域中编码为两个1x1模式序列;一个序列代表列,另一序列代表行信息。
通过对投影仪中xisin;resx,yisin;resy的每个像素p(x,y)重复执行该过程,将生成两个2D
图案序列,分别代表所有列和所有行。数字3 显示了最终的示例
列和行的顺序。模式按时间箭头所示的投影顺序显示,即要投影的第一个模式对应于最高有效位,并在图中显示为最后一个,然后是其余。随着时间的流逝,码型的频率不断增加,直到达到代表二进制码型中最低有效位的最高频率为止。
结果是二进制编码模式的序列,其中每个模式代表二进制序列的一位。在列的情况下产生包含垂直条纹的图像,在行的情况下产生包含水平条纹的图像。
图3:在时域中将信息编码为一系列模式。
格雷码编码
格雷码编码的工作方式与前面描述的二进制编码类似,但是它可以确保连续模式之间只有一位不同。数字4 显示了8x8区域的列的格雷编码和二进制编码之间的比较。显然,在格雷码的情况下,在任何两个连续的值编码之间最大有一位差。数字6b 显示了使用格雷码的一系列编码模式,对应于图8中相同的8x8区域6a.
十进制值 |
格雷码 |
二进制代码 |
0 |
000 |
000 |
1 |
001 |
001 |
2 |
011 |
010 |
3 |
010 |
011 |
4 |
110 |
100 |
5 |
111 |
101 |
6 |
101 |
110 |
7 |
100 |
111 |
图4:格雷码和二进制码之间的比较。在格雷码的情况下,任何两个连续编码之间只有一位的差异。
可以通过首先计算数字的二进制表示形式,然后按以下方式转换来计算格雷码:按原样复制最高有效位,然后对其余位(一次取一位),用a的结果替换当前位与前一位的异或运算以二进制形式具有较高的重要性。一个
示例如图所示5a 计算十进制数字93的格雷码。
-
-
-
- (b)
-
-
图5:(a)十进制数字93的编码。代表十进制数字93的二进制代码被转换为格雷代码。(b)将格雷码转换为二进制码。
同样,格雷码到相应的二进制码的转换如下
剩余内容已隐藏,支付完成后下载完整资料
英语原文共 29 页,剩余内容已隐藏,支付完成后下载完整资料
资料编号:[273827],资料为PDF文档或Word文档,PDF文档可免费转换为Word