基于OpenCV的人眼检测系统设计文献综述
2020-04-23 19:36:56
人眼检测与识别目前已经成为模式识别和计算机视觉领域中一项受到普遍重视且研究十分活跃的课题,已被广泛应用于公安刑侦、司法鉴定、访问控制、金融支付、医用应用、视觉监控、视频会议等众多领域。眼睛作为脸部区域最重要的特征,它的检测和定位,大大的提高人脸识别和检测的速度,还能够降低识别算法的复杂度。由于人眼的位置和间距相对于人脸来说是个相关常数,只要人眼被精准定位,那么根据双眼的对称性以及通过其他人脸与眼睛的潜在分布关系就能比较快速准确得到识别的人脸,进而提取其他的面部特征。
国内关于人眼识别定位的研究起步比较晚,始于上个世纪90年代。国内许多研究生和高等院校在人脸检测、人眼定位等技术方面投入很大的精力、财力,并取得良好的进展。 梁路宏提出的一种基于多个模板匹配的单个人脸检测方法。先使用双眼模板大概选定一些候选区域进行初步筛选,再采用不同长宽比的人脸模板进一步的检测定位,最后利用人脸器官的边缘特征进行验证。G.Yang提出一种在复杂背景中定位人脸的方法,即将人脸分成若干个低分辨率的马赛克块,利用脸部各子块的关系进行检测,将检测系统分为三个层次。第一层研究对象是低分辨率的图像,该层集中用来扫描图像看起来像什么,这些约束规则可以粗略定位后选人的人脸部区。第二层做图像处理工作,如对候选区完成边缘检测、进行局部直方图均衡化等。第三层输入的图像的分辨率最高,可以提供许多面部信息,经过第二层后依然存在的候选区中运用面部细节特征的规则,如对嘴、眼进行检查和验证,完整计算马赛克局部统计量,采用约定的模型规则最终确定人脸的位置。
近些年来,国内的学者对人眼的检测和定位研究也取得了很大的进展。杨彬等人采用红外光源主动检测技术来监测驾驶员的疲劳状况,人眼视网膜对于波长不同的红外线的反射量是不同的,依据人眼这一最基本的生理特征信息,对获取到的红外序列图像进行差分处理,就可以进一步在图像中精确定位眼睛。该方法定位准确性高、速度快、鲁棒性强,只是需要红外摄像头硬件支持,且对光照及摄像头与脸部的距离十分敏感。
以上列出的算法只是其中一部分,除了这些外,一些其他领域成熟方法也被应用到人眼定位识别,如基于地形特征的方法。将人脸看作为一个三维的地标,用地形表示面部特征时可以发现双眼区域会呈现一些本征特点。用对地表特征的地形分类器,对每一幅人脸图像都能产生一个用来提取人眼候选点的地形图,定义两个地表相似度自适应函数不断更新双眼的精确位置。这种方法很好的解决了复杂背景下的定位和面部姿态变化的问题,缺点是计算量过大,且对图像去噪要求很高。
国外对人脸识别技术的研究始于上世纪50年代。人脸技术进入自动机器识别阶段实在上世纪70年代。研究者们将人脸识别看作一个二维的模式识别问题,因而在那一时期,典型的识别技术大都是采用一些课测量的特征属性。到90年代,人脸识别潜在的商业价值逐渐被人们重视起来,并伴随着监控应用系统的重要性与日俱增和计算机实运算能力的增强,人脸识别和人眼定位技术的发展进入高峰期。
目前,国外对人眼检测问题的研究层出不穷,英国,美国等许多国家都有大量的研究小组从事人脸检测方面的研究,这些研究受到了军方、警方以及一些身份验证等公司的高度重视和支持。著名的研究机构有美国麻省理工大学(MIT)的Media lab、AI lab,卡内基梅隆大学(CMU)的Human Computer Interface Institute,Microsoft Research,英国的Department of Engineering in University of Cambridge,法国的INRA研究院,日本的ATR研究院等等。关于人脸检测的学术交流活动也相当活跃。在一些重要的国际会议上,如国际计算机视觉会议(ICCV)、计算机视觉与模式会议(CVPR)、计算机图形化大会(Computer Graphics Conference)都设有人眼检测的专题。
{title}2. 研究的基本内容与方案
{title}研究目标为运用摄像头实时读入包含人脸的视频流,利用OpenCV设计算法检测出人脸位置并在人脸区域进一步检测到人眼目标,并实现对视频流中人眼的跟踪。
按照研究目标需要设计一种人眼检测及定位的方法。该方法利用人眼的位置分布设置人眼的搜索区域,通过Adaboost(The Adaptive Boosting Algorithm)算法搜索先前设置好的区域,可以得到人眼所在的粗略位置,利用图像二值化和Canny算法提取图像轮廓,通过对提取的轮廓进行椭圆拟合即可得到人的眼球中心坐标。
此设计拟采用Adaboost算法对人脸进行检测。Adaboost算法是一种迭代算法,其主要原理为:首先,通过对训练集的训练,可以得到若干个弱分类器;然后,将弱分类器集合起来构成一个强分类器,并且该强分类器具有较强的分类能力;最后,通过将若干个强分类器级联得到级联分类器。该算法能够实现快速人脸定位。
选用Canny算子提取的边缘图像,因为在包含眼睛轮廓的前提下,其他边缘点比较少,本文选择眼镜区域边缘点较为丰富的Canny边缘算子进行边缘提取。