基于特征聚类的破损QR码定位技术研究文献综述
2020-04-23 19:56:23
1.1 研究目的及意义
现代社会,随着信息技术高速发展,人们接触到越来越多的媒介,从传统的纸质媒介,到丰富多彩的电子媒介。条形码技术作为一种新型的媒介,在出现之初就在人们生活中占据了重要的地位。早期的条形码技术是具有横向存储数据能力的一维条形码,主要作为数字传递的媒介,完整的应用需要借助网络和数据库为其提供支持,这种技术在一定程度上解决了工业和商业领域的部分问题,但其数据容量的局限仍然阻碍了它的普及。二维条形码技术在这种情况下应运而生,具有横向纵向双向存储能力的二维条形码,大大增加了数据容量,人们可以在不借助大量设备的情况下进行较多数据信息的传递,同时,数据容量的增加也加大了条形码编码范围,中文数据的编码也成为可能。近几年,随着智能手机的普及,人们更是可以通过手机下载软件,轻松实现二维条形码的解码,对二维条形码的普及也起到了极大的推动作用。在我国,二维条形码得到最大推广的主要是PDF417码(Portable Data File,便携数据文件)和QR码(Quick Response Code,快速响应矩阵码),而作为民用普及最广的是QR码。QR码在民用上的普及,使得许多研究人员的注意力转向了对QR码编码、定位及识别的进一步研究。
在实际应用中,由于受到外界条件干扰和工艺的限制,QR码不可避免会发生破损情况,这就可能会导致QR码特有的位置探测图形特征不能满足1:1:3:1:1,以致于难以使用现有的方法来进行定位,在现如今出门购物、吃饭、乘坐公交都需要用到二维码的情况下,这无疑会妨碍到我们的日常生活。因此,研究一种基于破损QR码的定位技术具有很强的现实意义。
不能直接运用定位标志,该如何定位QR码呢?这让我想到从QR码与图像其他部分的区别着手。显然,QR码图像特征与普通文本图像的图像特征之间还是有很大差异的。因此,我想到了利用特征聚类的方法来将QR码区域与普通文本区域分割开来,先对QR码进行初步定位。特征空间聚类法进行图像分割是将图像空间中的像素用对应的特征空间点表示,根据它们在特征空间的聚集对特征空间进行分割,然后将它们映射回原图像空间,得到分割结果。其中,K均值、模糊C均值聚类(FCM)算法是最常用的聚类算法。K均值算法先选K个初始类均值,然后将每个像素归入均值离它最近的类并计算新的类均值。迭代执行前面的步骤直到新旧类均值之差小于某一阈值。模糊C均值算法是在模糊数学基础上对K均值算法的推广,是通过最优化一个模糊目标函数实现聚类,它不像K均值聚类那样认为每个点只能属于某一类,而是赋予每个点一个对各类的隶属度,用隶属度更好地描述边缘像素亦此亦彼的特点,适合处理事物内在的不确定性。
特征聚类方法大致分割出QR码所在的位置,有效避免了破损(缺陷,划痕,油污等)情况对定位精度的影响。然后,再利用QR码的标志特征(定位标志)对破损QR码进行精确定位。利用这种先粗定位后细定位的策略,会对破损QR码的精准定位以及后续的识别有很大帮助。
1.2 国内外研究现状
上世纪80年代末,美国、日本等国家的企业、研究机构开始进行二维码的研究,1989年美国国际资料公司发明了Data Matrix,原名为Data Code;PDF417码为1991年留美华人王寅敬(音)博士发明并由讯宝(Symbol)公司制定完成;1992年美国知名的UPS(United Parcel Service)快递公司推出了UPS码,即Maxicode二维码的前身;1994年,日本Denso公司发明了QR码;2009年微软推出的一种新的二维码“Microsoft Tag”,增加了色彩维度,因此又称为彩色条码。二维码标准化的国外研究机构主要有国际自动识别制造商协会(AIMI)、美国标准化协会(ANSI)以及新成立的国际标准化组织/国际电工委员会第一联合委员会的条码自动识别技术委员会(ISO/IEC/JTCI/SC31),其中AIMI与ANSI已经完成了PDF417、QR Code、Code One、Code16K、Code49等码制的符号标准,条码自动识别技术委员会(ISO/IEC/JTCI/SC31)已经制定了包括QR码的国际标准ISO/IEC 18004:2006、PDF417码的国际标准ISO/IEC 15438:2006、Data Matrix的国际标准ISO/IEC 16022:2006等二维码的国际标准并且不断的完善。
我国对二维码的研究是从20世纪90年代初开始的,最初是由中国物品编码中心对几种常用的二维码PDF417、QR Code、Code One、Code16K、Code49的技术规范进行翻译和跟踪研究。2003年上海龙贝信息科技推出了龙贝二维矩阵,2005年中国编码中心完成了汉信码的研发,深圳矽感科技公司分别于2002年和2003年研发了具有自主知识产权的
CM二维码和GM二维码。国家质量监督局制定了相关的二维码国家标准,二维码网格矩阵码(SJ/T 11349-2006)和二维码紧密矩阵码(SJ/T 11350-2006)。
QR码是二维条码的一种,QR来自英文“Quick Response”的缩写,即快速反应的意思,源自发明者希望QR码可让其内容快速被解码。QR码比普通条码可储存更多资料,亦无需像普通条码般在扫描时需直线对准扫描器。QR码呈正方形,只有黑白两色。在4个角落的其中3个,印有较小,像“回”字的的正方图案。这3个是帮助解码软件定位的图案,使用者不需要对准,无论以任何角度扫描,资料仍可正确被读取。QR码最常见于日本,并为目前日本最流行的二维空间条码。