卷烟32位防伪码识别系统毕业论文
2020-02-17 23:24:09
摘 要
为了缓解人工识别卷烟防伪码繁琐的工作量以及可能造成的较大误差,实现相关工作智能化、高效化发展,对抽样的卷烟防伪码采取图像识别的新识别方法,识别过程中运用到的相关步骤包括彩色图像灰度化、二值化处理,图像区域切割和模板匹配等,其中降噪就有包括平滑处理、高斯滤波、中值滤波和双边滤波四种方法,字符切割则是用投影法实现单字符的分离,最后提出来的是基于字符结构特征的模式识别,能够实现字符快速有效获取和识别,极大帮助有关质检人员快速实现对卷烟质量真伪的抽检,从而保证市场上流通卷烟的合法合规。本文的研究内容如下:
- 针对卷烟32位防伪码识别系统中的字符定位、字符倾斜矫正、单字符分割、字符匹配识别,对近些年来相关的研究进行了整理和分析,通过系统的对比认证和结果分析,为本次防伪码识别明确了正常的方向。
- 针对字符分割常见的两种方法:连通域分割法和投影分割法,作了大量验证,从计算复杂度、运行时间和切割准确度等方面入手,最终选择了投影法。该方法代码直观且参数可调,可灵活修改,同时切割出的字符方便按原来的顺序排列,减少了大量的后续工作,减少了运行时间。
- 完成了整个卷烟32位防伪码识别系统的设计与开发,其中包括字符位置识别系统、单字符切割系统、字符识别系统等的实现。经过对实际卷烟防伪码的照片的识别,其识别准确率和系统灵活性均经过了考验,整体性能对比其它识别系统,略有提高,对于简单重复性的识别其可操作性和识别率更高。
关键字:二值化;字符分割;模式识别
ABSTRACT
In order to alleviate the tedious workload of manual identification of cigarette anti-counterfeiting codes and the large errors that may be caused, and to realize the intelligent and efficient development of related work, a new method of image recognition is adopted for the sampled cigarette anti-counterfeiting codes. The relevant steps used in the recognition process include gray-scale, binarization, image region cutting and template matching, among which noise reduction is the key. There are four methods, including smoothing, Gauss filtering, median filtering and bilateral filtering. Character cutting is to separate single characters by projection method. Finally, a pattern recognition method based on character structure features is proposed, which can achieve fast and effective character acquisition and recognition, and greatly help the quality inspectors to quickly realize the smoking inspection of cigarette quality, so as to ensure the market flow. The legal compliance of all cigarettes. The main results are as follows:
- aiming at character location, character tilt correction, single character segmentation and character matching recognition in cigarette 32-bit anti-counterfeiting code recognition system, the related research in recent years is sorted out and analyzed, and through systematic comparative authentication and result analysis, For this anti-counterfeiting code identification clear the normal direction.
- aiming at two common methods of character segmentation: connected domain segmentation method and projection segmentation method, a lot of verification is made. Finally, the projection method is selected from the aspects of computational complexity, running time and cutting accuracy. The code of this method is intuitionistic and the parameters can be adjusted flexibly. At the same time, the cut characters are conveniently arranged in the original order, which reduces a lot of follow-up work and reduces the running time.
- the design and development of the whole 32-bit anti-counterfeiting code recognition system for cigarettes are completed, including the realization of character position recognition system, single character cutting system, character recognition system and so on. After recognizing the photos of the actual cigarette anti-counterfeiting code, the recognition accuracy and system flexibility have been tested. Compared with other recognition systems, the overall performance is slightly improved, and its maneuverability and recognition rate are higher for simple and repetitive recognition.
Keyword:Binarization; Character Segmentation; Pattern Recognition
目录
第1章 绪论 1
1.1研究背景及研究意义 1
1.1.1研究背景 1
1.1.2研究意义 2
1.2国内外研究现状 2
1.3研究重点与难点 3
1.4研究内容和组织结构 4
第2章 图像预处理算法 5
2.1图像灰度化 5
2.1.1灰度化原理 5
2.1.2本节算法研究 6
2.2图像二值化 6
2.2.1二值化原理 6
2.2.2本节算法研究 7
2.3图像的滤波除噪 8
2.4目标区域的提取 10
2.4.1形态学处理 10
2.4.2图像轮廓查找与绘制 12
2.4.3目标轮廓的选取 13
第3章 字符图片矫正与切割算法 14
3.1概述 14
3.2常见的图像矫正方法 14
3.2.1基于投影的方法 14
3.2.2Hough变换法 15
3.3常见的字符分割方法 15
3.3.1字符分割原理 15
3.3.2本节算法研究 17
第4章字符识别算法 20
4.1模板匹配模式识别 20
4.1.1 OpenCV中模板匹配函数简介 20
4.1.2模板的制作 21
4.2本节算法研究 22
4.2.1识别过程 22
4.2.2识别结果 23
4.3本章小结 24
第5章总结与展望 25
参考文献 26
附录A 28
致谢 37
第1章 绪论
1.1研究背景及研究意义
2010年9月,国家烟草专卖局正式印发《关于卷烟打码销售有关事项的通知》。该通知规定:通过正常经营的持证零售户入网销售,销售卷烟必须打码到条,未打码到条的卷烟不得在市场上销售[1]。这项规定为稽查人员通过识别卷烟编码打击贩卖虚假卷烟提供了依据。目前市面上的正规卷烟采用的均是激光打码的方式,以便于产品后续的流通追述工作。从卷烟上的防伪码中可以看到有上下两行共32位字符,大多数以数字为主,个别也会掺杂英文字母。卷烟32位防伪码中包含的信息是鉴别卷烟真伪最直接、最简单的方式,尽管这种方法不一定完全可靠,却是烟草稽查人员作为日常排查的首选,但是一旦面对数量庞大的卷烟物流抽检时,人工排查就会显得力不从心,其工作量实在过于巨大。
如果将基于OpenCV的数字识别系统应用于对卷烟的防伪码的识别,通过对卷烟防伪码的提取,再与之信息码中代表销售地区、销售时间、零售客户代码等多种代码信息进行对比和验证,就可以进一步识别该卷烟是否来自正规渠道,是否是冒牌的,比起人眼识别,其准确性、灵敏性、高效性也要更高。因此,设计一款能够高效准确的识别每盒卷烟的防伪码信息的智能识别系统,对卷烟防伪工作有着重大意义。以往的人工的识别不但速度慢而且还可能会出现错误输入,对后续的进一步的识别工作造成很大干扰,一旦机器识别应用后其效率将会是人工的3倍还不止,从而大大提高质检工作的效率以及降低相关人员的工作强度,同时这种视觉识别技术也会对相关产业的智能化发展起到推进作用。
1.1.1研究背景
国家烟草专卖局相关文件规定,各级烟草公司销售的卷烟在出库时必须打码到条,目前条包打码一律采用激光打码的方式,每条卷烟上均有32位信息码(分两行,每行16位)。以下面的条码为例详解其含义:
9 0 4 1 592327683839
WHYC420100204702
前五位数字“90415”代表配送日期2019年4月15号,第6至14位“923276838”是该条卷烟所属件烟件码,第15和16位“39”是代表这条烟在所属件烟中的序号,从01至50不等,如果超过50则一定是假烟。第二行的第17至20位“WHYC”是烟草公司名称“武汉烟草”拼音的缩写,第21至26位“420100”是该地市的行政区域国标代码,第27至32位“204702”是零售商户代码后6位。
对于零售客户来说,可以根据条码中的出库日期按时间的先后顺序销售,避免因自己的疏忽而使卷烟存放时间过长,导致卷烟霉坏掉,还可通过核对条码的第21~32位数字,可以有效防止卷烟调包行为的发生,避免不必要的损失。对消费者来说,可以通过条码信息辨别卷烟来源,避免上当受骗。那么对烟草稽查人员来说,可以通过条码信息查询来源地和辨别真假,有效防止售卖违法卷烟。因此这个卷烟32位防伪码的作用是相当的重要,关乎到每位利益相关者的权益。
1.1.2研究意义
随着国家对假制伪劣产品的打击力度越来越大,又由于近些年来的视觉技术的蓬勃发展,自然而然二者开始结合起来,向假制品发起了挑战。对非法假烟的打击,不仅更好的维护零售户及消费者的权益,同时也保证了国家的税收。2015年开始,贵阳市烟草专卖局投入86万元,与深圳一家科技公司合作,经过1年多时间,成功开发出“32位激光码识别读录仪器”,该设备可以实现信息智能识别、储存、上传、汇总,并通过电脑形成表格。它的投入使用,使得以往5000余条非法假烟需要10人用至少10天时间才能人工完成抄码,变成了7个人仅用了1天半就全部识别读录完毕。不仅如此,该局2015年共查获真品卷烟案件293起有码卷烟60993条,人工抄录码成本高达320.1337万元,而用该设备进行识别读录,人工成本只需1.919万元,节约318.22万元[2]。
近年来,为了响应国家“双创”战略,在国际发展竞争日趋激烈和我国发展动力转换的形势下,在不断强化创新这个引领发展的第一动力的紧迫时期,每个企业甚至个人都要有以创新为持续发展的根本动力的根本思想意识,政府以及各职能部门要进一步健全完善创新机制,坚持问题导向和需求导向,扎实推进企业全面创新,坚持鼓励和支持个体创业。卷烟32位防伪码识别系统作为新形势新任务下与时俱进、积极思考的产物,在加大降本增效和信息化建设力度,取得了显著成效。如果将卷烟激光码识别系统与其他技术相结合还可以应用到更多的场合,如身份证查询、停车场收费管理系统、物流信息跟踪系统等多个方面。根据各种信息码识别,卡号识别的广泛应用性,本次卷烟32位防伪码识别系统的研究和开发有着重要的现实意义。
1.2国内外研究现状
数字识别属于图像识别中很小的一个范畴,而图像识别技术又是人工智能的一个重要领域,随着人工智能的火热,国内外对这面方面的研究数不胜数。图像识别其实包含两部分,图像处理和模式识别,图像处理又叫数字图像处理,原因在于只有数字图像计算机才能实现去噪、平滑、分割、特征提取、识别等操作。数字图像处理最早起源于报纸业,上世纪20年代,电缆图片传输系统的应用,大大缩短了一张图片的传输时间,使得图像编码和接收端打印重构图像技术开始发展。50年代后,由于计算机的发展,数字图像处理技术才真正走进人们的视线,引起人们的广泛关注。20世纪70年代初,CT(计算机断层扫描)医学技术的诞生,真正实现数字图像处理技术的重大突破,成为数字图像处理技术的里程碑事件。
此后,随着计算机的处理能力越来越强,数字图像处理技术也开始应用到了更多的领域,比如说交通监控,通过摄像头捕获的汽车照片,实时监控排查车辆交通情况,从而做到及时疏通交通堵塞,快速处理交通事故,确保人员最大安全。又比如说遥感领域,对卫星传回的图像进行处理,可以用来勘探地形、分析云层、预报自然灾害、监控环境污染等。再比如说工业设计方面,对于一些细小的缺陷或者管道裂缝,也可以用到图片识别处理检查出来,相信在不久的将来,它的用途会更加广泛,并不断的给我们的生活带来方便。
图像分割是图像处理中的一项关键技术,起源于20世纪70年代,到现在已经有几十年的历史了,一直以来都受到人们的高度重视,现在借助于各种理论已经有数以千计的分割算法被提出来,由于现实的问题过于复杂,没有一项技术是万能的,因此这方面的研究仍然在积极地进行着。
模板匹配模式识别顾名思义就是选择一个图片作为模板来对另一个图像进行识别,但是这种方法有个内在的缺点,就是一旦模板图片很大,随着计算机的计算量和存储量加大,,可能运行时间很长甚至无法工作,因为需要匹配的点很多。但是对于图片中一些细小的区域的识别,这种方法又是最直观方便的,常用于印刷体字体识别,物体移动检测和位置配准等,任何一种方法都有其适合的方面和不可克服的缺点,关键在于灵活使用各种方法来使具体问题最优解化。
翻阅了很多文献,看到对图片处理的方法介绍的比较多,但是集中于实际效果比较的资料较少,基于这个目的,在本次毕业设计中,以卷烟32位防伪码的识别为契机,专门对比了数字识别过程中用到的各种方法,同时还就模板匹配法验证其在不同环境下的识别情况,并分析了具有自学习能力卷积网络模式识别引起人们极大的兴趣。
1.3研究重点与难点
卷烟32位防伪码识别包括数字区域提取、单字符切割、字符匹配识别三个部分,其中较为复杂的是数字区域提取和单字符切割。数字区域提取也就是图片的特征提取,特征提取是图像处理的初级运算,它通过检查每个像素来确定该像素是否代表一个特征,从而将相似特征的部分提取出来,特征检测的方法有基于模板的方法、基于边缘的方法、基于灰度的方法、基于空间变换的方法等。有时候由于环境的干扰或者拍摄角度的问题,使得提取区域的背景很复杂,这就需要具体考量图片特征的类型,选取几种方法在一起提取效果更好。
卷烟的32位防伪码打印在烟盒外面的透明薄膜上,一个问题是打印不是很清晰,另一个是烟盒本身的图案对后续的数字特征提取增加了困难。同时,照片的清晰度越高,各种算法的有效性就会越好,因此拍摄照片时尽量离烟盒近些,尽可能拍摄到整个字符区域,这样对后面的字符切割还是识别还是有很大帮助的。单字符切割的难点在于对不同的图片来说,由于还是存在一定的差别,因此如果用同一种算法去切割的话,效果可能会有出入。另外由于背景的干扰,可能导致无法切割字符,或者先设法尽量消除背景干扰,但或多或少对字符信息进行了削弱,导致切割准确性下降。
综上所述,本文研究的重点和难点有如下几个:第一,同一种特征提取提取方法无法应对不同图片复杂的背景干扰;第二,单字符切割前需要调整字符的水平位置,并尽量消除背景干扰为后续识别创造良好条件;第三,基于深度学习的算法将会是对付不同场景的方法策略。
1.4研究内容和组织结构
基于上述的分析,本文的主要工作是参考其它的数字识别实例,并结合图像处理相关理论基础,在现有的印刷体数字识别基础上,进一步对其进行深入的理论研究和应用探讨,,对比现有字符分割和识别算法的优缺点,提出了一种比较适用于卷烟防伪码识别的系统。本文利用Windows10系统、VS2017和OpenCV4.2.3进行的系统设计仿真实验。
本文的各章节安排如下:
第一章为绪论。主要介绍本次课题研究的背景与意义,国内外研究现状,并分析了卷烟防伪码的特点和以及本次设计的难点和重点所在。
第二章为图像预处理。包括图像灰度化、二值化、归一化等,还有滤波除噪、字符区域的获取等操作,这些是字符切割之前必不可少的步骤,关系到字符结构特征的有效性。
以上是毕业论文大纲或资料介绍,该课题完整毕业论文、开题报告、任务书、程序设计、图纸设计等资料请添加微信获取,微信号:bysjorg。
相关图片展示: