水表字符的识别算法设计与实现文献综述
2020-04-15 15:44:21
水是人类生产生活的重要资源之一,水资源的管理也是一项非常重要的工作。建立现代化的水资源监测管理系统,实现信息化的水资源管理,符合社会发展的需求。目前,我国许多地区仍在了依靠人力抄表进行用水和收费管理。这种抄表方式简单易行,然而工作量巨大,而且抄表过程受人的生理状态和精神状态影响,易出现误抄或漏抄情况,已难以满足实际需求。
为了克服人工抄表的诸多缺点,人们提出了总线制抄表,无线发射式抄表,IC卡抄表,分线制集中抄表等智能抄表方式。总线制抄表方式将读数采集模块安装在水表内部,通过智能卡读取水表读数。这种抄表方式受环境因素干扰较小,且既可单独抄表,又可联网抄表,组网方式简捷,但成本较为昂贵,推广比较缓慢。无线发射式抄表方式需为水表加装无线发射模块,通过远程接收装置接收读数。这种抄表方式安装较为方便,但是成本高昂,且需向通信公司交付一定费用。智能IC卡抄表方式采取预付费的方式管理用水,用户用水前需首先在指定售卡点预付水费。这种抄表方式支持限量用水,且安装方便,维护简单,但在潮湿环境中工作能力较差。分线制集中抄表方式同时采集处理多路水表信号,各采集器间通过总线制相连。这种抄表方式成本较低,但是安装工作较为繁重,维护费用较高。
尽管以上几种智能抄表方式能够自动完成水表读数的采集,但在许多地区,传统指针式水表和数字式水表仍在被广泛使用中。采取以上抄表方式需要对现有水表进行更换,还需完成管线改造工作,工作量大,成本高,难以被自来水公司和用户接受。为此,国内外有关人员做了大量研究工作,提出多种水表读数自动识别方法。采用图像处理技术和信息技术,使用图像采集设备采集水表图像,将图像输入计算机、移动终端等处理平台,经过识别算法的快速处理,以文本的形式输出水表读数。这不仅可以降低抄表错误率,节省人力开销,提高效率,还便于读数的存储和分析,并且无需更换或改造现有水表和管线,具有一定的现实意义。
数字的字符识别是字符识别中的一种,都是属于光学字符识别(Optical
Character Recognition,OCR)的研究内容。德国科学家 Tausheck 在 1929 年第一次提出 OCR 的概念。在随后的几年,各国科学家都在研究相关的技术。美国的相关科学家提出在技术上实现字符的识别,但是由于当时科技水平的限制,这种想法仅仅停留在理论阶段,直到计算机的出现,让理论逐渐变成了现实。在计算机出现后的几十年里,各国都在尝试使用不同的办法展开对 OCR的研究。最开始的时候大多都是以文字识别为主,IBM 研究了多年,终于在 1965 年的纽约世界博览会上推出了世界上第一款 OCR 产品,但是由于当时的理论与技术上的限制,只能识别指定字体的印刷体英文字符以及数字。在随后的 1966 年,Casey和 Nagy 共同发表了一篇论文,该论文第一次提出了对汉子的识别,但是也只能是对印刷体的汉子进行识别。这一次是利用模板匹配的方法实现了少量汉字的识别。日本在字符识别方面也研究的比较早,富士通以及日立在六十年代末都推出了自己的相关产品。在七十年代初,东芝公司推出了邮件编码的自动分拣系统,之后在八十年代又推出了一款识别日文的 OCR 系统,但是只能识别特定的印刷体日文,之后又研究并实现了对手写日文的识别。
中国在这方面的研究则要晚的多,上世纪七十年代才开始对英文、数字等字符的识别展开研究。七十年代末以及八十年代初才开始研究汉字的识别。1986 年的国家 863 计划组织清华等大学研究汉字的 OCR 识别系统。清华大学于 1989 年推出了首款中文的 OCR 识别系统,之后又对系统进行了改进,不仅实现了简体字而且还实现了繁体字的识别。清华之后又推出了一款系统,它能实现对汉英混排字体的识别,它是世界上第一款该类产品,总体处于国际领先水平。
随着工业化的发展,对仪表数字进行自动化的识别也成为一种趋势。在本世纪初,我国一些研究人员对仪表的数字字符的识别进行了研究。张坚在 2005 年对分时仪表的数字识别进行了深入的研究,他的难点在于对不完整字符的识别上,随后张海波又提出另一种方法,将每个字符进行分割,然后提取出字符的特征,他引入模糊概念,用一种新分类算法对其进行快速识别。赵书涛在 2006 年利用机器学习中的思想方法对仪表数字识别进行了研究,他提出用径向基神经网络的方法,首先提取数字的特征,然后将这些特征映射到高维空间中,最后实现对数字、指针的分类识别。张艳玲在 2008 年用机器学习当中支持向量机分类的方法对仪表的数字识别进行识别,实现了简单数字的分类识别。最近几年,随着人工智能以及机器学习在理论上以及技术上的逐渐成熟,光学字符的识别也成为其热门的研究方向之一,神经网络学习等机器学习当中的思想方法被应用于字符识别的研究当中,并且得到了不错的识别效果。
{title}2. 研究的基本内容与方案
{title}本课题的主要内容是运用数字图像处理技术在水表数字字符识别的研究。针对基于水表图像的自动抄表, 提出满足实时性要求的水表字符自动识别算法。首先, 将真彩色图像灰度化和标准化处理;然后, 通过字符分割得到独立的单个字符;接着, 采用自适应阈值的二值化方法将灰度图像转化。
主要的设计任务集中在实现水表图像的预处理、水表字符所在数字框位置定位以及定位以后数字框的分割、分割后的水表数字字符的识别方法的研究。在实验室项目中首先根据摄像头采集水表图像信息,进行识别判断,然后获取水表读数。数字式水表读数识别算法,通过对数字式水表图像进行图像预处理、图像旋转矫正、数字字符定位与分割、数字读数识别,最终完成数字式水表的读数识别,并介绍了数字式水表读数识别实验,对识别结果进行了分析。