基于MODI的验证码识别系统设计与实现毕业论文
2022-07-18 22:04:52
论文总字数:42079字
摘 要
从验证码识别的角度设计并采用 VB实现了一种检验验证码安全性的方法。该方法首先对验证码图片进行灰度化、二值化、字符分割、重新排版等预处理 ,然后调用微软 MOD I组件完成对验证码图片的识别。通过对多个不同网站批量的验证码图片进行识别 ,表明该系统对于字符规整易于分割的验证码图片具有较好的识别效果。
关键词: MOD I; 验证码; 识别
Research and implementation of A CAPTCHA
image recognition system based on MODI
Abstract
From the perspective of the code identification, a security checking method of authentication code is designed and implemented with VB. This method first codes pictures by graying, binarization, character segmentation, retypesetting and other preprocessing, Tests show that the system is high in recognition accuracy of decoding CAPTCHA image in which characters are well2ositioned and easy-separated.
Key words: CAPTCHA; MODI; recognition
目 录
摘 要 IV
Abstract V
第一章 绪论 1
1.1研究背景 1
1.2验证码的分类 1
1.3验证码的作用 5
1.4验证码识别在国内外发展现状 6
第二章 图像预处理 8
2.1 MODI验证码识别系统介绍 8
2.2. 灰度化 9
2.3 二值化及背景去除 10
2.4 图像去噪 11
2.5 字符分割 13
2.5.1 传统的竖直投影法 13
2.5.2 上下轮廓差投影法 14
2.5.3 连通域分割法 15
2.6 字体排版 16
2.6.1 字符大小归一化 16
2.6.2字符位置归一化 17
第三章 软件系统结构与功能设计 18
3.1设计方案 18
3.2用户名登陆框(流程一) 18
3.3下拉选框COMBO(流程二) 20
3.4列表框LISTBOX(流程三) 21
3.5最后一个功能块介绍(流程四) 22
3.6软件使用说明 24
3.7图像识别实例 27
第四章 总结与展望 33
4.1总结 33
4.2展望 33
参考文献 34
致谢 36
附录 37
第一章 绪论
1.1研究背景
随着互联网技术的快速发展和应用,网络在给人们提供丰富资源和极大便利的同时,伴随而来的就是互联网系统的安全性问题。验证码的出现正是加强web系统安全的产物。
验证码(CAPTCHA) 最早作为卡内基梅隆大学的一个科研项目,Yahoo! 是CAPTCHA 的第一个用户。CAPTCHA是“Completely Automated Public Turing test to tell Computers and Humans Apart”(全自动区分计算机和人类的图灵测试)的缩写,是一种区分用户是人类还是计算机的公共自动程序。在一个验证码测试中,由计算机生成一个问题并评判用户的答案,这个问题必须只有人类才能解答。由于计算机无法解答,回答出该问题的用户就会被认为是人类。CAPTCHA在网络上的大规模使用起源于1999-2000年Yahoo网站的账号注册。目前大部分网站都引入了验证码机制来加强网络的安全验证。
验证码是目前解决 WEB系统安全登录的技术之一。验证码是指包含有一串数字或其它字符的一幅图片 ,通过在图片里加入一些噪声干扰 ,使用户可以识别但攻击程序难以识别验证码字符 ,从而阻止并完成自动注册和登录 ,实现阻挡机器攻击的目的。验证码又称 CAPTCHA, 即 Completely AutomatedPublic Turing Test to Tell Computers and Humans A2part(全自动区分计算机和人类的图灵测试 )的简称 ,已由卡内基梅隆大学注册成商标。CAPTCHA的目的是区分计算机和人类的一种程序算法 ,这种程序必须能判断是客户登录 ,还是计算机自动登录。
在验证码图片中加入噪声干扰的方法有多种 ,如对字符进行扭曲、变形、倾斜处理 ,或在图片背景中加入斜线、纹理 ,或添加多种不同颜色等 ,为的就是防止验证码图片被 OCR技术破解。对现有网站验证码进行识别研究 ,有助于分析验证码的安全性并促进其改进生成验证码的算法 ,推动 WEB系统安全验证技术的发展。
1.2验证码的分类
由于生成验证码程序的不同,验证码的种类也多种多样。大体有基于字符图片验证码、3D验证码、基于数学的验证码、声音验证码和中文验证码等。
- 基于字符的图片验证码
这是网络中最常用的验证码。它易产生,具有标准答案,不受背景知识和文化差异的影响,暴力破解复杂度很大。几乎所有的国内网站和大部分的国外网站都是采用此种验证码。此类验证码是系统在用户访问页面时随机产生的一个图像,图像中包含数字、字母或其他文字。其中字符序列与背景图像进行信息融合,添加干扰噪声,或对图像进行混杂、扭曲、粘连、变形等处理,以增加图像识别的难度。这也是我们的研究对象。以后章节提到的验证码若无特别说明,便指此类图片验证码。
图1.2.1 各大网站邮箱的验证码
2.3D验证码
这类验证码对机器而言较为难以破解,但生成比较麻烦,用户体验也不如字符验证码简单,现有网站应用的较少。
图1.2.2 带缩放和旋转的3D验证码
3.基于数学的验证码
这类验证码基于数学运算,给出一个数学算式或一段代码,其结果作为验证码填入页面。计算机几乎无法回答,但用户体验更差,要求用户有数学基础或代码经验,难以普及。
图1.2.3 数学验证码
请支付后下载全文,论文总字数:42079字