登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 开题报告 > 电子信息类 > 通信工程 > 正文

基于tensorflow的验证码识别方法分析开题报告

 2020-03-27 11:25:23  

1. 研究目的与意义(文献综述)

1.1 研究目的及意义

近几年来,互联网飞快的发展,信息成为了第一生产要素,同时构成了信息化社会的重要技术物质基础。同时,信息不再存储在实体介质,而是存储在海量的网站内,人们存储,查找和获取信息变得更加方便快捷了。但与此同时,不法分子盗取信息的可能性也大大增加。因此,人们逐渐开始重视网络防护与信息安全,其中,web的信息安全性尤其重要。

验证码是目前解决web系统安全登录的技术之一。验证码,即全自动区分计算机和人类的公开图灵测试(completely automated public turing test to tell computers and humans apart,简称captcha),是一种区分用户是计算机或人的公共全自动程序。可以有效防止:恶意破解密码、刷票、论坛灌水,有效防止某个黑客对某一个特定注册用户用特定程序暴力破解方式进行不断的登陆尝试,实际上用验证码是现在很多网站通行的方式。由于计算机无法解答captcha的问题,所以回答出问题的用户就可以被认为是人类。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究的基本内容与方案

传统的早期验证码算法,例如用tesseract ocr、opencv等其它方法都需把验证码分割为单个字符,然后识别单个字符。缺点在于如果复杂的验证码字母之间相互重叠,那么就无法识别了。得益于基于卷积神经网络cnn的人工智能技术的发展,目前基于主流的深度学习框架的直接开发出端到端不分割的识别方式:输入整张图片,输出整个图片的标记结果,具有更强的通用性。本文重点采用基于python语言的tensorflow的“端到端”的字符型验证码识别模式。

首先我们来用 tensorflow 来实现一个深度学习模型,接着用标注好的数据来训练这个模型,然后再用模型来实现这个验证码的识别。所有的训练模型,数据才是关键,这里采用的是python的captcha库生成验证码,captcha可以生成语音和图片验证码,验证码是由数字、大小写字母(也可以自定义特殊字符),长度为4,共有62^4种组合。将验证码识别问题转化为分类问题,总共62^4中类型,采用4个one-hot编码分别表示4中字符取值。接下来定义卷积神经网络结构,我们采用3个卷积层加1个全连接层的结构,在每个卷积层中都选用2*2的最大池化层和dropout层,卷积核尺寸选择5*5。将生成的验证码作为训练集输入神经网络,训练过程中不断调整权值和阈值,最终得到有较高识别精度的模型。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 研究计划与安排

第1-3周:查阅相关文献资料,明确研究内容,了解研究所需理论基础。确定方案,完成开题报告。

第4-5周:熟悉掌握基本理论,完成英文资料的翻译,熟悉开发环境。

第6-9周:编程实现各算法,并进行仿真调试。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 参考文献(12篇以上)

[1]黄文坚. tensorflow实战[m]. 北京:电子工业出版社, 2017.

[2]周志华. 机器学习[m]. 北京:清华大学出版社, 2016.

[3]阿培丁. 机器学习导论[m]. 北京:机械工业出版社, 2009.

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

企业微信

Copyright © 2010-2022 毕业论文网 站点地图