基于机器学习的验证码识别开题报告
2022-01-14 21:22:19
全文总字数:1637字
1. 研究目的与意义及国内外研究现状
图像中的验证码识别是图像识别中的一种,目的是从通过检测验证码图片中暗、亮的模式确定其形状,然后通过字符识别方法将形状翻译为计算机文字的过程。
ocr包含两大关键技术:文本检测和文字识别。
先将图像中的特征的提取并检测目标区域,之后对目标区域的的字符进行分割和分类。
剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!
2. 研究的基本内容
通过python的captcha库生成以及网络爬虫从网上获取大量的验证码作为数据集,对验证码预处理过后使用python和深度学习框架TensorFlow通过大量数据集的训练,提高验证码的识别率。
使用训练后的成熟模型进行验证码图片的识别。
3. 实施方案、进度安排及预期效果
一、实施方案
本系统使用python3 TensorFlow开发框架。本设计要使用python实现一个基于TensorFlow的验证码识别系统,利用TensorFlow对大量的验证码图片数据进行训练以达成高准确率的验证码识别,在研究的过程中具体有以下5个步骤:
1)需求分析:分析本系统制作要求,系统总体实现功能比较简单,操作难度比较低。2)系统分析:系统分析阶段主要对系统进行健壮性分析,建立系统的交互模型。3)系统设计:设计验证码识别系统的模块。4)代码实现:通过代码具体实现验证码识别系统。5)代码测试:测试验证码识别系统的准确性。二、进度:2019年03月01日-2019年03月10日:通过上网或者去图书馆查阅和搜集资料。2019年03月11日-2019年03月31日:完成论文理论部分,实现生成验证码的数据集。2019年04月01日-2019年04月10日:实现验证码识别系统的功能。2019年04月11日-2019年04月25日:进行验证码识别的数据集训练和测试和论文撰写。2019年04月25日-2019年05月01日:论文交予导师检查并给出修改意见,然后进行修改。三、预期效果:验证码识别能够正常进行,并且有较高的识别成功率。4. 参考文献
[1] 周志华.机器学习.北京:清华大学出版社,2016:1-1.
[2] 美团算法团队.美团机器学习实践.北京:人民邮电出版社,2018:8-1.
[3] 郑泽宇.tensorflow:实战google深度学习框架.北京:电子工业出版社,2018:2-1.
剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付