基于卷积神经网络的水表识别项目开题报告
2021-12-11 16:31:42
1. 研究目的与意义及国内外研究现状
选题的大方向为计算机视觉,细分的领域为文本识别。整个毕设包含了理论分析、算法方面的实验研究、以及实施算法的软件开发,环节较多,并且计划完成后将算法及软件交付给浙江省台州市自来水表公司,所以该毕设是与生产实际相结合的项目。
选题目的希望通过该毕设来完成一份与生产实际相结合的毕设项目,熟悉计算机视觉领域在图像处理、机器学习领域的基本知识与常见算法,理解与掌握设计并训练一个机器学习算法及网络的基本流程,同时通过将算法移植来在便携的android手机平台实现该算法,达到将科研成果投入实际使用得目的。
2. 研究的基本内容
基于水表现场图片的图像分割算法;OCR引擎识别方法;水表数字的android端检测与识别算法;水表数字的Server端检测与识别算法;深度学习框架移植android端的方法。
3. 实施方案、进度安排及预期效果
2016.01~02 研究水表图片的分割算法,采用传统的计算机视觉方法进行识别,采用开源ocr引擎进行识别训练
2016.03~04采用深度学习的方法,采集大量水表图片进行图像预处理和标注,训练识别模型;将深度学习框架部署到android平台进行二次开发
4. 参考文献
[1]baoguang shi, xiang bai, cong yao. an end-to-end trainable neural network for image-based sequence recognition and its application to scene text recognition. 2015, arxiv preprint arxiv: 1507.05717
[2]yingying zhu, cong yao, xiang bai. scene text detection and recognition: recent advances and future trends. front. comput. sci., 2016, 10(1): 19-36
[3]max jaderberg, karen simontan, andrea vedaldi, andrew zisserman. reading text in the wild with convolutional neural networks. 2014, arxiv preprint arxiv: 1412.1842v1