网页图片提取管理系统设计与实现
2023-03-09 08:54:40
论文总字数:21191字
摘 要
随着互联网的快速发展和普及,大量的信息以网页的形式存在于互联网中,网页具有半结构化特征,其中包含的诸如图片的对象难以直接提取,造成人们网页信息提取的不便,本课题考虑设计实现网页图片提取管理系统,支持网页中图片的自动识别、提取和保存管理。
本系统是基于Web技术的网页图片提取管理系统,此系统使用MyEclipse为开发环境平台,使用了Mysql数据库管理系统,Tomcat作为Web服务器,选用Java作为编写语言并结合网页爬虫知识来实现功能需求。该系统可以让用户实现对网页常见格式图片的提取,手动添加与图片相关文字信息描述,并对众多图片进行栏目分类管理。系统用户可以注册及修改个人信息,发布个人评论。管理员除了能够实现一般用户的功能外还可以在后台管理注册用户的账号。该系统交互界面美观友好,提取图片过程方便快捷,分类管理清晰明了,即便是没有太多电脑操作经验的人也可以方便使用。
关键词:网页图片提取;Java;爬虫;
Abstract
This paper mainly describes the design and implementation of image collection system based on Web technology. On the basis of introducing the development of dynamic web page program and data access technology, this paper describes the design scheme of the system, the realization method and the development tools and related technologies. This paper discusses a simplified Web application model, complete a picture collection management system, to facilitate the user to carry out the corresponding picture information management.
Java technology with its unique advantages to become the preferred tool for the development of Web site system, the use of Eclipse development tools, and ultimately to achieve all the operations of the client. Because Java has a write once, run everywhere, rich and high quality tool support, through reuse components and label, instruction and tag library through enhancing and developing capability, system development can be written in any platform java server component to run on any platform.
Key words: Picture collection system; java;
目录
摘要 1
Abstract 2
目录 3
第一章 绪论 4
1.1选题背景与意义 4
1.2主要问题 4
1.3论文组织结构 4
第二章 相关的理论和技术 6
2.1 Java技术介绍 6
2.2 Eclipse平台 6
2.3 JDK 6
2.4 B/S结构 6
2.5 HTML简介 7
2.6 JAVASCRIPT简介 7
2.7 CSS简介 7
2.8 网络爬虫简介 8
第三章 系统需求分析 9
3.1技术可行性 9
3.2经济上的可行性 9
3.3功能需求概述 9
3.4 UML用例图 9
第四章 系统设计 11
4.1功能模块设计 11
4.2数据库概念结构设计 11
4.3数据库逻辑结构设计 12
第五章 系统实现 17
5.1用户注册登录 17
5.2后台基本操作 19
5.3用户个人后台管理 19
5.4图片管理 20
5.5用户评论管理 24
第六章 系统调试和测试 27
6.1系统测试的重要性 27
6.2测试实例的研究与选择 27
6.3测试环境与测试条件 27
6.4测试的内容 28
6.5测试用例总结 28
第七章 总结 29
致谢 30
参考文献 31
第一章 绪论
1.1选题背景与意义
随着移动互联网的普及人们的上网方更加便捷,4G网络以及光纤宽带的大规模覆盖,互联网的信息承载介质由早期的文字转为更为丰富的多媒体形式,相比于文字信息的繁杂冗长,人们更乐于接受图片和视频这样的信息传播方式。Instagram、Pinterest 、Snapchat这些以图片形式为主的社交网络已取代Facebook 、Twitter等传统社交媒体成为年轻最受欢迎的社交网络平台。在这样一个图片数据量呈现爆炸式增长的时代,准确而全面地从网页中提取图片以及与图片内容相关的文本并且能够对图片文件进行方便的管理显得至关重要。
1.2主要问题
网页图片提取管理系统设计的工作重点在于用户对于网页有效内容的提取和数据后台保存管理。
网页图片提取问题是系统对给定的网页代码进行解析,检测出该网站的所有图片。并将该网页的图片抓取。后台管理的主要问题是将图片保存在后台数据库,并且可与对图片进行查看、管理、以及图片关键字的编辑。
此系统设计的难点在于,现在的图标格式多种多样,如何对于多种不同格式的图片进行提取。网页信息复杂,信息抓取怎样才能做到准确。图片存储量很大时,简单高效的文件管理方法设计。
1.3论文组织结构
本文组织结构如下:
第一章首先描述了当下的背景并借此阐述我选择此次题目的原因,以及研究此类问题的意义。接着列出了实现此次系统功能需求需要解决的一些主要问题。
第二章主要是列举出了实现此次系统功能所使用到的一些理论和技术,如选用哪种语言编写,在何种开发平台下实现,对这些理论技术做了简单的介绍。
第三章主要从技术的角度分析了项目实施的可能性,并做了经济投入的考量。接着描述了了该系统的详细功能,并根据功能需求画出UML用例图。
第四章阐述了系统总体设计,将该网站的系统所需要的基本源程序、文件、数据库等等都整理出来。本章节共分为二个部分,第一部分是功能模块设计,把系统的具体实现方案明确并规划出来。第二个是数据库设计,分析用户需求,建立DBMS数据模型,画出ER图。
剩余内容已隐藏,请支付后下载全文,论文总字数:21191字