招聘网站的数据分析与可视化实现开题报告
2021-02-24 10:02:32
1. 研究目的与意义(文献综述)
1. 目的及意义(含国内外的研究现状分析)
1.1目的及意义
过去几十年里,web 的迅速发展,大量的数据通过web 发布,使其成为世界上规模最大的公共数据源。随着网络的高速发展,互联网成为海量信息的载体,如何有效地提取并利用这些信息成为研发人员一个巨大的挑战。搜索引擎作为一个辅助人们检索信息的工具。但是,这些通用性搜索引擎也存在着一定的局限性。不同领域、不同背景的用户往往具有不同的检索目的和需求,通用搜索引擎所返回的结果包含大量用户不关心的网页。为了解决这个问题,一个灵活的爬虫有着无可替代的重要意义。
2. 研究的基本内容与方案
2. 研究(设计)的基本内容、目标、拟采用的技术方案及措施
本课题研究的内容是用python语言设计网络爬虫,进行著名招聘网站(本文选取的网站是智联招聘)的数据抓取,并对全国的职位需求情况,对招聘人员的需求分布进行分析并可视化,分析热点包括工作地点、入职年份、招聘数量、热门岗位等,提出自己的分析意见。
3. 研究计划与安排
1-3周:查阅文献,完成开题报告
4-6周:总体设计,完成论文综述
7-10周:设计算法,功能模块设计
4. 参考文献(12篇以上)
[1] 唐学韬等。利用python进行数据分析,机械工业出版社。2016年
[2] [澳]理查德 劳森(richard lawson),用python写网络爬虫,人民邮电出版社,2016年
[3] [美] wesley j. chun,python核心编程(第二版),人民邮电出版社,2008年07月