基于Python的网页数据提取及分析任务书
2020-06-30 21:51:42
1. 毕业设计(论文)的内容和要求
课题要求采用Python软件编程实现网页数据的自动获取(即爬虫),并对所获取数据进行简单的分析。课题以流行音乐点击量、金融数据等为目标,要求编制程序对网页中关键数据进行提取,并对今后一段时间的数据做预测。所编制程序需能够实时运行,快速给出预测结果。
2. 参考文献
[1]李琳. 基于python的网络爬虫系统的设计与实现[j]. 信息通信, 2017(9).
[2] 贾棋然. 基于python专用型网络爬虫的设计及实现[j]. 电脑知识与技术:学术交流, 2017, 13(12):47-49.
[3] 王碧瑶. 基于python的网络爬虫技术研究[j]. 数字技术与应用, 2017(5):76-76.
3. 毕业设计(论文)进程安排
2018-1-2 ~2018-1-12 布置设计任务、学习基本知识 2018-1-12 ~2018-2-10 查阅文献、翻译文献、完成绪论 2018-2-11 ~2018-2-20 撰写开题报告、撰写PPT 2018-2-21 ~2018-3-1 修改开题报告并进行开题答辩 2018-3-2 ~2018-3-30 掌握常规爬虫算法和分析算法 2018-4-1 ~2018-4-30 编程实现所用算法 2018-5-5 ~2018-5-15 运用matlab进行模拟仿真,作出性能对比实验;给出展示界面 2018-5-16 ~2018-5-25 撰写毕业论文初稿、改进系统程序 2018-5-26 ~2018-6-14 撰写毕业论文终稿 6-15之前 提交所有毕业设计正式材料电子稿与打印稿 2018-6-15 ~2018-6-18 准备答辩 2018-6-19 ~2018-6-23 答辩