新浪微博與情监控系统的设计与实现开题报告
2020-05-31 20:48:11
1. 研究目的与意义(文献综述包含参考文献)
文 献 综 述 一、系统开发的背景 现如今的人们正处在一个信息爆炸的时代,人是信息的传播者更是信息的制 造者。
过去,主要的信息传播工具是报纸、电视等,但是在今天,人们已经被新 媒体所包围。
新媒体的新不仅仅是通信手段的新,更重要的是,它改变了普通群 众在社会舆论中的位置。
剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!
2. 研究的基本内容、问题解决措施及方案
本课题要研究或解决的问题和拟采用的研究手段(途径): 一、研究内容 爬虫:使用scrapy框架,首先爬取最近有动态的微博用户信息存入数据库中,再以这些活跃用户为基数爬取他们的微博。
这里我们使用redis去重。
增量式爬取我们通过用户微博是否已存在来进行判断,若已存在则放弃,不存在就存进数据库。
剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付