针对哔哩哔哩弹幕网的舆情信息采集系统的分析与设计开题报告
2022-01-14 21:13:14
全文总字数:2748字
1. 研究目的与意义及国内外研究现状
随着互联网使用人数的不断增多,更多的人可以在互联网的平台上发表他们的评论,这些评论可能包括对某一事物的喜好,对某一时事的评讨,对某个知识的讲解或解释,当然还有可能会有居心叵测的人发表煽动人心的言论。无论这些言论价值观是普世的还是负面的,随着数量的增多,如果不能合理的对其分析和引导,将会是一个非常大的隐患。这也要求政府和互联网企业做好舆情的监控和引导。这也是本系统分析设计的一个非常重要的原因之一,这个原因也是主要原因。
由于在互联网上发表言论的人,多是匿名的或半匿名(半匿名指发表言论者如果未主动透露自己的信息,普通网民无法知道发表言论者的真实身份,只能知道其昵称,但是施行互联网实名制的互联网平台方是能够知道的)的,所以这些言论更能表达言论者内心的真实想法,这比线下的民意调查要更加的有价值。这也是本设计本系统的另一个原因。
2. 研究的基本内容
本次设计分析并设计了一个针对哔哩哔哩弹幕网,基于爬虫的,面向开发者和研究人员的舆情信息采集系统。主要内容为开发运行环境的搭建与测试,需求及技术分析,系统详细设计及实施,最终总结。主要涉及到了以下几个计算机相关的领域:Web安全与测试,App安全与测试,Web开发,跨平台GUI开发,数据分析。涉及的技术更是有:正则表达式,爬虫及反爬虫(反反爬虫)技术,基于xml的GUI设计,中间人攻击,xpath等。
3. 实施方案、进度安排及预期效果
方案主要分为三步,即环境的部署,各模块的分析实施,最后的整合发布。
整个设计过程在一个月内完成。
1.第一周进行对国内外采集系统和爬虫的研究,总结和本次设计的目标和具体需求;
4. 参考文献
[2] myers d, mcguffee j w. choosing scrapy[m]. 2015.
[3] 陈利婷. 大数据时代的反爬虫技术[j]. 电脑与信息技术, 2016, 24(6):60-61,共2页.
最新文档
- 华北地区夏季降水多年、少年近地层水汽场及风场分布特征开题报告
- 天山地区典型流域降雪分布研究文献综述
- 2016年台风狮子山路径突变原因的初步分析开题报告
- 北京和寿县地区边界层急流观测与模型的对比文献综述
- 具有双Kelvin波结构MJO活动的再分析开题报告
- 基于单片机的温控风扇设计文献综述
- 1961-2015年江苏省气候资源的时空分布规律开题报告
- 智能搬运机器人文献综述
- 基于类型的电影推荐系统文献综述
- Bi6S2O15的合成及其降解有机污染的研究开题报告
- 不确定时滞奇异摄动系统的鲁棒控制器设计文献综述
- 小型双模SIW滤波器的研究与设计开题报告
- 我国绿色出行政策执行研究——以南京市为例文献综述
- 试论李碧华小说中的爱情悲剧开题报告
- 基于FPGA的电子相册设计文献综述