微博信息分析程序的设计与实现开题报告
2020-04-01 11:03:51
1. 研究目的与意义(文献综述)
1.1目的及意义
微博作为迅速崛起的新兴社会媒体,在网络言论领域日益引起研究者的关注。面对互联网上海量的数据信息,我们无法想象仅仅通过人工的方式来对互联网言论进行全面监控的难度。截至2017年9月,微博月活跃用户共3.76亿,与2016年同期相比增长27%,其中移动端占比达92%;日活跃用户达到1.65亿,较去年同期增长25%,微博已然明显成为海量网络言论最重要的发声阵地。 言论是舆论情况的直接载体,是指在一定的社会空间内,围绕社会事件的发生、发展和变化,作为主体的民众对作为客体的社会管理者及其态度取向产生和持有的社会倾向和态度。 它是较多群众关于社会中各种 现象、问题所表达的信念、态度、意见和情绪等等表现的总和。由于微博的自由和开放、交互、虚拟和隐蔽、以及言论的快速传播,使以往在传统媒体中无法实现的个人表达自由和言论自由得到空前的发展,与传统言论相比,网络言论具有传播快速和实时互动的特点。网络的出现使得地球村的梦想得以实现,一条消息可以在瞬间传遍世界。每一个网民都可以实时地发表自己的观点,共同讨论或辩论,不同观点或立场的网民进行交锋,可以通过互动推动舆情的发展或深化,引起更多人的关注,从而对社会生活的各个方面产生极大的影响。我们在利用网络的力量实现信息快速共享的同时,也应该警惕别有用心者利用微博等平台的造谣传谣。因此,结合网络信息采集技术和文本信息自动处理等技术研发一个网络言论自动监控系统将有利于社会管理者们及时了解网络舆情的状态和趋势,因而可以对发现的热点舆情及时进行干预,引导疏通民众情绪和心理,避免矛盾的进一步恶化而造成更大的社会损失。现有舆情监测系统在采集、检索和分析模块中都是采用基于统计和特征关键词的方法,由于忽略了文本中的语义信息往往会导致分析结果的不精确。本毕业设计主要针对当前微博中用户信息抓取、热点信息挖掘以及态度倾向甚至情绪的分析统计等机制进行设计与实现,对系统的整体框架进行了设计,将系统分成数据获取、数据存储、数据分析几个主要模块,尽可能提升系统的稳定性与可扩展性。
2. 研究的基本内容与方案
2.1基本内容
设计以及开发出一款面向政府,企业,及个人的分析软件工具,完成对微博含搜索关键词的微博用户信息及微博信息的获取,同时完成对所抓取博信息的存储。构建微博信息索引库,为高效的微博信息查询和分析提供支持。能够支持微博信息的全文检索,以及检索结果的可视化。
2.2采用的技术方案
3. 研究计划与安排
(1)2018/1/18—2018/3/5:确定选题,查阅文献,外文翻译和撰写开题报告;
(2)2018/3/6—2018/4/30:系统架构、程序设计与开发、系统测试与完善;
(3)2018/5/1—2018/5/25:撰写及修改毕业论文;
4. 参考文献(12篇以上)
[1]张岚岚 新浪微博的网络舆情分析研究 华东师范大学 2011
[2]朱少龙 基于微博的社会化媒体分析系统的设计与实现 哈尔滨工业大学 2011
[3]田董涛 微博客数据的获取与分析方法研究 北京交通大学 , 2012
[4]罗一纾 微博爬虫的相关技术研究 哈尔滨工业大学 - 2013
[5]范巍 - 微博爬虫研究与实现 《硅谷》 - 2013