新浪微博與情监控系统的设计与实现毕业论文
2022-02-13 20:51:21
论文总字数:23386字
摘 要
互联网信息正在以指数级爆炸式的增长,海量的数据中包含着很多有用的信息,人们开始习惯于在互联网上发表自己对人事物的观点。目前新浪微博是一个用户活跃度较高的网络社交平台,它有别与qq,微信等社交工具,是面向整个网络世界,其拥有海量数据,涉及社会的方方面面。这些数据中拥有很多有价值的信息,但是这些信息很零碎,我们难以手动从中观察总结出来。因此,我们需要通过计算机来帮助我们处理。通过网络爬虫技术和自然语言处理技术等,我们可以高效方便的提取出有用的信息。我们实现出网络舆情实时监测系统,将使我们迅速的发现网络上的舆情,并分析出它们的发展趋势,并及时的对这些社会舆情作出干预和控制。
微博與情监控系统工作流程包含了微博内容爬取、数据预处理、情感极性分析、信息展示等几个部分。本文分析了與情监测系统的研究背景和当下研究的现状,接着,通过用例图的方式,展示了整个系统的结构,并介绍了监控系统一些相关的知识,阐述了系统实现的原理和所用到的目前比较火热的计算机技术和自然语言文本处理技术。随后,详细阐述了系统的功能作用及实现的具体细节,描述系统的开发结果并展示实际运行情况。最后,本文对监控系统目前存在的问题作出了说明,并提出下一步工作内容。
关键词:微博 热点话题 爬虫 情感分析
Design and Implementation of Sina Weibo Public Opinion Topic Monitoring System
Abstract
Internet information is exploding-type growth, massive data contains a lot of useful information, people began to get used to the Internet to express their views on people. Sina microblogging is a user active high social networking platform, it is different from qq, WeChat and other social tools, is for the entire network world, with its massive data, involving all aspects of society. These data have a lot of valuable information, but the information is very fragmented, we can not manually from the observation summed up. Therefore, we need to help us through the computer. Through web crawler technology and natural language processing technology, we can efficiently and easily extract useful information. We realize the network public opinion real-time monitoring system, will enable us to quickly find the public opinion on the network, and analyze their development trends, and timely intervention and control of these social public opinion.
Microblogging and Public Opinion Topic system workflow includes microblogging content crawl, data preprocessing, emotional polarity analysis, and the situation show several parts. This paper analyzes the research background of the situation monitoring system and the current situation of the present research. Then, through the use case diagram, the structure of the whole system is presented, and some related knowledge of the monitoring system is introduced. The principle of the system realization and the The current relatively hot computer technology and natural language text processing technology. Then, it elaborates the function of the system and the concrete details of the realization, describes the development results of the system and shows the actual operation. Finally, this paper describes the current problems of the monitoring system, and put forward the next step.
Key words: Microblogging ;Public Opinion ;Spider ; Emotional Analysis
目录
摘要 I
Abstract II
第一章 引言 1
1.1 项目背景 1
1.2 研究现状 1
1.2.1 国内外舆情监测研究状况 1
1.2.2 国内外微博影响力分析现状 3
1.3 论文结构安排 4
1.4 本章小结 5
第二章 新浪微博與情监控系统开发相关技术的介绍 6
2.1 网络舆情 6
2.2 與情监控工作原理 6
2.3 体系结构图 6
2.4 舆情监测主要技术 7
2.4.1 自然语言处理技术 9
2.5 本章小结 9
第三章 关键技术解决方案 10
3.1 信息抓取 10
3.2 分词以及词性标注 12
3.3 关联规则 15
3.4 信息审查 16
3.5 网站展示 18
3.6 本章小结 18
第四章 系统总体设计 20
4.1 系统框架 20
4.2 需求分析 21
4.3 具体实现 21
4.3.1 数据库 21
4.3.2 信息抓取模块 23
4.3.3 分词模块 24
4.3.4 情感识别系统 25
4.4 信息展示 26
4.5 开发过程中遇到的问题与解答 27
4.6 本章小结 28
第五章 系统测试 29
5.1 系统测试平台 29
5.2 系统测试问题 29
5.3 系统测试解决方案 31
第六章 总结与展望 32
参考文献 33
致谢 35
引言
项目背景
请支付后下载全文,论文总字数:23386字