登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 开题报告 > 管理学类 > 信息管理与信息系统 > 正文

网络直播间弹幕文本数据挖掘开题报告

 2020-04-13 13:41:42  

1. 研究目的与意义(文献综述)

随着互联网的迅猛发展与普及,网络信息呈爆炸式的增长,直播行业的火热发展影响着人们日常的娱乐方式。面对信息爆炸的时代,在娱乐方式的转变之下,人们希望能方便快捷地从海量的弹幕信息中获取自己感兴趣的信息,帮助主播了解观众的需求及对于互相交流提供便利,特别是直播网课时学生问题的总结等。这对传统的信息检索、过滤、提取等信息处理技术提出了巨大挑战。而且不同用户对弹幕评论等信息的需求不一样,有人关心学习问题,有人则关心娱乐性质问题,比如说观众对于主播操作的交流需求,这就是看直播的用户倾向性。因此,人们迫切地希望拥有一种工具,能够提取弹幕及评论等任务,自动把相关问题按主题进行组织,并以一定的方式推送给主播及观众,让人清晰地得到弹幕及评价里有用的消息成分,为用户提供高层次高质量服务。

目前针对网络数据处理方面的需求,一般采用的方法还是传统的关键词检索技术(例如:搜索引擎)。然而,由于当前网络信息量太大,流动速度快,与一个人们所关心的主题相关的信息往往孤立地分散在不同的时间段和地方,使得这种传统方法返回的信息冗余度过高,很多不相关的信息仅仅因为含有指定的关键词就被作为结果返回了,造成人们对某些新闻事件难以做到全面地把握,大量有价值的信息不能有效被筛选出来,很多信息白白的损失。

主题检测与追踪(topic detection and tracking,tdt)正是在这种应用背景下产生的,它是一种检测新出现的主题并追踪主题发展动态的信息智能获取技术。主题检测与追踪研究的初期动机是提供一个核心技术,它能够支持预想的系统,该系统能够监控广播新闻并对发生的新的和感兴趣的事件进行分析。应用tdt技术,可以把分散的信息有效地汇集并组织起来,从整体上了解一个主题的全部细节以及该主题中事件之间的相关性,将文本信息按照其表达的主题进行层次式的归类和组织,方便用户的检索浏览和选择使用,也可以主动将专题信息推送给用户,实现个性化服务。可以预见,这个技术在搜索引擎、门户网站建设、信息监控、行业调研、知识管理等领域都有广阔的应用前景。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究的基本内容与方案

基本内容:弹幕及评论网页url爬取,文本的聚类分析,数据的可视化处理

目标:使用文本挖掘算法把直播弹幕评论等信息进行处理,得出对于观众及主播有用的信息,对于网课直播平台,得出学习的有效性笔记,方便学习的温习及知识点的处理,对于live系列直播,得出知识付费的受众方便答主轻易推广,即采用文本挖掘算法,对于信息进行处理,综合得到一些实用的数据结果。

拟采用技术方案:

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 研究计划与安排

1. 2018年2月26日~3月4日(第1周)调查实践、需求分析。

2. 3月5日~3月11日(第2周)完成并上传开题报告。

3. 3月12日~4月8日(第3-6周)技术准备。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 参考文献(12篇以上)

[1] 王虎,张骏. 管理信息系统,第2版. 武汉理工大学出版社,2007.6

[2] 张骏,鄢丹. 信息系统课程设计,北京:科学出版社,2007.7

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

企业微信

Copyright © 2010-2022 毕业论文网 站点地图