登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 毕业论文 > 计算机类 > 计算机科学与技术 > 正文

基于深度学习的影评信息情感分析毕业论文

 2021-12-20 20:57:55  

论文总字数:20544字

摘 要

近年来,随着国内经济快速发展,人民生活水平也在逐步提高,人民日益提高的物质文化需求带动了娱乐产业的快速增长,以前只能出门旅游或者在家看电视,而现在高楼林立,广场遍地,商业街不断涌现,看电影从以前的小资情调逐渐变成大众娱乐,电影票房不断创新高。不论是出门观影还是在网络平台观影,观众都会表达自己对电影的看法,这也是豆瓣等影评网站日渐火热的原因。

庞大的影评数据杂乱无章,每个人都表达着自己不同的看法,有时候很多评星并不是那么准确,每个人的评价并不是完全建立在正确的立场上,这种情况就会造成认识的偏差。很多人在观看一部电影前会浏览一些影评网站对该电影的评价,来决定这部电影值不值得观看,值不值得票价,情感分析就是一个很好的方法,大量的数据,准确的神经网络模型可以在中立的立场上,给出一个符合大众的好评率,让电影的质量变得一目了然。

本文以豆瓣网官方提供的百万条电影短评作为语料库,通过网络爬虫对豆瓣短评进行爬取,基于TensorFlow框架搭建循环神经网络模型,运用深度学习方法 LSTM 及SVM模型来进行文本分类,判断评论的情感极性,最后通过可视化技术对情感分析的结果进行展示。

关键词:豆瓣评论 网络爬虫 情感分析 循环神经网络

The Sentiment Analysis of Douban Short Reviews Based on Recurrent Neural Networks

ABSTRACT

In recent years, with the rapid development of the domestic economy, people's living standards have also gradually improved. The people's increasing material and cultural needs have driven the rapid growth of the entertainment industry. Previously, they could only travel or watch TV at home, but now there are many tall buildings and squares everywhere As commercial streets continue to emerge, movie watching has gradually changed from a petty bourgeois sentiment to mass entertainment, and the movie box office continues to hit new highs. Whether watching movies on the go or watching them on an online platform, the audience will express their views on the movie, which is why the movie review sites such as Douban are becoming more and more popular.

This article uses the million movie short reviews officially provided by Douban as a corpus, crawls Douban short reviews through web crawlers, builds a recurrent neural network model based on the TensorFlow framework, and uses deep learning methods LSTM and SVM models to classify texts and judge comments Emotional polarity, and finally display the results of sentiment analysis through visualization technology.

Key Words: Douban reviews; web crawler; sentiment analysis; recurrent neural networks

目 录

摘 要 I

ABSTRACT II

第一章 绪论 1

1.1研究背景 1

1.2 研究现状 1

1.3 本文主要工作 2

1.4 论文组织结构 3

第二章 相关技术 4

2.1 网络爬虫 4

2.1.1 Scrapy与Python语言 4

2.1.2 Scrapy基本结构 5

2.2机器学习相关知识 5

2.2.1 机器学习 5

2.2.2 深度学习 6

2.2.3人工神经网络 6

2.2.4递归神经网络 8

2.2.5 LSTM模型 9

2.2.6 SVM 11

2.3 本章小结 12

第三章 网络爬虫设计 13

3.1 目标数据分析 13

3.2 数据格式 13

3.3 CSS选择器 14

3.4 模拟登陆 15

3.5 数据存储 17

3.6 构建语料库 17

3.7 本章小结 18

第四章 循环神经网络搭建 19

4.1 Keras 19

4.2 TensorFlow 19

4.3 文本预处理 19

4.3.1中文分词 19

4.3.2 去除停用词 19

4.4 构建神经网络模型 21

4.4.1 划分数据集 21

4.4.2 定义网络结构 21

4.4.3 Embedding层 21

4.4.4 Dense层 22

4.4.5 Dropout层 22

4.4.6 LSTM层 22

4.4.7 SVM 23

4.5 模型训练 23

4.6 模型情感预测 24

4.7 本章小结 24

第五章 可视化展示 25

5.1 可视化工具 25

5.1.1 Tensorboard 25

5.1.2 Excel图表 25

5.2 神经网络可视化 25

5.2.1 正确率和损失值 26

5.2.2 模型比较 27

5.3 情感分析可视化 27

5.4 本章小结 28

第六章 总结与展望 29

6.1 总结 29

6.2 展望 29

参考文献 31

致谢 34

第一章 绪论

1.1研究背景

自然语言处理[1]是人工智能和语言学领域中的重要分支学科,它作为计算机科学和人工智能领域一个重要研究方向,目的是研究自然语言中使人与计算机之间可以进行有效交流的方法和理论。

请支付后下载全文,论文总字数:20544字

您需要先支付 80元 才能查看全部内容!立即支付

企业微信

Copyright © 2010-2022 毕业论文网 站点地图