基于深度学习的电影评论情感分析系统毕业论文
2021-12-15 23:09:37
论文总字数:29236字
摘 要
随着互联网技术的进步,人们越发地喜欢在网络上发表影评,通过影评,电影投资人能够更加便利地获取观影用户对于电影的反馈,从而做出更加可靠合理的电影投资决策,观影者可以通过影评选择观看电影,当然要达到这些目的,对网络上大量的影评进行合理的数据分析是必要的,这必须借助计算机的手段来完成,在这个领域中,情感分析是一个非常重要的课题。但是对于中文电影评论的情感分析大多还是采用的基于情感词典和机器学习等陈旧的方法,而且大多的工作仅仅停留在研究上,未能将其真正应用。
本文首先论述了情感分析的发展现状,并概述了用于进行情感分析的深度学习技术的相关概念,包括词向量、神经网络、卷积神经网络(CNN)、递归神经网络(RNN)、长短期记忆网络(LSTM)和双向长短期记忆网络(BiLSTM),并说明了本文将要使用的相关技术包括TensorFlow和Flask等。接着本文介绍了使用word2vec方法对豆瓣短评语料训练词向量模型,搭建并训练了CNN、LSTM、BiLSTM三种神经网络进行电影情感分析,将训练完成的模型使用Flask框架部署为WEB应用的过程,并论述了对三款模型的测试比对。
关键词:情感分析、深度学习、Flask框架、word2vec
Sentiment Analysis of Chinese Movie Review Based on Deep Learning
Abstract
With the advancement of Internet technology, people increasingly like to post movie reviews on the Internet. Through movie reviews, movie investors can more easily obtain feedback from movie users on movies, making their investment more reliable and reasonable. Filmmakers can choose to watch movies through film reviews. Of course, to achieve these goals, a reasonable data analysis of a large number of film reviews on the Internet is necessary. This must be done by means of computers. In this field, Sentiment analysis is a very important subject. However, most of the sentiment analysis for Chinese movie reviews is based on obsolete methods such as sentiment dictionaries and machine learning. Most of the work only stays on research and fails to apply it.
This paper first discusses the development status of sentiment analysis, and outlines the relevant concepts of deep learning technology for sentiment analysis, including word vectors, neural networks, convolutional neural networks (CNN), recurrent neural networks (RNN), long and short term Memory Network (LSTM) and Bidirectional Long-Short-Term Memory Network (BiLSTM), and explained that the related technologies to be used in this paper include TensorFlow and Flask. Then this article introduces the use of word2vec method to train the word vector model of Douban short comment material, build and train three neural networks CNN, LSTM, BiLSTM for movie sentiment analysis, and deploy the trained model to the web application using Flask framework And discusses the test comparison of the three models.
Key Words: Sentiment Analysis, Deep Learning, Flask Frame, word2vec
目 录
摘 要 I
Abstract II
第一章 绪论 1
1.1 课题研究背景与意义 1
1.2 国内外研究现状 2
1.3 本文主要的研究工作 3
1.4本文组织结构 4
1.5 本章总结 4
第二章 相关技术与概念介绍 5
2.1使用语言与相关库介绍 5
2.2 词向量 6
2.3 神经网络 8
2.4 卷积神经网络 11
2.4.1卷积层 12
2.4.2 池化层 12
2.5 循环神经网络 12
2.5.1 长短期记忆网络 13
2.5.2 双向长短期记忆网络 15
2.6 本章总结 16
第三章 系统设计与神经网络模型分析 17
3.1 系统设计 17
3.2 预处理模块 18
3.3 深度学习模块 19
3.3 模型部署模块 22
3.4 本章总结 22
第四章 系统具体实现与评测 23
4.1预处理模块实现 23
4.1.1 本次实验采用的数据集介绍 23
4.1.2 分词与数据清洗实现 23
4.1.3词向量模型实现 24
4.2 深度学习模块实现 25
4.2.1 LSTM与BiLSTM模型实现 25
4.2.2 CNN模型实现 26
4.2.3 模型的训练与测试 27
4.3 模型部署的实现 28
4.3.1 模型预测函数实现 28
4.3.2 FLASK框架创建以及路由到网页 29
4.3.3 模型选择功能实现 30
4.3.4 词向量分析功能实现 31
4.3.5 情感分析功能实现 32
4.3.6 爬虫模块实现 33
4.4 实验结果与展示 34
4.4.1 神经网络模型训练与测试结果 34
4.4.2 WEB应用展示 38
4.5 本章小结 40
第五章 总结与展望 41
5.1 本文工作总结 41
5.2 进一步工作展望 41
参考文献 42
致谢 44
绪论
1.1 课题研究背景与意义
看电影一向是很多人业余的爱好之一,国内电影市场近几年一直保持增长态势,当下,我国在全球电影行业中已经处于领先地位。面对如此庞大的电影行业,也带来了一些问题,其中最重要的问题之一便是电影质量的参差不齐,每个月都有很多电影上映,但是这其中能被称为佳作的作品却寥寥无几,这也给观影人在选择观影上带来了困扰。
随着互联网信息技术以及社交网络技术的蓬勃发展,中国的互联网使用者的数量急剧增长。伴随着互联网的普及,人们越发喜爱在网络上发表自己对于各种事物的看法,比如在电商平台上对商品进行评价,在微博上对时事发表见解等。对于影视业,互联网的发展也带来了很大的变化,越来越多的人喜欢在网上发表影评,每当一部新的影片上映后,很快就会在各大电影购票网站、电影影评网站或论坛上看到关于这部影片的各种评价,这些评价对于观影人和电影投资者都是十分有用的信息,对于观影人来说,可以在观影前对各个电影有一个初步的了解,找到适合自己的且制作精良的佳作,避免浪费很多时间选择影片或者观看一部自己不喜欢的电影;对于电影投资者来说,及时获取观影者们的观影反馈,可以有助于自己选择投资当前热门,受欢迎的影片类型,或者及时调整自己的投资策略迎合市场的变动以达到投资最优化的目的。
请支付后下载全文,论文总字数:29236字