基于社交媒体评论的国内外动漫作品成功因素研究毕业论文
2021-11-07 21:12:53
摘 要
近年来,互联网大数据发展迅速,以美团、携程为代表的互联网社交网络渗透到人们“吃喝玩住”等各个方面。其中在电影观影交流方面,以豆瓣网、猫眼网站等为代表的电影评论网站积累了海量的用户评论文本数据。同时在国家的大力扶持下,文娱产业蒸蒸日上,我国的动漫电影表现突出,以《大圣归来》为代表的一系列动漫电影既收获票房佳绩,又收获良好口碑,不断增强国人心中对国产动漫电影崛起的信心。
以观影者的影评文本为数据,分析数据可以得到他们对与影片的情感倾向,从而能够为影片创作者提供反馈意见,了解观众口味能够指导影视业贴近市场需求,往更好的方向发展,制作出更受欢迎的电影。本文针对近5年中,票房与口碑均为佳绩的4部中外动漫电影的影评数据行了情感分析和主题提取,通过在现有情感词典的基础上,完善针对动画电影的情感词语,从而判断出评论的情感倾向。最后,将 LDA 非监督机器学习技术运用到对处理的文本数据中,识别每条评论涉及的主题,以及其情感得分。
关键词:文本挖掘;影评情感分析;python 爬虫;LDA
ABSTRACT
In recent years, Internet big data has developed rapidly, and Internet social networks represented by Meituan and ctrip have penetrated into people's "eating, drinking, playing and living" and other aspects.In terms of movie viewing communication, film review websites represented by douban.com and maoyan have accumulated a huge amount of user comment text data.At the same time, under the strong support of the state, China's animation films performed well in the cultural industry. A series of animation films, represented by Monkey King: hero is back, not only achieved great success at the box office, but also gained a good reputation, constantly enhancing the confidence of the Chinese people in the rise of domestic animation films.
Based on the film review text of the audience, the analysis of the data can obtain their emotional preference for the film, so as to provide feedback to the film creators. Understanding the audience's taste can guide the film industry to meet the market demand, develop in a better direction, and produce more popular films.Based on the review data of four Chinese and foreign animation films with good box office and public praise in the past five years, this paper carries out emotion analysis and theme extraction. On the basis of the existing emotion dictionary, this paper improves the emotional words for animation films, so as to judge the emotional tendency of comments.Finally, LDA unsupervised machine learning techniques were applied to the processed text data to identify the subject of each comment and its sentiment score
Key words:Text mining;Emotional analysis of film reviews;Python crawler; LDA
目录
第一章 绪论 1
1.1 研究背景及意义 1
1.1.1 研究背景 1
1.1.2研究目的 1
1.2文献综述 2
1.2.1文本情感分析国内外研究现状 2
1.2.2主题提取研究现状 3
1.3研究内容及研究方法 4
1.3.1研究基本内容 4
1.3.2研究的技术方案及措施 5
第二章 文本挖掘的主要方法介绍 6
2.1 情感分析相关介绍 6
2.2 LDA主题模型介绍 6
第三章 网站影评文本获取 8
3.1豆瓣与猫眼网站影评文本相关概念介绍 8
3.1.1豆瓣电影网站 8
3.1.2猫眼电影 8
3.2 文本评论信息的确定 9
3.2.1豆瓣电影网站 9
3.2.2猫眼电影 10
3.3 文本信息的获取——基于Python网络爬虫技术 10
3.3.1豆瓣电影 11
3.3.2猫眼电影 11
第四章 基于情感词典方法的分析 13
4.1构建情感词库 13
4.2文本数据预处理 13
4.2.1数据清洗 13
4.2.2对文本进行分词和停用词剔除 13
4.3计算各类情感得分 15
第五章 基于LDA模型的文本主题提取 19
5.1词频分析 19
5.2基于LDA模型的文本主题提取 21
5.2.1文本主题提取 21
5.2.2文本主题情感分析 24
第六章 总结与展望 27
6.1本文工作总结 27
6.2局限与改进 27
参考文献 29
致谢 30
绪论
1.1 研究背景及意义
1.1.1 研究背景
电影是一种具有文化属性的特殊服务性商品。从商品角度来说,由于影视作品运营的周期,在前期策划拍摄制作过程的成本较高,往往承担着较高的风险,具有高投资和高风险的特征。而同时,电影作为文化传播的一种载体,在互联网时代下,已成长为大众文化发展的重要通道。尤其商业电影作为文化性商品,具有大众文化的流行性和娱乐性,在商业市场上既需要收获商业价值,在文化市场又必须具备一定的正向文化输出。其中,动漫电影由于其受众的年轻化,更需要考量文化价值,向青少年群体输出正确文化导向。
不管是市场、文化、消费者各方面,都希望看到既卖座,又能口碑爆棚深受观众喜爱的电影。我国的动漫发展较为曲折,新世纪之前被好莱坞和日本动画占据主导地位,进入21世纪后,在国家对影视动画行业支持下,国产动画不断成长创新,逐渐涌现一批优秀的国产动漫电影,这些影片先后口碑发酵,成为脍炙人口的佳作。在互联网飞速发展的今天,社交媒体凭借着便捷及时分享等诸多优势,逐渐成为影视作品的宣发平台,其中,微博豆瓣等社交平台以超话、讨论组等方式聚焦某部电影,吸引许多影迷在电影上映前及上映后表达期待及在观看后分享影评,由观影者产出影评从而达到推荐宣传的方式,客观上为优秀电影口碑发酵提供助推力。正是基于我国网民数量庞大,微博、豆瓣等社交媒体发挥了不小作用,影评更能记录每位观影者对电影的喜爱或批评。通过分析观众的影评,更能了解市场,了解优秀动画电影被市场喜爱的因素。
1.1.2研究目的
本文通过爬取分析微博、豆瓣等社交媒体中对近年《西游记之大圣归来》《白蛇:缘起》等这样优秀动画电影的影评,分析这些优秀动画电影广受消费者喜爱的因素,并将影响因素进行排名。分析动画电影的受众需求与期待,统计分析挖掘观众对动画电影制作技术日渐成熟的期望,及观众对这些社会现象的态度、价值取向,为日后国产动画电影口碑票房双赢带来启示。由于电影属于文化产品,在大众流行文化当中,兼具商品和文化属性,因此本文所探讨的成功影视作品为,在豆瓣和猫眼平台中评分不低于7.0,同时在当年国内市场中票房排名在前20%的影片。