基于朴素贝叶斯的电影评论情感分析文献综述
2020-04-18 20:47:55
文 献 综 述 一、 选题背景 随着互联网的发展,越来越多的用户倾向于在各种网站上发表自己的评论,分享来自自己的经验。
这些评论文本表达了评论者的观点和情感,人们也习惯于聪各种评论文本中获取信息,寻求一些参考意见。
分析互联网上的评论文本,挖掘出其中潜在的信息,具有巨大的应用价值。
但随着互联网信息的增长,评论信息的数据量越来越大,人们急需一种自动化的工具在大量的评论文本中迅速获取真正需要的信息。
情感分析最重要的一项任务就是将带有观点或者情感的一篇评论分类为褒义或者贬义,也成为文本情感极性分类。
褒义意味着评论的作者喜爱评论的对象,贬义意味着评论的作者不喜欢评价对象。
本文重点阐述文本极性分类的方法和相关综述。
本文通过首先从自然语言中提取出特征,然后对特征进行适当的分类器训练。
第一步采用Word2Vec方法从句子当中提取出特征,之后采用朴素贝叶斯对特征进行训练。
二、 研究现状 情感分析是国内外研究的热门领域,国外最早由Turney等人对汽车,银行,电以及旅游四个领域的评论文章做出分类,其提出以简单的PMI-IR(Ponit wise Mutual Information-Informationg Retrieval)算法计算文章的语义导向(Semantic Orientation),此种非监督式算法不需要大量人工标记文本,利用特征词库提供带有情感的词,例如”精彩”,”好看”等就可进行分类,且分类结果除了显示正面或负面情感之外,还可了解正面或负面情感的深度。