登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 毕业论文 > 计算机类 > 计算机科学与技术 > 正文

细粒度情感分析的研究毕业论文

 2021-11-07 21:01:50  

摘 要

随着电商业务的快速发展,网络上的商品评价和电影评论越来越多,正确识别评论的情感极性对用户和商家都有重要作用。目前,情感分析工作大都集中在粗粒度层面上,即只能对句子或文档进行情感分类,而这种情感分析不能更加细致地分析出评论中不同属性的情感。基于此背景,方面级细粒度情感分析任务受到广泛重视。方面级细粒度情感分析通过抽取评论的不同方面属性或由专家定义评论的属性集合进行不同方面属性的情感分类,充分表达评论的情感信息,在挖掘用户情感、个性化推荐、业务安全等领域意义重大。

传统的情感分析解决方案有基于机器学习的方法和基于词典的方法,这两种解决方案都需要人工构建高质量的情感词典或者特征,不能适应通用领域。鉴于此,本文研究了深度学习方法在方面级细粒度情感分析上的应用,主要内容如下:

(1)基于Word2vec构建词向量,相较于传统的独热式编码,解决了维度爆炸问题和语义表达问题。

(2)本文将细粒度情感分析问题建模为多标签分类问题,提出Bi-LSTM Attention的网络结构,可有效的捕捉上下文语序和语义信息,将注意力集中在与特定方面有关的情感极性词上,相较于SVM、fastText、RNN模型,评价指标F1值分别提升了76.0%,18.9%,6.4%。

关键词:细粒度;情感分析;Bi-LSTM;Attention

Abstract

With the rapid development of e-commerce services, there are more and more product reviews and movie reviews on the Internet, and correctly identifying the emotional polarity of reviews has an important role for users and businesses. At present, most sentiment analysis work is concentrated on the coarse-grained level, that is, only sentiment classification can be performed on sentences or documents, and this sentiment analysis cannot analyze the sentiment of different attributes in comments in more detail. Based on this background, aspect-level fine-grained sentiment analysis tasks have been widely valued. Aspect-level fine-grained sentiment analysis classifies sentiment classification of different aspects by extracting different aspects of reviews or attribute collections defined by experts to fully express the sentiment information of reviews. It can be used in mining user emotions, personalized recommendations, business security and other fields major.

Traditional sentiment analysis solutions include machine learning-based methods and dictionary-based methods. Both of these solutions require manual construction of high-quality sentiment dictionaries or features, and cannot be adapted to the general field. In view of this, this paper studies the application of deep learning methods in aspect-level fine-grained sentiment analysis. The main contents are as follows:

(1) Construct word vectors based on Word2vec. Compared with traditional one-hot encoding, it solves the problem of dimensional explosion and semantic expression.

(2) In this paper, the fine-grained sentiment analysis problem is modeled as a multi-label classification problem, and the network structure of Bi-LSTM Attention is proposed, which can effectively capture context word order and semantic information, and focus attention on the emotional poles related to specific aspects. In terms of sex, compared with SVM, fastText, and RNN models, the evaluation index F1 value was increased by 76.0%, 18.9%, and 6.4%, respectively.

Key Words:Fine-grained;sentiment analysis;Bi-LSTM;Attention

目 录

第1章 绪论 1

1.1研究工作的背景与意义 1

1.2国内外研究历史与现状 1

1.3论文的组织结构 2

第2章 情感分析方法的研究 3

2.1情感分析常见任务 3

2.2情感分析解决方案 4

2.3 本文的主要工作 5

第3章 细粒度情感分析模型实现 7

3.1任务分析 7

3.2模型设计 7

3.2.1词嵌入层 8

3.2.2LSTM层 10

3.2.3注意力机制层 12

3.2.4全连接层 15

3.3本章小结 16

第4章 实验结果与分析 17

4.1实验数据与评价标准 17

4.2实验环境和实验流程 18

4.3对比实验 19

4.4实验结果与分析 19

4.5本章小结 21

第5章 总结与展望 22

5.1本文工作总结 22

5.2未来工作展望 22

参考文献 23

致谢 25

第1章 绪论

1.1研究工作的背景与意义

根据第45次《中国互联网络发展状况统计报告》[1]显示,我国的网民数量一共为9.04亿,约占全国人口总数的64.5%,互联网已成为人们传播和获取信息的主要手段。随着电商业务的快速发展,网络上的商品评论和电影评论越来越多,正确识别评论的情感极性对用户和商家都有重要作用,对于用户来讲,能够通过评论辅助购买决策;对于商家来讲,可通过评论改善服务质量。而人工甄别每条评论的情感极性需要耗费巨大精力,有必要通过自动化的算法来进行情感分析。

目前,情感分析工作大都集中在粗粒度层面上,即只能对句子或文档进行情感分类,而这种情感分析不能更加细致地分析出评论中不同属性的情感,以评论“奶粉品质不错,但就是价格比较高”为例,如果做粗粒度情感分析,无论分类成积极、中性、消极情感都是不合理的,因为评论中针对“品质”是积极的,而针对“价格”是消极的。基于此背景,方面级细粒度情感分析任务受到广泛重视。方面级细粒度情感分析通过抽取评论的不同方面属性或由专家定义评论的属性集合进行不同方面属性的情感分类,充分表达评论的情感信息,在挖掘用户情感、个性化推荐、业务安全等领域意义重大。

1.2国内外研究历史与现状

方面级细粒度情感分析是情感分析的一个子领域,关注细粒度的情感信息抽取。它针对某个实体的许多方面,分别输出针对每个方面的情感极性,广泛应用于电子商务领域。早期的研究方法通常是构建情感词典[2],提取词性信息[3]、语法信息[4]等文本特征信息,采用机器学习算法逻辑回归、支持向量机等进行细粒度情感分析[5][6][7][8]。然而研究表明,这样的方法非常依赖人工特征,极大受句法分析错误的影响,当书面表达不理性时情感分类效果较差。

随着深度学习方法的兴起,贾川等人[9]提出了在循环神经网络中嵌入属性类别信息来进行细粒度情感分析,通过扩大的内部记忆链抽取每个属性类别的情感特征进行情感分类。李慧等人[10]先提取文本的属性词集,然后由此构建特征向量,最后使用多滤波器的CNN模型进行细粒度情感分析。Tang 等人[11]提出了Target-dependent LSTM (TD-LSTM)和 Target-connection LSTM(TC-LSTM)网络模型,该模型将给定的目标作为特征,通过与上下文特征连接实现细粒度情感分析。Wang 等人[12]提出了在LSTM 模型嵌入目标,通过注意力机制有效地提升了神经网络模型对句子的注意力。Akhtar 等人[13]提出了基于多层感知机的金融微博和新闻细粒度情感分析模型。

1.3论文的组织结构

本文研究细粒度的情感分析任务,在整体结构上共分为五章,下面分别介绍每章的主要内容。

您需要先支付 80元 才能查看全部内容!立即支付

企业微信

Copyright © 2010-2022 毕业论文网 站点地图