基于深度学习的文本情感分类任务书
2020-04-12 15:37:33
1. 毕业设计(论文)主要内容:
随着web 2.0时代的蓬勃发展,互联网上出现了大量的数据。人们在博客,微博,产品评论,电影评论,网络讨论群等区域留下了非常多的文本信息。这些非结构化的文本中包含了作者的思想,情感,观点以及看法。如果能够从这些非结构化的数据中提取出情感数据,将会推动自动抉择支持、网络舆情风险分析、信息预警、商品销售的发展,在科研以及实际应用中具有非常大的价值。传统的用于解决文本情感分析问题的方法包括基于知识的方法,基于统计的方法以及混合的方法。在数据量不大或者语义不够丰富的时候,这些方法能够取得一定的效果。基于深度学习的方法在自然语言处理领域已经取得了比传统的机器学习方法更好的效果。采用深度学习神经网络来发现与任务相关的特征,避免依赖于具体任务的人工特征设计,并根据句子词语间前后的关联性引入情感极性转移模型加强对文本关联性的捕获。
设计内容:
1、 文本的预处理:由网络爬虫等工具爬取到的原始语料,通常都会带有不需要的信息,比如额外的html标签,所以需要对语料进行预处理。使用python作为预处理工具,其中的用到的库有numpy和pandas,而主要的文本工具为正则表达式;
2. 毕业设计(论文)主要任务及要求
完成的主要任务及要求
1.查阅15篇相关文献(含2篇外文),并每篇书写200—300字文献摘要(装订成册,带封面);
2.认真填写周记,完成800字开题报告;
3. 毕业设计(论文)完成任务的计划与安排
(1)2018/1/14—2018/3/5:确定选题,查阅文献,外文翻译和撰写开题报告;
(2)2018/3/6—2018/4/30:系统架构、程序设计与开发、系统测试与完善;
(3)2018/5/1—2018/5/25:撰写及修改毕业论文;
(4)2018/5/26—2018/6/6:准备答辩。
4. 主要参考文献
[1]hogenboom a, frasincar f, de jong f, et al. using rhetorical structure in sentiment analysis[j].communications of the acm, 2015, 58(7): 69-77.
[2]dong l, wei f, tan c, et al. adaptive recursive neural network for target-dependent
twittersentiment classification[c]. acl (2), 2014: 49-54.