基于Few-Shot学习的文本情感分析研究开题报告
2022-01-14 21:46:37
全文总字数:5449字
1. 研究目的与意义及国内外研究现状
随着新兴社交媒体影响力的日益增强,各类话题、评论在网络中迅速传播并造成广泛的影响。分析社交媒体中的公众评论,区分和理解其所表达的喜怒哀乐,具有重要的社会价值、商业价值与科学意义。
纵观文本分析发展历程,特别是文本分类技术,已经发展出了一系列方法。从特征提取来看,可以分为两种典型的分类框架。一是,以词袋模型(bag of words)为基础特征空间,结合词性标注(parts of speech, pos)、n-gram标注等方法,运用浅层学习方法来训练分类模型[1];二是,结合词嵌入(word embedding)技术,即词向量由词袋模型的稀疏向量空间转变为连续的稠密向量空间,运用深度学习方法来训练分类模型[2]。
第一种分类框架在一定时间内获得了较好的成果,但由于其向量空间过于庞大,维度较高且稀疏,在一些短文本分类领域,分类准确率特别低且较难改进。第二种分类框架,在第一种分类框架的基础上克服了向量空间维度较高且稀疏的问题,在分类准确率上获得了一定的改善。
2. 研究的基本内容
针对当前社交媒体文本多分类任务中待解决的关键技术问题,本毕业设计围绕研究建立多类别少样本的文本分类few-shot学习框架、融合多种文本特征以识别更加细致的类别划分以改善模型性能等方面进行深入的研究,并对形成的理论、方法和关键技术进行有效性验证。主要研究内容为:基于原型网络的文本few-shot学习框架,基于注意力机制的双网络文本few-shot学习和半监督文本few-shot学习。
基于图像识别设计的few-shot学习框架并不能直接应用于文本分类。对于短文本,拟设计基于原型网络的few-shot学习框架,在多类别少样本的条件下,学习各类别典型样本的基本特征。此处的原型网络,指的是由深层网络编码映射后的典型样本向量。主要研究内容包括:文本few-shot学习框架和基于聚类的样本多样化。
当样本较少时,需要注意解决模型的泛化性和训练过拟合问题。研究注意力机制的添加方法,增加有效特征输入,进一步改善模型性能。
3. 实施方案、进度安排及预期效果
(1)2019年1月-2019年2月
a. 搜集相关文献,对研究方案开展更深层的理论分析和研究
b. 对已有方法进行分析,总结不足和需要改进之处
4. 参考文献
[1]socher richard, perelygin alex, wu jean y, et al., recursive deep models for semantic compositionality over a sentiment treebank. in conference on empirical methods in natural language processing, emnlp 2013, seattle, wa, 2013, pp. 1631-1642.
[2]preslav nakov, sara rosenthal, svetlana kiritchenko, et al., developing a successful semeval task in sentiment analysis of twitter and other social media texts, language resources and evaluation, vol. 50, no. 1, pp. 35-65, 2016.
[3]http://aclweb.org/anthology/s17-2088