基于深度学习的中文新闻文本分类研究任务书
2020-02-18 15:56:45
1. 毕业设计(论文)主要内容:
文本数据蕴含了丰富的信息,但由于具有非结构化的特点,计算机无法直接进行计算处理,无法获取到有价值的信息,文本分类技术作为组织和处理大量文本数据的关键技术,得到了快速的发展。文本分类技术的核心在于文本的向量化表将文本空间看作由一组词条组成的向量空间, 文本中每个不同的词条表示向量空间中的独立一维。完成文本表示后,搭建卷积神经网络(CNN),利用卷积操作,用filter在数据上进行滑动,通过多次卷积操作将数据特征进行提取,然后拼接池化层将数据进行降维,最后用全连接层把特征向量进行拼接,并送入分类器进行分类。最后利用测试集测试分类器的性能,通过反馈学习提高分类器的性能。
2. 毕业设计(论文)主要任务及要求
(1)查阅相关文献资料15篇以上(其中近5年外文文献不少于3篇)。
(2)完成开题报告及任务书。
(3)构造数据集,构造网络模型,利用python对数据集进行仿真,完成训练及分类。
3. 毕业设计(论文)完成任务的计划与安排
(1)第1-4周:查阅相关文献资料,明确研究内容,了解研究所需理论基础。确定方案,完成开题报告。
(2)第5-6周:熟悉掌握基本理论,完成英文资料的翻译,熟悉相关工具软件的使用。
(3)第7-9周:构造网络模型,搭建仿真环境。
4. 主要参考文献
[1] greff k,srivastava r k,koutník j,etal. lstm:a search space odyssey. ieee transactions on neural networks andlearning systems . 2017
[2] mikolov t,chen k,corrado g,et al. efficientestimation of word representations in vector space.https://arxiv.org/abs/1301.3781 . 2017
[3] 王恰. 基于attentionbi-lstm的文本分类方法研究[d].华南理工大学,2018.