基于FOA--SVM的文本分类系统分析任务书
2020-06-08 21:19:13
1. 毕业设计(论文)的内容和要求
文本分类技术是大规模文本处理的第一步,能有效地提高文本的使用效率和质量。
它对待分类文本的内容进行分析,根据事先确定的若干分类规则,将待分类文本分配到给定的一个或多个类别中。
本课题基于svm实现对文本的自动分类,并设计一个简易的文本分类系统。
2. 参考文献
[1]刘伟丽,基于粒子群算法和支持向量机的中文文本分类研究[D],河南:河南工业大学,2010. [2] 王岩,张波,薛博. 基于FOA- SVM的中文文本分类方法研究[J]. 四川大学学报,2016,53(4):759-763 [3]王惠仙. 基于的中文文本分类相关算法研究与实现[D].昆明:昆明理工大学,2011. [4] 徐 丽,伏玉琛,李 斯. 一种改进的 SVM 决策树 Web 文本分类算法[J]. 苏 州 大 学 学 报,2011,31(5):7-11 [5]李 琼,陈 利. 一种改进的支持向量机文本分类方法[6]. 计 算 机 技 术 与 发 展,2015,25(5):78-82 [7]张玉芳 , 万斌候 , 熊忠阳 . 文本分类中的特征降维方法研究 [J]. 计算机应用研究,2012,29(7):2541-2543. [8] 井志强. 基于扩展的 VSM 中文文本分类方法[D].哈尔滨工程大学, 2010. [9] 代六玲,黄河燕,陈肇雄. 中文文本分类中特征抽取方法的比较研究[J]. 中文信息学报,2004,l8(1):26-32. [10] 刘斌,黄铁军,程军.一种新的基于统计的自动文本分类方法[J].中文信息学报,
3. 毕业设计(论文)进程安排
1-8至1-20 查阅中英文资料20篇以上熟悉相关算法等。
1-20至1-31 提交打印好的文献综述及开题报告(围绕任务书,完成方案论证,工作思路等) 2-1至2-15学习SVM、决策树等基本原理和实现 3-16至4-26 学习使用分词工具和利用java设计界面 4-27至5-17 将文本分类步骤融入界面中,形成可操作的文本分类系统 5-18至6-08 10000字以上论文撰写,准备300字的英文摘要,完成论文提交 6-09至6-15 论文答辩