基于LDA算法的识别文章主题的模型任务书
2020-04-18 19:41:10
1. 毕业设计(论文)的内容和要求
当下是一个大数据的时代,我们每个人都参与其中。
在大数据时代,将数据有效的检索并组织呈现出来有着很重要的意义。
在实际生活中我们经常会使用像百度、google这些搜索引擎检索各种信息,但是这些通用性搜索引擎也存在着一定的局限性。
2. 参考文献
[1] 聂颖杰. 基于情感认知和个性化特征的用户兴趣分析方法研究与实现[D].河北科技大学,2019. [2] 李锐,张伟彬.基于TF-IDF算法和LDA主题模型数据挖掘技术在电力客户抱怨文本中的应用[J].自动化技术与应用,2018 [3] 胡六四.基于LDA模型的网页采集算法设计研究[J].大庆师范学院学报,2018,38(06) [4] 苗红,赵润博,黄鲁成,娄岩.基于LDA-SVM分类算法的技术融合测度研究[J].科学学与科学技术管理,2018 [5] 徐守坤,周佳,李宁,石林.基于word2vec和LDA的文本主题[J].计算机工程与设计,2018 [6] 曾平红.基于改进LDA算法的测试用例优先级排序研究[J].佳木斯大学学报(自然科学版),2018 [7] 张小川,余林峰,张宜浩.基于LDA的多特征融合的短文本相似度计算[J].计算机科学,2018 [8] 那天,宋晓宁,於东军.基于主元分析和线性判别分析降维的稀疏表示分类[J].南京理工大学学报,2018 [9] 姚旭升. 基于数据挖掘算法的肠道菌群识别研究[D].昆明理工大学,2018 [10] 赵一方,裴雷,康乐乐.基于段落信息增益的政策文本主题识别研究[J].数字图书馆论坛,2018 [11] 何伟林,谢红玲,奉国和.潜在狄利克雷分布模型研究综述[J].信息资源管理学报,2018,8 [12] 王婷婷,韩满,王宇.LDA模型的优化及其主题数量选择研究#8212;#8212;以科技文献为例[J].数据分析与知识发现,2018 [13] 吴俊江. 基于深度学习的中文文本情感分类及其在舆情分析中的应用研究[D].湘潭大学,2017 [14] 郭红梅,孔贝贝,张智雄.基于多重文本关系图中clique子团聚类的主题识别方法研究[J].情报学报,2017 [15] 王宇. 基于统计学习方法的高斯LDA模型的文本聚类研究[D].华侨大学,2017 [16] Mansor, M.N.,Jamil, S.H.S.M.,Rejab, M.N.,Jamil, A.H.S.M.. Neonates suffocated recognition based on LDA algorithm[P]. Instrumentation Measurement, Sensor Network and Automation (IMSNA), 2012 International Symposium on,2012. [17] Yoo, S.-H.,Oh, S.-K.,Pedrycz, W.. Design of face recognition algorithm realized with feature extraction from 2D-LDA and optimized polynomial-based RBF NNs[P]. ,2013. [18] Thakong, M.,Phimoltares, S.,Jaiyen, S.,Lursinsap, C.. One-Pass-Throw-Away Learning Algorithm Based on Hybridization of LDA and PCA[P]. ,2013. [19] Louvigne, S.,Jie Shi,Kato, Y.,Rubens, N.,Ueno, M.. A corporal and LDA analysis of abstracts of academic conference papers[P]. ,2013. [20] Dexin Zhao,Jinqun He,Jin Liu. An improved LDA algorithm for text classification[P]. Information Science, Electronics and Electrical Engineering (ISEEE), 2014 International Conference on,2014.
3. 毕业设计(论文)进程安排
2019年1月15-2019年1月20 查找相关资料文献,做好毕业设计所需相关软件的准备工作,编写任务书 2019年2月-2019年3月 学习文献,充分理解相关技术内容 2019年2月20-2019年3月10 确定具体研究内容,开始着手制作LDA模型,进行英文翻译,编写开题报告 2019年3月-2019年4月10日 搭建环境,建立模型 2019年4月10-2019年5月 对数据集进行训练,最终形成模型 2019年5月1-2019年5月15 验证评估模型并且完成论文的撰写