关联规则挖掘系统的设计与实现开题报告
2020-04-12 16:24:38
1. 研究目的与意义(文献综述)
条码技术及数据仓库的发展使得数据收集和存储变得十分简便与频繁,由此也逐渐累积了海量的数据,尤其在商业和科研领域。譬如一家大型商场每天的销售记录就能达到上万。长此以往,海量的数据便被存储下来。人们在收集存储数据的时候也许有着自己的目的,亦或者没有明确的目的,只是先收集起来再说,但无论如何这些海量的数据一直被存储起来了。
然而,传统的数据分析技术很难对这些海量的数据进行分析处理,存在着种种局限性。而数据挖掘技术突破了这些局限。它并非完全脱离原有数据分析领域,而是以传统分析技术为基础。数据挖掘是一种技术,它将传统的数据分析方法与处理大量数据的复杂算法相结合处理海量的难以用传统手段处理的数据。
从功能上可以将 数据挖掘的分析方法划分为以下四种:关联分析(association rules);序列模式分析(sequential patterns);分类分析 (classifiers);聚类分析(clustering)。关联规则挖掘算法是一种重要的数据挖掘方法。
2. 研究的基本内容与方案
本系统主要有一下三大基本内容:
1. 数据预处理阶段,从数据库中获取数据,进行数据预处理,从用户输入获取confidence 和support 值;
2. 数据挖掘阶段,得到预处理后的数据后,运行算法程序;
3. 研究计划与安排
2018.02.25-——2018.03.05 查阅文献,撰写开题报告,撰写文献摘要
2018.03.06——2018.03.07 外文翻译
2018.03.08——2018.04.01 系统设计,构造系统原型
4. 参考文献(12篇以上)
[1].agrawal,rakesh, and ramakrishnan srikant. "fast algorithms for mining associationrules." in proc. 20th int. conf. very large data bases, vldb, vol. 1215,pp. 487-499. 1994.
[2].wu, xindong, vipin kumar, j. ross quinlan, joydeep ghosh, qiangyang, hiroshi motoda, geoffrey j. mclachlan et al. "top 10 algorithms indata mining." knowledge and information systems 14, no. 1 (2008): 1-37.
[3].kantardzic, mehmed. data mining: concepts, models, methods, andalgorithms. john wiley amp; sons, 2011.