基于数据挖掘技术的淘宝用户行为及商品推荐预测分析毕业论文
2021-12-22 22:05:32
论文总字数:19658字
摘 要
在“互联网 ”的大环境下,不仅促使了电商平台迅速崛起,许多企业和个人也开拓开展线上营销的业务。线上营销的目的就是挖掘潜在用户,这类用户无论在购买还是出售商品时都会留下浏览信息。因此数据挖掘在网购过程中起到了重要的作用。
本毕业设计的内容主要有以下三部分:第一部分通过聚类分析,将顾客进行分类,形成不同的客户群体从而观察他们的消费喜好和习惯;第二部分根据关联规则的原理发现不同商品之间的关联,帮助商家了解哪些商品频繁的被顾客同时购买;第三部分基于分类预测方法通过对大量顾客信息进行训练建立模型来预测潜在顾客的购买行为。
本毕业设计的结论可以作为参考,为淘宝平台的商家提供决策支持,帮助制定合理的精细化营销方案,有实际的应用价值。
关键词:数据挖掘 网络购物 关联规则 聚类分析 分类/预测
Analysis of Taobao user behavior and product recommendation based on data mining
Abstract
Under the "Internet " environment, not only has the e-commerce platform rapidly emerged, but many companies and individuals have also developed online marketing services. The aim of online marketing is to search for potential users. Many potential customers will generate data information whether they search for the products they need or post purchases. Therefore, data mining plays an important role in the online shopping process.
The content of this graduation project contains the following proportions: the first method is to classify customers to form different customer groups to observe their consumption preferences and habits by cluster analysis. The second part finds the association between different products according to the principle of association rules, which helps merchants understand which products are frequently purchased by customers at the same time. The third part is based on the classification prediction method by training a mass of data set to build a model to predict the purchase behavior of potential customers.
The conclusion of this study can be used as a reference to provide decision support for merchants on the Taobao platform, help to formulate reasonable and refined marketing plans, and have practical application value.
Keywords: data mining; online shopping; association rules; cluster analysis; classification / prediction
目 录
摘 要 I
Abstract II
第一章 前言 1
1.1 研究背景 1
1.2 研究目的及意义 1
1.3 研究内容 1
1.4 研究涉及的技术 1
1.4.1 数据挖掘 1
1.4.2 数据库 2
1.4.3 其他模型 2
1.5 章节安排 2
第二章 数据的来源、处理和基本分析 3
2.1 数据来源 3
2.2 数据预处理 3
2.3 数据简单分析 5
2.3.1 查看购买次数和购买率、收藏率和加购率的关系 5
2.3.2 基于时间维度的用户行为分析 6
2.3.3 商品种类购买情况分析 8
2.4 RFM模型 8
第三章 数据挖掘相关技术介绍 9
3.1 聚类分析 9
3.1.1 聚类分析介绍 9
3.1.2 k-means算法介绍 9
3.2 关联规则 11
3.2.1关联规则介绍 11
3.2.2Apriori算法介绍 11
3.3 分类/预测 12
3.3.1 分类/预测介绍 12
3.3.2 决策树算法介绍 14
第四章 数据挖掘应用 16
4.1聚类分析应用 16
4.1.1实验准备 16
4.1.2实验过程 16
4.1.3实验总结 17
4.2关联规则应用 18
4.2.1实验准备 18
4.2.2实验过程 18
4.2.3实验总结 19
4.3分类/预测应用 20
4.3.1实验准备 20
4.3.2实验过程 20
4.3.3实验总结 22
4.4实验结果分析 23
第五章 总结 24
参考文献 25
致 谢 27
第一章 前言
1.1 研究背景
在2014年于北京举办的中国第十四届年度管理大会上,时任阿里巴巴集团CEO的马云提出人类正在从IT时代走向DT(即Data technology,大数据)时代:“IT是以我为中心,IT的目的是为了让老板更好决策、更好管理,DT的思想是让你的客户更加强大、让你的员工更加强大、让别人更加强大,这是完全不同的思考。很多时候客户不要服务,客户要的是体验。”可以看出,客户的体验已经成为淘宝乃至整个电商圈内炙手可热的服务方向。
而对于数据的重要性,马云提到,阿里巴巴公司实际上是一家数据公司,做淘宝不是为了卖货,而是整合所有零售和制造业的数据。数据会比你更了解自己。所以传统的销售模式会越来越无力,分析用户数据来判断趋势进而帮助商家和企业预测用户需求变得越来越有意义,在用户产生的各种数据中寻找规律,发现其购物习惯和喜好将大大提高营销成功的效率。在此过程中,数据挖掘技术起到了决定性的作用。
1.2 研究目的及意义
请支付后下载全文,论文总字数:19658字