基于R语言的客户回复与效益最大化分析开题报告
2021-12-16 22:59:03
全文总字数:2829字
1. 研究目的与意义及国内外研究现状
近些年来,大数据、云计算以及数据挖掘等已经不再是人们所认为的陌生且晦涩难懂的名词了。十几年来,信息数据迅速增长的步伐已经到了令人咂舌的地步,银行、电子商务、客户关系管理、生物制药、电信、保险、零售等等各个领域都涉及到了大型数据库、数据仓库的应用。然而面对着海量的数据,如何从中及时发现有用的信息,并提高信息的利用率是当今面临的又一大难题。 然而只有充分利用数据为业务决策和战略发展服务,才能使数据真正的变成有益的资源,才能避免决策者迷失在茫茫数据之中。
数据挖掘技术具备从海量历史数据中提取隐含的规律和模式,获得决策支持信息的特性,因此为对客户关系管理的快速发展提供了土壤。数据挖掘可以使客户定位更为准确,选择更为合理,因此在营销中,可以帮助企业获得更大的产品市场、顾客群体和利润空间。
r 语言是用于统计计算和绘图的函数,不仅有强大的命令行交互方式,还可利用 r语言的开源优点增加修改 r 添加包的功能。在 r 语言中,数据都是以对象的形式存储,使数据操作变得便捷,进行数据分析任务变得容易。而且用户无需了解函数调度的细节,r语言能调用默认的绘图方法。即当用户创建一个新的类对象时,r语言能对该类对象提供特定的绘图方法,该绘图方法将会告诉 r如何绘制这个新类对象,图像对于分析数据起关键作用。
2. 研究的基本内容
基于kdd cup1998的数据,使用r工具创建决策树并基于客户的地理位置和推广历史来建立捐款模型,通过数据挖掘技术来优化客户选择,提高募捐效率,然后预测客户的回复是否与捐款有关,并基于预测得分对客户进行排名,使捐款数额最大化。
主要的研究内容如何下:
(1)分析国内外研究现状,阐述研究背景和意义,并分析研究数据、研究方法以及研究工具的选择。
3. 实施方案、进度安排及预期效果
根据本文的研究计划,本文的进程计划如下:
1.2015年12月20日前:准备阶段,学习毕业论文有关文件,并完成任务书。
2.2016年1月15日前:完成开题报告。
4. 参考文献
[1]方匡南. 基于数据挖掘的分类和聚类算法研究及r语言实现[d].暨南大学,2007.
[2]陈希. 基于r语言数据挖掘的社交网络客户细分研究[d].北京邮电大学,2011.
[3]侯亚君. r语言在数据挖掘中的运用[j]. 晋城职业技术学院学报,2014,02:63-65.