基于聚类算法的航空客户平台开题报告
2022-01-14 20:52:12
全文总字数:1994字
1. 研究目的与意义及国内外研究现状
对于航空公司而言,构建数据仓库,进行数据挖掘的目的是活的正确决策和对旅客展开个性化服务,这是航空公司客户系统的关键,基于这个目的的数据挖掘的主要任务主要有三个:一是细分,也称为客户行为分析,根据客户行为的不同将他们划分为不同的群体,各个群体有着明显的行为特征,这种划分方式也称为“行为分组”;第二是评估,即重点旅客发现,目标是找出对企业具有重要意义的客户,这些重点客户主要包括以下几类:潜在客户、交叉销售、增量销售和客户保持。第三是预测,即对旅客未来的价值大小和相应的市场策略的预测。在这三个方面中,旅客细分是进一步评估与预测的基础,也是航空公司客户关系系统的重要功能成分。
国内外研究现状
实施客户平台的基础就是客户数据,数据仓库是目前国际上解决此项问题的比较成熟、应用较为广泛的技术。在客户平台中,数据仓库的目标就是决策支持,数据仓库技术在改善交易系统数据方面取得了显著成效。采用个性化的销售方法,必须尽可能了解有关客户详情和行为的信息,而只有通过提取、转换、装载等程序建立起来的以客户为中心的数据仓库才能满足这一需求。2. 研究的基本内容
1.借助航空公司客户数据,对客户进行分类。2.对不同的客户类别进行特征分析,比较不同类客户的客户价值3.对不同价值的客户类别提供个性化服务,制定相应的营销策略。
数据清洗:丢弃票价为空记录,丢弃票价为0、平均折扣率不为0、总飞行公里数大于0的记录属性规约:原始数据中属性太多,根据航空公司客户价值LRFMC模型,选择与模型相关的六个属性。删除其他无用属性,如会员卡号等等数据变换:将原始数据转换成“适当”的格式,用来适应算法和分析等等的需要。主要采用数据变换的方式为属性构造和数据标准化 .需要构造LRFMC的五个指标L=LOAD_TIME-FFP_DATE(会员入会时间距观测窗口结束的月数=观测窗口的结束时间-入会时间(单位:月))R=LAST_TO_END(客户最近一次乘坐公司距观测窗口结束的月数=最后一次。。。)F=FLIGHT_COUNT(观测窗口内的飞行次数)M=SEG_KM_SUM(观测窗口的总飞行里程)C=AVG_DISCOUNT(平均折扣率)客户聚类:利用K-Means聚类算法对客户数据进行客户分群,聚成五类(根据业务理解和需要,分析与讨论后,确定客户类别数量)
3. 实施方案、进度安排及预期效果
1.从航空公司,选择性抽取与新增数据抽取,形成历史数据和增量数据2.对步骤一的两个数据,进行数据探索性分析和预处理,主要有缺失值与异常值的分析处理,属性规约、清洗和变换3.利用步骤2中的已处理数据作为建模数据,基于旅客价值的LRFMC模型进行客户分群,对各个客户群再进行特征分析,识别有价值客户。4.针对模型结果得到不同价值的客户,采用不同的营销手段,指定定制化的营销服务,或者针对性的优惠与关怀。(重点维护老客户)预期效果:
重要保持客户:R(最近乘坐航班)低,F(乘坐次数)、C(平均折扣率高,舱位较高)、M(里程数)高。最优先的目标,进行差异化管理,提高满意度。重要发展客户:R低,C高,F或M较低,潜在价值客户。虽然说,当前价值不高,但是却有很大的发展潜力,促使这类客户在本公司消费和合作伙伴处消费。重要挽留客户:C、F、M较高,但是较长时间没有乘坐(R)小。增加与这类客户的互动,了解情况,采取一定手段,延长客户生命周期。一般与低价值客户:C、F、M、L低,R高。他们可能是在公司打折促销时才会乘坐本公司航班。
4. 参考文献
[1] 周贺来 . 客户关系管理实务 [m]. 北京:北京大学出版社, 2011.[2] anderson, j. l. customer relationship management in retailing: a contentanalysisof retail tradejournals [j]. journal of retailing and consumerservices,2007:394-399.[3] 叶开. 中国 crm 最佳实务 [m]. 北京:电子工业出版社, 2005.
[4] 王永贵 . 客户关系管理 [m]. 北京:清华大学出版社,北京交通大学出版社,2007.
[5] 杨莉. 客户关系管理应用与研究 [d]. 天津:天津大学, 2007.