登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 毕业论文 > 管理学类 > 信息管理与信息系统 > 正文

基于用户行为的购买预测研究毕业论文

 2021-11-07 21:13:08  

摘 要

得益于国家经济的快速发展,人民消费水平的提高,中国酒店业近年来收入持续增长。同时,我国酒店行业的供给也得到持续增长,中国的酒店客房数量从2015年的215.01万间逐渐增长到了2019年的414.97万间,期间的年均复合增长率为17.87%。我国酒店行业正逐步向规模化,高发展的时代移动,酒店业消费前景良好。

随着互联网近年来在国内的蓬勃发展,O2O作为一种将线上浏览与线下体验相结合的新型电子商务模式,在中国市场迅速的与传统酒店业结合,涌现出一批O2O线上平台,携程网作为O2O酒店的先行者,在长期的运营中积累了大量的用户数据、酒店数据和房型数据,在此背景下,通过对已有的数据进行分析,从而可以挖掘出用户的喜好,从而为用户提供更加精准的个性化推荐服务,对提高用户体验具有重要的商业意义。本文基于用户行为和机器学习技术对携程网提供的用户订单数据进行分析,建立了一个O2O酒店行业的基于用户行为的购买预测模型。

调研表明,用户在预定酒店时,不仅对酒店有所偏好,也会对酒店房型有所偏好。本文对用户预定酒店房型的行为进行了分析,并利用了LightGBM和XGBoost 框架构建了两种预测模型,根据预测模型对用户预定酒店房型的行为进行预测,获得了49.66%和47.95%的准确度,并对预测模型进行了评估,由于预测目标的房型种类很多,达到了134512种房型,因此模型的准确率难以达到很高的水准,同时本文也对影响模型构建的重要性特征进行了分析,发现用户会选择何种房型很大程度上与该房型的最终展示价格有关。

关键词: 机器学习;建模;购买预测

ABSTRACT

Thanks to the rapid development of national economy and the improvement of people's consumption level, the revenue of China's hotel industry has continued to grow in recent years. At the same time, the supply of China's hotel industry has also continued to grow. The number of hotel rooms in China has gradually increased from 21501 in 2015 to 4149700 in 2019, with an annual compound growth rate of 17.87%. China's hotel industry is gradually moving to a large-scale, high development era, and the hotel industry has a good prospect of consumption.

With the rapid development of the Internet in China in recent years, as a new e-commerce mode combining online browsing and offline experience, o2o is rapidly combined with the traditional hotel industry in the Chinese market, and a batch of o2o online platforms have emerged. As the forerunner of o2o Hotel, Ctrip has accumulated a large number of user data, hotel data and room type data in the long-term operation. Here In the background, by analyzing the existing data, we can find out the user's preferences, so as to provide users with more accurate personalized recommendation services, which is of great commercial significance to improve the user experience. Based on user behavior and machine learning technology, this paper analyzes the user order data provided by Ctrip. Com, and establishes a purchase prediction model based on user behavior in o2o hotel industry.

Research shows that when users book a hotel, they not only have a preference for the hotel, but also for the hotel room type. In this paper, the behavior of the user booking the hotel type is analyzed, and two prediction models are constructed by using lightgbm and xgboost framework. According to the prediction model, the behavior of the user booking the hotel type is predicted, and the accuracy of 49.66% and 47.95% are obtained, and the prediction model is evaluated.

Key words: Machine learning, modeling purchase ,forecasting

目 录

第一章 绪论 1

1.1研究背景 1

1.2研究意义 1

1.3研究内容 1

1.4研究路线 2

第二章 相关技术及理论 4

2.1 机器学习 4

2.1.1 机器学习的建模方法 4

2.2 数据挖掘 4

2.2.1 数据挖掘的流程 4

第三章 分析环境准备与数据预处理 6

3.1 实验环境 6

3.1.1系统配置 6

3.1.2开发语言 6

3.1.3数据分析资源库 6

3.2 样本数据的描述 7

3.2.1订单信息分析 7

3.2.2 用户购买行为分析 7

3.2.3 数据集分析 7

3.3 特征分析 9

3.3.1数据质量分析及处理 9

3.3.2数据特征分析 10

3.4 数据预处理 15

3.4.1数据清洗 15

3.4.2 数据特征的选取 16

第四章 预测模型的构建与评估 18

4.1 构建模型的基本过程 18

4.1.1 模型的选择 18

4.1.2 模型的训练 18

4.1.3 模型的预测 18

4.1.4 模型的评估 18

4.2利用XGBoost方法建模并对用户购买行为进行预测 19

4.3利用LightGBM方法建模并对用户购买行为进行预测 22

第五章 总结与展望 26

参考文献 27

致谢 29

第一章 绪论

1.1研究背景

根据中国旅游研究院发布的《中国旅游经济蓝皮书No.12》及《2019旅游消费数据报告》,2019年中国旅游业将继续维持高于GDP增速的较快增长,2019年国内全年旅游人数,60.06亿人次,收入5.73万亿元,比2018年同期,同比增长了8.4%和11.7%,2019年我国旅游行业发展再创新高,酒店业作为旅游除行必备支出之一,酒店业消费前景良好。

携程网是中国建立于1999年的一家在线票务服务公司,早期专注于旅游信息的共享及分发。但随着中国互联网的蓬勃发展,携程网开发了线上平台来布局属于自己的O2O模式[1],酒店业就是携程网O2O模式发展中的重中之重。用户在携程网的线上平台上挑选酒店房型并缴纳定金,以此来完成酒店预定的过程[2]。在激烈的市场竞争环境下,作为酒店预定服务提供商,提高服务水平,优化用户体验是携程网的强烈诉求。

1.2研究意义

调研表明,用户在预定酒店房间时,不仅对酒店有所偏好,对酒店房型也具有偏好,不同的房型间存着很多差异,用户会在选择房型时对比这些差异并选择符合预期的房型,这使得线上平台在提供更多酒店房型信息的同时,给用户带来了很大程度的选择时间的增长[3]。对于携程网这种线上平台而言,根据历史订单数据,挖掘分析出用户在挑选酒店房型时喜好,预测用户的行为并对用户合理的分发信息是十分重要的[4],试想如果平台推送的信息就是用户所想要的信息,就能将营销信息精准的推荐给用户[5],节省用户挑选酒店房型的时间,从而提升用户体验,同时提高成单率[6],帮助携程网在O2O酒店业竞争中取得领先地位。

1.3研究内容

本研究将基于当前行业背景以及国内外学者对基于用户行为构建预测模型的研究构建本次研究的预测模型,然后使用python语言对携程网提供的数据集进行了分析处理,并构建了预测模型。

您需要先支付 80元 才能查看全部内容!立即支付

企业微信

Copyright © 2010-2022 毕业论文网 站点地图