登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 毕业论文 > 管理学类 > 信息管理与信息系统 > 正文

基于在线评论的酒店预定影响因素研究毕业论文

 2022-01-05 21:12:37  

论文总字数:26669字

摘 要

互联网时代的飞速发展给人们带来了日新月异的生活方式,在线预订成为越来越多人青睐的酒店预订方式。在线评论作为消费者了解酒店和反馈入住体验的一种途径,包含着许多有价值的信息。通过数据挖掘的手段提取评论中的有效信息,将会对酒店提升形象,增加预订率大有帮助。

本文使用基于朴素贝叶斯和LDA两种模型的方法对携程网获取的南京市部分经济型酒店的评论文本进行了情感分析。研究首先通过调查问卷确定要研究的酒店类型和要爬取的数据类型,随后通过编写python代码爬取携程网的酒店评论数据。在数据预处理阶段,扩充了中文停用词表,增加部分酒店专属词汇以提升数据的可用性。之后分别用两个模型对评论文本进行情感分析,两个模型的研究思路不同,朴素贝叶斯需要先训练模型,然后用训练好的模型分析不同因素的好评率。LDA则是自动将评论集划分为好、差评,然后提取两种类型评论中的主题词。两个模型得到的分析结果基本一致,可相互验证。最后重点针对差评因素对酒店提出改进建议。

关键词:酒店评论 情感分析 朴素贝叶斯 LDA

Abstract

People's ever-changing lifestyle is the product of rapid development in the Internet era, online booking has become a way for more and more people to book hotels. Online reviews, as a way for consumers to understand the hotel and feed back their check-in experience, contain a lot of valuable information. Extracting effective information from reviews through data mining will greatly improve the hotel's brand image and increase the booking rate.

In this paper, based on the review data of economic hotels in Nanjing obtained from the Internet, a sentiment analysis is carried out on the review text based on the two models: Naive Bayes and LDA. The research first determined the type of hotel to be studied and the type of data to be crawled through a questionnaire, and then crawled the hotel review data of Ctrip.com by writing python code. In the data preprocessing stage, the Chinese stop words list was expanded, and some hotel-specific vocabulary was added to increase the availability of data. After that, Naive Bayes and LDA were used to make sentiment analysis of the review text. Naive Bayes needs people to train the model first, and then use the trained model to analyze the praise rate of different factors. LDA automatically divides the review set into good and bad reviews, and then analyzes the subject words in the two types of reviews. The analysis results obtained by the two models are highly consistent and can be mutually verified. Finally, it mainly puts forward suggestions for improving the hotel based on the negative evaluation factors. Keywords: hotel review; sentiment analysis; Naive Bayes; LDA

目录

摘要 I

Abstract II

图目录 V

表目录 VI

第一章 绪论 1

1.1研究背景 1

1.1.1互联网时代迅速发展 1

1.1.2在线预订酒店市场逐步扩大 1

1.1.3在线评论成为顾客预订酒店的重要参考 2

1.2研究意义 3

1.2.1理论意义 3

1.2.2实际意义 3

1.3研究内容和方法 4

1.3.1研究内容 4

1.3.2研究方法 4

第二章 文献综述 6

2.1在线评论的研究现状 6

2.2在线评论挖掘方法的研究现状 6

2.2.1数据来源和获取方法的研究现状 6

2.2.2数据分析方法的研究现状 7

2.3常见的酒店影响因素的研究现状 7

2.4简要述评 8

第三章 基于调查问卷的酒店及指标选取 10

3.1调查问卷设计和回收 10

3.1.1 问卷设计 10

3.1.2 问卷回收 10

3.2描述性统计分析 10

3.2.1 调查对象特征统计 10

3.2.2 酒店相关问题统计 11

3.2.3 评论相关问题统计 12

第四章 基于问卷的数据采集和数据挖掘分析 14

4.1 数据采集 14

4.1.1数据来源 14

4.1.2数据获取 14

4.2数据预处理 15

4.3数据分析 16

4.3.1 基于朴素贝叶斯模型的情感分析 16

4.3.2基于LDA模型的情感分析 21

第五章 结论与相关建议 23

5.1研究结论 23

5.1.1 总体因素排名 23

5.1.2 差评因素分析 23

5.2给酒店的相关建议 23

5.3给顾客的相关建议 24

第六章 总结与展望 25

6.1文章创新点 25

6.2研究不足 25

6.3未来展望 25

附录 27

A.数据预处理代码 27

B.朴素贝叶斯代码 28

C.LDA代码 30

参考文献 32

致谢 34

图目录

图1.1 2009-2019中国网民数量 1

图1.2 2014-2019中国酒店在线交易额 2

请支付后下载全文,论文总字数:26669字

您需要先支付 80元 才能查看全部内容!立即支付

企业微信

Copyright © 2010-2022 毕业论文网 站点地图