登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 毕业论文 > 管理学类 > 信息管理与信息系统 > 正文

基于在线评论信息的旅游景点个性化推荐研究毕业论文

 2020-02-19 20:10:10  

摘 要

本文采用了基于特征的观点挖掘技术对景点的特征进行识别、提取和情感分析,从特征的维度对景点进行推荐,采用模糊数学和多目标决策方法生成推荐列表,提出了一种基于在线评论信息的旅游景点个性化推荐模型。

本文基于旅游网站中的在线评论数据为用户提供个性化推荐。首先通过Stanford coreNLP对评论文本进行词性标注,抽取景点的特征并对其进行分类,形成景点的特征指标。然后通过对评论进行句法结构分析,找出评论中对各个特征指标的描述,将其转化为模糊数,得到景点-特征的评分矩阵PF。同时使用基于词频的分析方法,根据用户的历史评论提取其对各个特征的偏好程度,得到用户-特征的权重矩阵UF。最后将各个景点作为备选方案,通过多目标决策ELECTRE Ⅱ方法,输入PF和UF矩阵,对所有景点进行排序,得到个性化推荐的景点列表。实验结果证明,本模型提出的方法是有效的,具有较强的理论和应用价值。

关键词:推荐系统;在线评论;句法分析;决策方法

Abstract

This paper adopts perspective mining technology based on features to identify, extract and analyze the characteristics and descriptions of tourism attractions from the dimension of features, uses fuzzy mathematics and multi-objective decision-making methods to give out personalized recommendation, then proposes a personalized recommendation model for tourism attractions based on online review.

This article provides personalized recommendations for users based on online review from tourism websites. First, Stanford coreNLP is used to mark the words of the content, extract the characteristics of the attractions, and classify them to obtain the characteristic indicators of the attractions. Then, the opinions to every feature is located by analyzing the syntactic structure of the comments, and they are transformed into fuzzy numbers and form the score matrix PF. At the same time, the frequency of features is calculated and used to quantify the preference of each feature, then the weight matrix UF is obtained. Finally, each attraction is regarded as an optional plan. By the multi-objective decision-making method ELECTRE II method, we get the personalized recommendation list of attractions from PF and UF matrixes. Experiments have shown that the proposed method is effective and has strong theoretical and applied value.

Keywords:Recommender system; online review; syntactic analysis; decision making method

目 录

第1章 绪论 5

1.1 研究背景 5

1.2 研究现状 6

1.3 研究意义 9

第2章 个性化推荐技术 10

2.1 推荐系统原理 10

2.2 推荐系统分类 11

2.2.1 按应用场景分类 11

2.2.2 按算法分类 12

2.3 推荐系统评价方法 17

2.4 多目标决策在推荐系统中的应用 18

2.5 推荐系统的挑战 18

第3章 基于特征的观点挖掘 20

3.1 意见挖掘技术 20

3.2 商品特征 20

3.3 意见挖掘的系统架构 21

3.4 意见挖掘的流程 22

3.4.1 文本预处理 22

3.4.2 文本的结构化表示 22

3.4.3 特征抽取方法 23

3.4.4 基于特征的观点挖掘 23

第4章 基于在线评论信息的旅游景点个性化推荐 24

4.1 系统目标 24

4.2 基于在线评论信息的旅游景点个性化推荐研究 24

4.2.1 数据处理 25

4.2.2 特征抽取 26

4.2.3 观点提取 27

4.2.4 推荐分析 28

第5章 实验与结果 29

5.1 评论数据及其预处理 29

5.2 特征抽取 29

5.3 基于特征的观点挖掘 30

5.4 基于决策分析的景点推荐 32

第6章 结论 34

6.1 实验结果分析 34

6.2 创新点 34

6.3 问题与展望 34

参考文献 36

致谢 39

绪论

研究背景

随着互联网的高速发展,网络中的数据也以指数级增长,给人们的生活带来了诸多便利,但也使得网络环境变得日益复杂。一方面,互联网帮助人们更迅速、更准确、更便利地获得所需要的信息,为人类社会发展提供了极大助力;而另一方面,复杂的网络环境也使得单个互联网用户难以处理所有信息,用户的使用体验反而在一定上升后趋于饱和,甚至开始下降。“信息过载”的问题成为互联网建设中绕不开的障碍。在这种情况下,为了帮助用户处理海量数据,提高检索效率,搜索引擎和推荐系统应运而生。

其中,在20世纪90年代的兴起的个性化推荐系统以其良好的推荐效果得到了越来越多的关注和应用。以电子商务领域为例,早期许多电子商务网站的推销方式仅仅停留在根据关键词检索和推荐热销商品的阶段,搜索的质量取决于用户输入的关键词,而且搜索结果与用户的兴趣并不总能匹配,仅仅能达到帮助用户检索商品的功能,而不能挖掘用户的潜在购买需求。而引入推荐系统后,即可结合用户和商品的各种特点,使用合适的模型进行推荐。研究表明,在没有推荐系统辅助决策时,用户平均需要查看11.7个商品才能找到满意的商品,而引进推荐机制之后,则每个平均只需要浏览6.6个商品即可决定,几乎减少了50%的时间贺经理。另外,调查结果显示,约45%的消费者更愿意选择具有推荐功能的网站,而在较为高端的消费者中,该比例高达69%。可见合适的推荐系统无论对于商家还是消费者都是大有裨益的,不仅能够为双方减少成本,还对于提高用户粘度、促进成交率都有一定的积极作用。

早期的推荐系统基于用户和商品的日志来进行推荐。较为常见的数据源包括用户的评分,产品的属性集等。推荐系统通过分析用户的历史记录、对商品的评价等信息,预测用户对新商品的评价,从而决定向用户推荐哪些商品。随着网络技术的发展,不少推荐系统不仅考虑用户的购买记录和评分,也将用户的浏览习惯、点击次数、收藏行为加入了考虑范围。

在web2.0时代,用户的网络行为得到了越来越多的重视。如用户对商品的评价,作为用户生成内容的重要内容之一,是最能直观地反应用户偏好和用户评价的信息,也逐渐被推荐系统重视了起来,开始应用到实际模型中。

这一趋势在旅游行业中尤为明显,许多BBS、论坛以及旅游网站中都存在这大量景点的评价、游记等,研究表明潜在游客可能会花大量的时间阅读相关的博客和评论,作为决策的重要依据[1-3].但与此同时,旅游业的评论也是信息过载问题的重灾区。在旅游网站的评论中,存在大量冗余信息、无用内容和缺乏参考价值的内容,为信息的提取和利用带来了一定难度。

如果将这些信息考虑到推荐系统中,能够为用户提供更好的购买建议。具体思路为将用户和商品的评论信息输入推荐系统中,对特征进行提取和情感分析,得到商品在各个特征上的得分以及用户对于特征的看法,然后再根据用户的偏好进行推荐。这也已经成为了个性化推荐的一大热门研究方向。

此外,在考虑是否购买某一商品时,用户首先评估商品是否符合自身的需求,从而产生购买决策和购买行为。传统的推荐系统普遍采用以历史购买行为预测未来购买行为的方式,如用户的偏好产生变化可能对推荐结果产生较大的影响。引入了特征以后,则能够通过模拟用户的决策方法来预测其购买行为,使得结果更稳定可靠。

另外,在预测结果的处理上,普遍的做法是根据用户的历史行为预测用户对新产品的评分,存在一定误差。目前已有研究通过引入多目标决策的方法来对商品进行优先级排序,得到商品的推荐[4]

本文即采用特征挖掘的技术对景点的评论文本做处理,提取景点的特征,分析用户对于景点各个特征的评价,得到lt;特征,观点gt;对,然后将其量化得到景点-特征的评分矩阵,再基于词频分析用户对于各个特征的重视程度,得到用户-景点的权重矩阵,根据两个矩阵使用决策分析的方法为用户形成推荐列表。

研究现状

如前文所述,推荐系统的产生是基于互联网技术的必然需求。从用户查找、检索信息的角度,互联网的发展历史可以分为三个阶段:

  1. 门户网站阶段:各个门户网站为用户准备不同功能、不同信息来源网站的入口,起导航作用;
  2. 搜索引擎阶段:门户网站提供的导航并不总能满足用户的信息需求,而搜索引擎通过爬取互联网上的公开链接提供检索功能,使得用户能够根据关键词搜索需要的信息,进入对应的网站;
  3. 推荐引擎阶段:搜索引擎作为解决信息过载的初步工具,但是仍然不能完全抵挡信息大爆发的冲击。随着互联网的发展,用户根据关键词搜索到的内容也不能完全符合需求,加入了推荐算法的搜索引擎则能够为用户定制搜索结果,达到二次信息过滤和筛选的效果。这也使推荐系统未来的一大发展趋势。

1994年,明尼苏达大学的Resnick教授团队[5]搭建了世界上第一个自动推荐系统 Group Lens,其主要功能为提供新闻和文章的推荐。在1997 年,该团队又搭建了Movielens数据集,该网站是一个非营利性的学术性站点,其中包括了用户对电影的评价数据,作为推荐系统的公开测试集,一度成为了评价推荐系统的重要指标。这也是推荐系统的起源。

目前,关于推荐系统的研究有许多,但经典算法主要有三种[6]:基于内容(Content-based)的推荐[7]、协同过滤(Collaborative Filtering)推荐[6, 8]以及混合(Hybrid)推荐[6]

  1. 协同过滤推荐又称基于最近邻的推荐方法。分为基于用户的协同过滤推荐和基于物品的协同过滤推荐。基于用户的协同过滤方法的基本思想是根据用户的历史购买记录寻找有相似爱好的用户,取相似度较高的用户形成最近邻,根据最近邻的购买记录为用户推荐其没有购买过的商品;基于物品的协同过滤推荐分析用户的购买产品,取这些产品最相似的产品作为最近邻,推荐给用户。
  2. 基于内容的推荐根据用户的历史购买记录,挖掘商品的特点,确定用户的喜好,从而为其推荐具有相同或相似特点的商品。
  3. 混合推荐即将多种推荐方法通过不同的形式结合运用,以达到更好的推荐结果。

基于上述基本推荐方法,国内外许多学者提出了许多相关研究。如Davidson和Liebald等以用户在 Youtube上的历史行为作为种子,基于共同访问,为用户输出个性化的视频推荐[9]。Saito和Yukawa 在Twitter中调查了社交网络中用户的标签对推荐系统的影响,发现用户标签能够在很大程度上反应用户的兴趣[10]。Kazienko等人研究了用户对 Flickr上的图片分享、标注、评论数据,发现评论中的标签联系,据此实现推荐[11]

国内在推荐系统中的研究较晚。CNKI中国期刊全文信息库,根据文献的引用信息、作者信息、相关引用文献、被引文献等信息向用户提供文献推荐。哈尔滨工业大学的李一军教授团队也尽心了许多关于商品的在线评论的挖掘工作,根据挖掘的数据选取合适的数据挖掘方法帮助消费者和商家提供购买、销售策略[12]。

虽然推荐系统在许多领域已经取得了不错的研究和应用成果。但是在旅游领域,还鲜有较为完善的个性化推荐方法,对于游客评论内容的利用则更少。目前旅游景点的推荐方法主要有两种,一种是非个性化的简单景点推荐方式,另一种为个性化的旅游推荐。

非个性化的景点推荐方式一般仅仅输出热门的景点作为推荐,其推荐指标仅为人数,缺乏个性化和时效性。宏观上来讲,能够满足大部分游客的需求,但是适用性并不强,不能最大程度上满足所有游客。

在个性化景点推荐系统中,系统根据用户的偏好和景点的情况形成推荐[13]。2009年,针对在陌生旅游景区的景点推荐,Huang等人使用贝叶斯网络和层次分析的方法提出了个性化推荐模型,该模型根据旅游网站中的景点信息形成本体树,用来存储景点的具体属性,如时间、位置、费用,然后根据贝叶斯网络评估用户对各个属性的偏好,在最后使用层次分析法得出推荐列表[14]。Kabassi 等总结了2009年前关于旅游推荐的研究和技术,提出了一种心得移动环境下的推荐方法[15]。侯新华等根据旅游网站中的在线评分数据提取了用户-景点评分矩阵,使用协同过滤的方法做出了推荐[16]

另外也有不少研究根据位置信息来进行景点推荐。Zheng 等基于GPS 数据提取了有趣的景点与经典旅游集,根据用户的位置信息提供了个性化朋友与景点推荐[17, 18]。文献[19]使用了基于图的方法,获取城市的坐标和地理信息来形成推荐。文献[20]基于概率主题模型,分析游客的游记,提取游记的主题,根据主题模型推荐景点的位置。Lu等提出了一个旅游信息的基本框架,包括了游记信图片信息等,根据该框架可以为用户自动生成旅游计划[21]

研究意义

本系统通过分析旅游网站中景点的评论,对其中的特征词、评价词做出具体分析,在特征维度上形成对景点的评分矩阵,将目前的总体评分细化到了各个特征上;同时对用户的喜好进行挖掘,分析用户在选取出游计划时最关注的景点特征,据此以决策分析方法综合景点的真实情况和用户的需求对景点进行分析和排序,从而达到个性化推荐的目的。

目前的推荐系统虽然在各个领域都取得了不错的成果,但是大多是基于用户的历史数据。早期推荐系统需要的数据包括用户或商品的信息,例如历史购买记录,商品属性等;随着互联网的发展,在系统中考虑了用户的点击次数、浏览时长、收藏商品等信息,提高了推荐的成熟度。但是仍有大量的信息没有被考虑到,例如用户的评论信息。

本文考虑了用户在对景点的评价文本,对其中景点的特征、用户的评价进行了量化,分析得到了用户的偏好和景点的特点,利用这些信息可以从购买者的角度更好理解和预测用户的购买决策。且景点的特征可以视作用户决策的决定性信息,而购买记录为用户的行为集,相较于通过历史行为来预测未来行为,通过用户的购买决策方法来预测用户行为的方法更有说服力。

此外,本文不同于传统的推荐系统,通过预测用户的评分来决定输出推荐列表,而是将各个景点视作备选的决策方案。使用决策分析中的方法对景点进行排序,输出最符合当前用户期望和需求的景点。

个性化推荐技术

个性化推荐技术起源于20实际90年代[5],在Web 2.0时代飞速发展。其定义有许多,其中Resnick和Varian在1997年给出的定义被广泛认可[22]:“它(推荐系统)是利用电子商务网站向客户提供商品信息和建议,帮助用户决定应该购买什么产品,模拟销售人员帮助客户完成购买过程”。

个性化推荐系统的发展源于信息过载(information overload)问题,即面对互联网中的海量数据和信息,用户无法处理,导致用户无法合理利用信息。针对这一互联网中广泛存在的问题,主要的解决方法有两种。第一种为信息检索系统,通过关键词检索来过滤信息,常见于搜索引擎,如百度,Google;第二种即为个性化推荐系统,通过用户的偏好、兴趣来为用户推荐合适的内容,这一技术已经在许多领域得到了较好的应用,其中电子商务领域尤为突出。

推荐系统原理

如上所述,电子商务领域推荐系统的主要任务是根据用户的喜好来为用户提供合适的购买建议和产品信息。根据推荐系统适用领域的不同、面向群体的不同、推荐程度的不同,其算法和架构存在一定的区别。但是几乎所有的推荐系统都有着基本的通用架构,即包含三个模块:后台的推荐引擎、系统日志及前端的页面,如下图所示[23]

图 2.1 推荐系统模型

其中,用户日志用来存储用户的历史行为,如购买、浏览、收藏等行为,推荐引擎则通过推荐算法,匹配用户日志和商品信息生成推荐结果,最后由前端的各种页面向用户展示推荐结果。

在上述流程中,其模型关键在于对用户日志的存储和推荐的算法。无论推荐系统如何调整,这两个模块都是必须的。其中挖掘模块负责挖掘用户和商品的特点,进行模式挖掘和识别,将识别的结果存储在数据库中,推荐模块则根据不同的场景为用户生成推荐列表[4]

以上是毕业论文大纲或资料介绍,该课题完整毕业论文、开题报告、任务书、程序设计、图纸设计等资料请添加微信获取,微信号:bysjorg。

相关图片展示:

您需要先支付 80元 才能查看全部内容!立即支付

企业微信

Copyright © 2010-2022 毕业论文网 站点地图