旅游民宿评价情感分析系统的设计与实现文献综述
2020-04-15 09:37:44
随着互联网技术的发展,深刻地改变了传统旅游业的营销结构和方式,带来了旅游业的新发展。近年来,旅游类产品层出不穷,不仅对旅行目的地起到了宣传作用,还给广大游客出行带来了便捷。
在Web1.0时代,游客通常使用搜索引擎来查找旅行目的地的相关信息。然而,当游客要做出决策时,还是需要他人的经历和观点作为指导。近年来,网络已经成为一个便捷的信息交流平台,越来越多的人开始利用网络发布信息或发表自己的观点。其中,由旅游者贡献内容、自由评论的旅游网络社区,受到广大旅游者的普遍青睐,其评论信息也成为很多旅游者选择目的地的重要依据。然而,由于游客发表评论的目的或角度不同,评论信息经常带有感情色彩,且是正负意见相混合的。当人们上网去查阅某个旅行目的地的相关信息时,通常需要花费大量的时间,且读到的信息十分有限,并不能快速的有效地提取有用、精华信息。
国内许多大型的旅游网站如:携程、去哪儿网、马蜂窝等为广大旅客提供了各种旅游项目服务,同时也开设了旅游社区游客分享信息,以及游客评论等功能。这些旅游评论日益增多,已经成为丰富的资源,但缺乏挖掘和利用。国外的知名旅游网站Airbnb,中文名是爱彼迎爱彼迎是一家联系旅游人士和家有空房出租的房主的服务型网站,它可以为用户提供多样的住宿信息。其中一大特色就是游客和房主之间可以相互评论以供后人参考。
因此如何获取和挖掘旅游社区中海量的在线评论信息,智能化的分析用户的反馈和评价,从而改进旅游产品和服务,成为旅游电子商务成功的关键之一,情感分类技术便可以通过对大量评论进行正负情感分类而全面高效的挖掘评论信息。目前,已经有很多面向英文旅行评论的情感分析研究,如利用SentiStrength软件能够处理文本中包含的不同类型的信息,包括表情符号和助推词的分析,重复字母的拼写纠正,以及使用否定词(例如,不)来翻转情绪。它报告了正面和负面情绪的两个单独数字。正数范围从1(非正)到5(非常正)。负数范围从 -1(非负)到 - 5(非常消极)。并且取得了一定的成果。作为全世界网民数量最多的中国,中文信息已经成为国际互联网上非常重要的部分,但面向中文评论的情感分析技术还有很多问题有待研究,目前国内旅游领域的情感分析研究不够深入,未能考虑到中文的复杂多样性和评论集的不平衡性。如:文献《中文文本情感分析综述》针对中文文本情感分析的研究现状与进展进行总结。现有中文文本情感分析研究,存在以下问题(1)词语的情感倾向判别只是局限在形容词,实际上一些名词和动词也具有情感倾向,而且应该结合具体的语境和领域来判别词语的情感倾向;(2)针对语句和篇章的情感分析还比较粗粒度,应该更精确地更细粒度地对某一个具体的评价对象进行分析。文献《基于情感字典与连词结合的中文文本情感分类》首先利用基础情感词典以及基准词对所需研究领域的评论文本进行分析,以此获得特定领域具有感情倾向的特征词语。而后利用基准词以及获得的特征词语对评论进行分析,对于有感情词的句子,采用计算感情值来判别其感情倾向以及感情程度,对于无感情词的句子,采用连词的方法来进行感情的判别。该方法考虑到了领域特性,但是还是没有针对特定领域(如旅游),所以文本情感分类的准确率还有较大的提升空间。
对旅游评论进行情感分析,可以得到某目的地城市满意度指数,从而帮助游客对该城市有个整体认知。根据城市的旅游维度,可以将评论分为景点、酒店、餐饮、购物、娱乐、交通六类评论,逐类进行情感分析,可以帮助游客选取人气高、服务质量好的景点、酒店和餐馆。情感分析也可以实时地提醒旅游从业者如:酒店管理者、景点管理人员等提示服务质量,改善消费者的旅游体验。本系统以旅游民宿网站为例,通过抓取网络评论并分析其情感倾向,从而实现一系列的功能。
{title}2. 研究的基本内容与方案
{title}
系统架构提供三个基本功能:
网络评论自动抓取功能:将评论从旅游民宿网站上抓取下来,以便之后的分析。
网络评论情感分析功能:对评论进行情感分析,判断情感倾向(正面或负面)及极性(强弱程度)。
评论展示功能:结合之前两个功能,以饼状图的形式将某个城市的民宿评论具体情况直观的展示给用户。
主要框架如下图: