基于在线评论情感分析的小米Pro消费者满意度研究毕业论文
2020-02-15 10:34:26
摘 要
当前,由于电子商务在中国高速发展,电子商务之间,电子商务平台之内的商家,都发生越来越激烈的竞争,如何快速有效的提升产品的竞争力,如何从消费者的视角去了解他们的内在需求,以此来提升产品满意度以及市场份额成为近来的研究热点。
本文主要以小米Pro产品为例,通过构建贝叶斯网络模型探究各特征因素对其客户满意度的影响。首先总结了之前研究电子商务满意度的一般方法,通过对这些方法进行对比分析确定在本文采用贝叶斯网络建模的方法。然后通过网络爬虫、文本情感分析、数据挖掘等对影响小米Pro产品客户满意度进行了实证研究,通过相关分析最终得出:(1)贝叶斯网络在构建小米Pro电子商务客户满意度模型上的效果较好,在准确度上优于人工神经网络。(2)通过研究各特征因素节点之间关系得出,不仅满意度与各特征因素之间存在影响关系,各因素之间也存在一些相互影响。(3)通过分析模型中各特征因素影响程度的关系发现,影响消费者对小米Pro产品的满意度最重要的三个因素从大到小依次是性能、外观和物流。
由于时间和能力的制约,本文未能全面的考虑满意度模型中特征因素的选取,只能从局部的几点出发,所以具有一定的片面性。尽管论文基于在线评论探究电子商务客户满意度影响因素的研究不够深入透彻,但这对我个人来说,是一次有意义的尝试,能够以后的研究提供一些参考。
关键词:在线评论;客户满意度;数据挖掘;贝叶斯模型
ABSTRACT
At present, due to the rapid development of e-commerce in China, between e-commerce and merchants within the e-commerce platform, there is increasingly fierce competition. How to quickly and effectively improve the competitiveness of products, how to understand their internal needs from the perspective of consumers, in order to improve product satisfaction Degree and market share have become recent research hotspots.
This paper mainly takes Xiaomi Pro products as an example to explore the influence of various characteristic factors on customer satisfaction by constructing Bayesian network model. Firstly, the general methods of researching e-commerce satisfaction are summarized. By comparing and analyzing these methods, the Bayesian network modeling method is used in this paper. Then through the network crawler, text sentiment analysis, data mining and other empirical research on the customer satisfaction of Xiaomi Pro products, through the relevant analysis, it is concluded that: (1) Bayesian network in the construction of Xiaomi Pro e-commerce customer satisfaction model The effect is better, and the accuracy is better than the artificial neural network. (2) By studying the relationship between the nodes of each characteristic factor, not only the relationship between satisfaction and various characteristic factors exists, but also there are some mutual influences among various factors. (3) By analyzing the relationship between the influence factors of various characteristic factors in the model, it is found that the three most important factors affecting consumers' satisfaction with Xiaomi Pro products are performance, appearance and logistics.
Due to the constraints of time and ability, this paper fails to comprehensively consider the selection of characteristic factors in the satisfaction model, which can only be based on local points, so it has a certain one-sidedness. Although the research based on online commentary to explore the influencing factors of e-commerce customer satisfaction is not thorough enough, it is a useful attempt after all. Personally, it is a meaningful attempt to provide some reference for future research.
Key words:Online review; customer satisfaction; data mining; Bayesian model
目 录
摘 要 I
ABSTRACT II
第1章 绪论 1
1.1研究目的与研究意义 1
1.1.1研究目的 1
1.1.2研究意义 1
1.2国内外研究现状 1
1.2.1情感分析相关研究 2
1.2.2在线评论相关研究 2
1.3研究内容与研究方法 2
1.3.1研究内容 3
1.3.2研究方法 3
1.3.3技术路线图 4
第2章 相关理论基础 5
2.1电子商务客户满意度分析 5
2.1.1电商平台 5
2.1.2商品属性 6
2.1.3商家服务 6
2.2数据挖掘技术概论 6
2.2.1数据挖掘的定义 6
2.2.2数据挖掘与传统数据分析方法的区别 7
2.3满意度的测评方法比较分析 7
2.3.1多元线性回归法 7
2.3.2层次分析法 8
2.3.3人工神经网络 8
2.3.4结构方程 9
2.3.5贝叶斯网络 9
第3章 在线评论数据采集及处理 11
3.1评论数据获取 11
3.1.1评论数据来源 11
3.1.2在线评论采集过程 11
3.2评论数据预处理 12
3.2.1评论数据采集结果 12
3.2.2高频词汇提取 13
3.3在线评论特征因素归纳总结 14
第4章 小米Pro客户满意度影响因素模型 17
4.1小米Pro贝叶斯网络模型构建 17
4.2小米Pro贝叶斯网络模型分析 17
4.2.1小米Pro贝叶斯网络模型 17
4.2.2节点条件概率分析 19
4.2.3节点重要性分析 22
4.3模型准确性评估 23
4.4研究结论 25
第5章 结论 27
5.1全文总结 27
5.2研究创新点 27
5.3不足与展望 27
参考文献 29
致谢 31
第1章 绪论
1.1研究目的与研究意义
1.1.1研究目的
现今,网络空间逐渐成为消费者交流、分享经验的重要活动载体,消费者逐渐的从单纯的网络消费者转变为网页内容的制造者,通过不同的例如博客、微博、各种购物网站来表达、讨论、传播他们的观点。其中就包括电子商务平台上消费者对已购买商品的在线评论。在线评论是已购买者在商品网站下的主观情感表达,具有很高的独立性与真实性,同时也具有很高的参考价值。
因此对在线评论进行挖掘,并分析消费者对商品的情感诉求,对于改进产品和调整营销策略是十分有意义的。
1.1.2研究意义
消费者是商品服务的主要对象,商品使用过程中会给消费者带来各种不一样的情感体验,而电子商务在线评论平台往往成为新时代消费者抒发这些主观意见的平台,获取这些主观意见并比较分析其对其他消费者进行购买决策的影响程度具有重要意义[1]。传统方法是使用问卷调查,但这种方法存在许多不足之处,例如问题复杂性高可能产生信息采集质量低、问卷发放回收耗费大量人力、物力、回收周期长等问题。因此,充分使用在线评论信息,通过文本挖掘和情感分析等技术,分析客户产品购后使用体验,由此来对产品功能属性以及服务质量等方面进行改进,这对消费者和商家都有重要的意义。
本文使用到了爬虫、文本分析、情感分析等技术,对在京东商城上的约1000条小米Pro在线评论进行清洗、筛选、量化、和分析,同时将评论中的若干重要关键词、特征因素等进行聚类分析,在此基础上通过评价小米Pro在不同维度上的情感得分,构建了关于小米Pro产品的客户满意度模型,最终评价特征因素的影响作用。
1.2国内外研究现状
商品在线评论的内容是消费者对商品的整体感知以及满意情况的反馈。消费者在购买商品后通常会通过在线评论来表达自己对该产品的情感诉求,同时也就在该平台上产品页面上留下大量的评论数据,消费者在编写这些评论数据时一般不会受到他人的影响,能比较真实的反映消费者的真实感受。因此,通过对这些文本型数据进行发掘研究对提高客户满意度具有重要的研究意义。
1.2.1情感分析相关研究
在情感分析的研究领域上,虽然国内起步的时间相对于国外较晚。但是在这较短的发展时间内,出现了许多对该领域研究有着浓厚兴趣的学者,这让国内的研究水平不断提高,逐渐缩小了与国外学者的差距。情感分析多用于对各类社交网站上的文本分析,例如微博、社交平台以及视频网站等,近年对通过情感分析,能快速的获取用户的情感诉求,找出用户的喜好,有利于商家更好地发掘并满足用户的实际需求。情感偏好分析也称作文本信息挖掘、情感偏好信息挖掘,其任务是要从短语、句子或者文章中得到评价者、被评价对象、评价词、情感倾向强度等评价关键要素,以此组成对应的评价单元。
张紫琼等通过研究近几年学者使用的情感分析领域上的研究资料,总结整合出当前情感分析比较可行的几种方法,通过对这些方法进行比较,提出了这些方法存在的问题,包括语料不够完整,语义模糊难以界定等问题。同时,作者提出了几点做情感分析的建议和研究方向,希望在技术上实现提高精度和识别能力的突破 [2]。
杜家忠等总结了汉语言中识别存在的问题。例如某些特定领域上的语义不能识别,某些语句存在歧义导致识别错误等问题。同时他提出了他的研究建议,即构建特征-情感词评价单元这一方法来提高识别的精度。
1.2.2在线评论相关研究
由于国内网购的服务水平不断提高,以及人们在网络上购物的习惯养成,各电子商务平台上的在线评论的数量也成爆发式的增长,这一宝贵的研究资料吸引力一大批学者的研究。当前,在线评论研究的方向主要有:如何影响在线客户的网购决策;如何基于在线评论改善产品体验;如何对评论文本进行分析以及对其有效性进行评估。虽然在线评论能真实有效的反映客户对产品的需求和体验,但是如何最大化的挖掘出这些“有用信息”成为目前学者与商家面临的最大的难题。
余陶靖等基于口碑传播理论,从心理学的角度上,对客户进行网络购物的心理决策过程进行分析,构建了在线评论影响网络购物决策的模型,研究了在线评论对其他消费者购买决策的影响[3]。
魏华(2017)基于消费者视角,以产品对消费者的吸引度和消费者专业能力为变量,构建了基于在线评论的决策模型,研究得出了在线评论对消费者购买决策有显著影响[4]。
艾德马维休斯通过对在线评论进行评估得出分值,以此来量化用户在各产品属性上的满意度情况,以此来模拟客户情感表达,发掘出了用户的潜在诉求。
1.3研究内容与研究方法
本文主要对京东商城上的小米Pro的在线评论情感分析,研究该产品的消费者满意度。为了确保本文研究的可靠性,采取的数据来源是京东商城上的真实在线评论,下面详细介绍本文主要解决的问题和研究方案。
1.3.1研究内容
(1)利用网络爬虫相关技术,抓取京东商城的评论信息,并对评论文本进行识别出其中有用性文本,减小干扰,保证后续研究的准确性。
(2)对在线评论进行清洗,提取出有用性文本中的情感偏好字段,将其按照一定标准进行归类,形成相应的情感描述词,使得挖掘后的数据更加简洁,具有可操作性。
(3)针对挖掘到的这些情感特征词运用情感计算方法更加准确的获得消费者对该情感特征的情感倾向以及情感强度,形成多维的产品情感属性评价单元,并研究分析影响消费者满意度的特征因素,向消费者和商家提供准确有用的信息。
1.3.2研究方法
(1)文献研究法。通过查阅寻找当前国内外对在线评论、文本分析、数据挖掘等方面相关的论文,把握当前的研究现状和能实现的技术支持。本文结合国内电子商务发展的特点,以及当下研究的不足,确定了本文初期的选题和研究方向,为后面的研究中存在的问题提供了解决的理论依据。
(2)定量分析法。本文选取京东商城中的小米Pro作为此次研究的对象,对该产品的在线评论信息的采集、数据预处理、数据挖掘建模及对模型进行分析评估是文章的主要内容。
(3)模型分析法。将收集处理好的数据制成Excel表格导入到SPSS软件中选择合适模型进行建模分析,得出各特征因素的影响重要程度排名及影响关系模型。对模型进行分析、验证以及准确性评估以得出结论。
1.3.3技术路线图
文献研究
情感词典、量化打分
SPSS建模
图1.1 本文技术路线图
第2章 相关理论基础
2.1电子商务客户满意度分析
近几年来,国内外都存在大量的对于满意度研究的文献资料,通过对这些文献资料进行总结分析发现,大致可将影响网购客户满意度的因素分为电商平台、商品属性以及商家服务三个方面。如图2.1所示
客户满意度
图2.1 电子商务客户满意度影响因素图
2.1.1电商平台
电子商务平台是一个在互联网背景下诞生的新的商家与客户交易的场所,通过该场所,商家可以开设店铺、陈列产品信息以及售卖商品,消费者可以进行商品信息的搜寻、进商品的选购与咨询等行为[4]。因此不同的交易平台会给消费者带来不同的购物体验,也会直接影响消费者对该产品的满意度。电商平台影响满意度的属性有很多,比如便捷易操作性、友好的界面以及客户账户的安全保障等等。便捷易操作性主要指客户在对页面进行操作时,能十分简单的直接找到自己需要的商品信息与界面,不需要繁复的操作流程。页面便捷性指的是页面的人性化布局,能将最重要的,消费者最想的到的信息放在最显眼的位置,减少消费者的信息搜寻成本。账户的安全性保护付款账户以及平台账户的安全,平台应努力保护客户的信息安全以及财产安全。
2.1.2商品属性
商品属性是消费者最能直观体验到的属性。商品的功能能不能满足客户的核心购买直接影响客户的满意度。由于网络购物模式的特点,客户会首先形成对产品的期望【5】。当实际产品属性超出产品期望时,能获得较高客户满意度;当低于产品期望时,将造成客户的不满心理,甚至会受到在在线评论上客户的不满情绪表达。