登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 毕业论文 > 经济学类 > 电子商务 > 正文

用户评论特征情感提取与商品销量关联分析毕业论文

 2020-02-22 20:36:48  

摘 要

Abstract II

第 1 章 绪论 1

1.1 研究背景 1

1.2 研究意义 2

1.2.1 理论意义 3

1.2.2 现实意义 3

1.3 研究内容 3

1.4 研究路线 5

第 2 章 相关理论研究评述 6

2.1 文本极性分析 6

2.2评论与销量关联性 7

2.3 用户评论的要素及价值 8

2.4 部分相关文献阅读汇总 10

第 3 章 模型构建与算法设计 13

3.1模型构建 13

3.2 算法设计 14

3.2.1 数据爬取 14

3.2.2 评论挖掘 15

3.2.3 挖掘结果与汇总 16

3.2.4 回归分析方法 17

第 4章 实证分析 19

4.1 用户评论数据收集 19

4.2 数据预处理 19

4.3 特征挖掘与极性分析 19

4.4 模型的建立及检验 22

4.4.1线性回归模型 22

4.4.2柯布-道格拉斯效用模型 23

4.5 结果分析 25

第 5 章 总结与展望 27

5.1 总结 27

5.2展望 27

参考文献 29

致谢 31

摘要

随着Web2.0的发展,用户对消费对象的反馈和观点表达的途径已基本转移到线上,商品评论作为主要的表达渠道为用户所普遍接受,并最终对商品的销量产生影响。本文从商家角度出发,以用户评论的文本内容为主要研究对象,收集主流网站商品的评论作为实验基础数据,挖掘相应产品服务的特征属性,分析用户的情感极性,使用TF-IDF算法计算特征的强度,并分别通过线性回归和柯布-道格拉斯效用函数两种模型分别探讨用户评论中所包含的产品特征信息及用户的情感正负对于销量的影响情况,进而得到产品及服务的特征层面的改进方向,为企业和商家提供更加精准化的营销管理决策及产品改进方案。

关键词:用户评价 特征挖掘 情感极性 产品销量

Abstract

With the rapid development of Web2.0, users' feedback on products and ways of expressing opinions have migrated online, online reviews have been accepted by customers as a major channel of expression and have a significant impact on the sales of products. This study is conducted from a business perspective, take the text of the customers’ reviews as the main research object, collect mainstream website product reviews as experimental data, mining the features of products and sentiment polarity of customers, calculate the strength of the features by the TF-IDF algorithm, discuss how is sales affected by the product feature information and emotional polarity contained in the customers’ reviews through linear regression and Cobb-Douglas utility function, and then get the direction of improvement of products or service , provide more precise marketing management decisions and product improvement programs for enterprises and businesses.

Keywords:Online user reviews; Feature extraction; Sentiment polarity ; Product sales

第 1 章 绪论

1.1 研究背景

身处web2.0发展的青壮年时期,以社会网络为媒介的网络人际传播发展如日中天,多种购物、服务平台等传统的电子商务网站都开始融入社交网络功能,像社会化商务网站转变,为用户提供获取产品、服务信息的双向平台。如图1.1所示,根据中商产业发布的《2018-2023年中国网络购物市场前景及投资咨询研究报告》中的内容所述,2017年全国网络购物零售额达到71751亿元,比上年增长32.2%。其中,仅实物商品网络购物零售额为54806亿元,增长了28.0%,占社会消费品零售总额的比重达到15.0%,从数据来看,电商消费市场增长势头迅猛,伴随着交易规模的急剧扩大,随之而来的是同样数量庞大的在线评论,面对这样的现状,识别客户的评论价值不仅关系到消费者自身重复购买的意愿,更对其他消费者的购买意愿产生影响。

图1.1 2014-2018年网络购物交易规模统计图

社会化商务创造了让人们在线协作的空间,通过口碑信息的展示、分享和传播,使得用户的焦点快速聚焦到目标产品或服务的相关属性[1]。因而用户从发现商品到购买决策环节所花费的时间也得到了缩短,这种融入了口碑力量和用户影响力的行为一方面为平台的用户提供了便利,另一方面也为平台商家提供了产品管理及改进的提升空间。

而在网络市场上,越来越多的用户乐于在购物网站和点评类网站(如淘宝、京东、大众点评、美团等)上通过文字、图片甚至视频的形式来发布对相关产品或服务的评价,而用户对于消费行为的价值感受往往会通过给商品或服务的评价反馈出来,在消费者评论中涵盖了丰富的信息,有助于企业了解消费者真实需求。

由于网络购物具有一定的虚拟性,消费者无法像传统线下消费渠道那样,看到商品的实体或者感受商品的质量,所以在进行线上购买决策时往往存在风险。这个时候在线评论在消费者的购买决策中就起到非常重要的作用,如今消费者们的日常消费行为也越来越倾向于以网络上的评价信息作为自己消费意愿的重要参考[2] [3]:商品、服务评价的数量,好评及差评数量,产品属性、客服态度甚至物流等相关的评价所反映出来的信息都会成为影响消费者决策的重要因素,进而影响到商品或服务的销量。Liang[4]通过研究发现,67%的顾客会考虑社区中其他顾客的意见,然后进行购买决策,社区中的用户自生成内容对于顾客购买决策的可信度高,参考价值大。

就用户的评价内容本身来说具有双面性[5],一方面好的评价可以弥补线上浏览商品介绍的不足,完善产品细节,促进销售;而另一方面,用户评论也会暴露出一些产品相关的问题,降低商家对产品的描述可信度,影响销量。

就企业角度来说,与消费者相关的研究是普遍关注的话题。众所周知,每当用户产生一次购买行为,都会为企业带来一定的利润即直接价值,而用户所产生的评论行为作为购买行为的附加反馈,也同样会为企业带来一定的价值与影响。社会化商务环境下,对比传统商业,以互联网为媒介的电商企业,其消费者的评论信息作为消费者情感反馈的直接表现[6],且如今已有语言、数据处理工具的支持,获取数据也变得更为方便,而数据挖掘技术,特别是文本挖掘技术,使得从非结构化文本信息中获取与消费者相关的有用信息成为可能。还原这些数据背后消费者的行为特征和价值特征,进行消费者评论价值识别及其反馈的特征挖掘,对企业在互联网市场上的竞争力和竞争地位具有直接影响[7]。因此如何根据电子商务中产品的在线用户评论,探讨其与产品销量的关联性,建立可量化的模型,为用户和商家提供效率可靠的决策依据有着非常重要的作用。

1.2 研究意义

在社会化商务环境下,消费者对于产品、服务的感知价值往往通过评价表现出来[8],而消费者评论具有较强的网络口碑效应,网络口碑是其他消费者决定是否购买企业产品服务的重要依据,也是影响企业销量的重要因素[9]。而以在线评论为主要表现手段的网络口碑能够更好地帮助消费者做决策[10],其中所包含的各种因素及对销量的影响效果如何都值得我们进行深入的研究。本论文选题迎合了当今网络市场研究的热点问题,从商家的角度出发,基于产品特征及用户情感倾向两个维度提出从用户评论文本内容获悉影响产品销量的关联性及具体到商品或服务特征的可改进的方向。

1.2.1 理论意义

本研究的理论意义在于:

(1)现已有的研究对在线客户评论影响销量的探究较少,尤其缺少评论情感对销量作用的研究,而评论情感对于消费者购买意愿的影响是不容忽视的。本文不同于以往对用户消费行为或评论行为的研究,而是从商家的角度出发,针对用户评论内容中所包含的信息加以分析利用,研究的粒度更小一些,选取知名大型商务网站天猫商城的在线评论为真实数据来挖掘其中的规律,并建立理论模型,提出假设,通过量化其中各项因素得出结论,深入研究了结合产品特征的用户情感对于产品销量的影响,探究了评论情感在影响消费者购买决策过程中的重要作用,进一步扩充了相关领域的研究。

(2)本文进一步考察了主流电商网站用户评论文本中所包含的产品特征,再结合特征维度的用户情感倾向来对用户在线评论内容对产品销量的影响进行研究,利用细粒度的情感分析方法、计量经济学模型进行比较研究,深层次地理解产品特征属性对应的的评论情感对产品销量的重要影响,为消费者的搜索行为、网站销售商的营销策略、网络平台运营等方面的理论研究做出补充。

1.2.2 现实意义

本研究的现实意义在于:

(1)指导消费者购买:通过对对应已有在线评论的分析,为潜在消费者提供清晰了然的用户评价信息,消费者可以充分借鉴和阅读该网站的客户评论,降低搜索成本,帮助其做出正确的购买决策,减少用户在购买决策时的产品认知错误,降低购买风险。

(2)指导商家销售:通过对所售商品的用户评论信息,指导商家合理利用客户评论来预测产品销量,进而通过发现和比较消费者的特征偏好来对产品进行改进,并制定对应的营销和广告策略,为企业降低营销成本,此外,也可以通过用户评论改进产品消费流程中所涉及到的其他服务,例如客服、物流、售后等,帮助商家针对性地提升产品和服务质量,在市场竞争中增强优势。

(3)指导生产商设计:通过对产品特征评论情感的深入研究,可以反映出消费者对产品的那些特征属性更加重视,帮助生产商发现和利用其中的有效改进信息,对用户不满的特征进行改善,对用户满意的特征进行保持或发扬。

1.3 研究内容

本文从商家的视角出发,以用户评论内容为基础,提出从评论所反映出的用户情感倾向及产品特征两个因素来获悉影响产品销量的因素及可改进的方向。

拟选定天猫商城价位区间为299-499元的排名前30的美的电饭煲商品评论数据,使用爬虫工具对其用户的评论信息进行爬取,并对评论的文本内容进行收集,并通过数据预处理、产品特征提取、建立情感词典、与特征强度计算等方式,对获取到的数据进行语义分析。在此基础上,筛选有效数据,建立量化模型以探究客户评论价值的识别及评论信息与销量之间的关系,得出各因素对销量影响的显著性和弹性,并且依据模型所得出的结论给予企业针对提高销量的合理性建议与指导。

总的来说,本文的工作主要包含四个方面,如图1.2所示:

图1.2 研究内容

(1)针对文本评论中用户情感倾向的判断,我们需要进行相应的信息挖掘,构造评论语料库,然后基于语料库采用TF-IDF的方法来对产品的文本内容进行情感倾向的分析。由于自然语言在情感表达方面具有复杂性,人们的情感通常不总是通过情感倾向明显的词语来表达,即自然语言文本包含显式的情感,也包含隐式的情感[11],但已有学者在其研究中证实显性情感的影响力远大于隐式情感,因此本文主要选择显式情感来作为模型建立的基础。

(2)根据商品类型的不同从评论文本中选取相应的商品属性特征指标,与情感因素加以权值融合到模型中,首先通过线性回归模型确定各个主要因素对销量的影响程度,然后再通过对柯布-道格拉斯生产函数结合本文研究对象进行演化探究各个因素对销量的动态弹性影响程度。

(3)针对提出的模型利用爬虫工具获取天猫网上商城的美的电饭煲4L的真实评论作为实例验证的基础数据,分别进行商品属性特征的选择,词汇频度及强度的计算,筛选用户最为重要的三个因素作为自变量,针对情感倾向的正负对强度进行标注,因变量为销量,最后通过分别通过线性和非线性回归确定各因素的系数,确定模型,结合实际进行分析。

(4)根据实验过程及得出的结论,提出用户评论中所包含的商品相关信息对于商家改进和发展的价值所在,并结合实例展开分析,给出有利于商家利用用户评论来提高销量的具体化措施。

1.4 研究路线

理论综述

理论模型构建

评论采集及预处理

多元回

归分析

挖掘结

果汇总

强度

计算

极性

标注

产品特

征挖掘

实证研究

结果分析

结论与展望

图1.3 研究路线图

第 2 章 相关理论研究评述

2.1 文本极性分析

文本极性分析即对文本中所包含的情感倾向进行分析,而情感倾向性分析是情感分析领域的研究热点,相关领域的学者们通常将其划分到文本分类问题中进行研究。带有主观性的文本往往带有文本发表者的情绪色彩,按照文本所带有的情感倾向可以将其分为若干个类别,例如分为褒义(Positive)、贬义(Negative)两类,或者也可以将其进行更为细致的区分,如喜、怒、悲等。

最初,情感倾向性的判断来自于人们对带有情感色彩的词语进行判别和分析,例如,人们往往用“漂亮”来表达对人或事物的赞美,是褒义的;而“丑恶”则是人们用来对不好的事物进行批判的词语,是贬义的。然而,由于主观性的文本在网络上层出不穷,该领域的研究对象也逐渐由较为简单的词语分析向复杂的句子及篇章方向转移。正基于此,由于文本的粒度、层次和长度不同,情感倾向性分析也可以分为词语级、短语级、句子级、篇章级以及多篇章级等多个研究层次。此外,由于文本之间同样具有类别上的差异,可将其大致分为基于新闻评论和基于产品评论的倾向性分析。其中,前者主要用于处理新闻评论文本,而后面这种情况主要用来处理线上产品评论,这便是我们重点关注的基于产品评论的情感倾向性分析。

通常带有情感倾向性的词语被称为情感词,一般根据情感词的褒贬倾向将其分为正( 1)、负(-1)、中性(0)三种倾向性情况。而在情感分析领域建立初期就引起了人们的广泛关注的词语或短语级别的倾向性分析,则是文本情感倾向性分析的基础。在此领域的早期研究中,曾有学者通过观察大规模的语料库中词语的统计特性,挖掘其中的情感词并进行极性判断。例如Jie Ren,William Yeoh等人[12]以用户评论的情感倾向即文本极性和评论的数量为研究变量,得出了负面消费者评论的数量推动了消费者的购买决策,但正面消费者评论的数量对购买决策的影响不大和消费者产生的积极评价比销售后的负面评价更多的结论;Stephen Skalicky[13]等人则以用户评论文本的情感极性与评论者的信息以及产品自身的描述信息相结合,借鉴了体裁理论和语义分析来对Amazon.com“最有帮助的”产品评论进行描述性分析;以国内相关领域的研究来说,姬轩等人[14]选取以用户评论中的产品特征所附加的情感极性研究情感信息对于销量的影响;董敏等人[15]以情感极性 产品特征为研究变量,主要基于语义分析研究了评论文本的相似度,采用SVM模型来进行情感方面的分析; 李慧颖等人[16]通过研究评论的有用性和情感极性,产品特征从两个方面来研究在线评论的影响:消费者感知(主要)amp;企业产品销量,并提出在商品描述中加入用户评论信息的影响作用。

2.2评论与销量关联性

以我国为例,包含在线客户评论的网站根据提供的信息模块大致分为两类,其中一种是由网络销售商主导的,将其称为销售网站,例如现今人们常用的淘宝、天猫、京东商城、亚马逊等,他们并不仅仅提供专门的在线客户评论区,此外更主要的是提供产品相关的详细信息以及产品的交易功能,这些网站通常都具有半结构化的用户评论板块;另外一种则是第三方点评网站,简称为第三方网站,他们不提供产品交易的功能,只提供产品相关信息的展示功能,主要包含了商品描述信息、专家意见、产品评测、用户评论等内容,这些网站专门为用户提供产品的口碑和资讯信息,典型的此类网站有太平洋电脑网、中关村在线等。

由于本文主要研究在线评论的哪些因素对销量有怎样的影响,从商家的角度出发,所以在此仅考虑包含交易功能的第三方网站。目前国内外在评论内容对产品销量影响这一领域的研究也在逐渐深入,比如Wenjing Duan等人[17]通过电影行业的用户在线评论及评分,着重研究了电影领域用户在线评论对销量的影响关系;Chrysanthos Dellarocas等人[18]主要选取了产品特征中的价格这一因素来研究电影这一产业中在线评论的口碑效应所带来的销量变化,并提出相应预测模型;Abdulaziz Elwalda等人[19]通过研究用户评论本身的质量好坏比如有用性和易用性,通过文本识别方法调查了用户评论的有效性、享受和控制因素对于客户的信任和购买意愿的影响;由于主流电商网站五花八门,用户评论成为商家和平台日益重视的信息,国内的学者也进行了很多该领域的研究,例如邹溪羽等人[20]除了研究情感倾向和产品特征,还通过价格调节属性和搜索型属性来研究产品特性(搜索型/经验型)的强弱对销量的主效应机制产生的调节效应;李雪妮[11]一方面选取情感倾向与产品特征相结合的变量选择,另一方面通过LSL总结评论中的显性和隐性情感,从“显式 隐式”两个层次的情感来进行挖掘,发现“显式”情感具有更大的研究价值,且补充了评论文本相关的评论长度、修饰词个数、评论质量等因素来对模型进行改良和修正,并用SAR模型基于LSL和前期销量进行销量预测;杜灵育等人[21]主要根据用户评论的情感倾向与铲平特征相结合,此外还考虑了产品涉入度对线路的影响,针对“产品涉入度”的不同主要度量用户评论情感对销量的影响;李健等人[22]仅仅就情感倾向的研究变量及评论的数目时效性,价格,评论长度等,重点研究商品层面的评论整体对销量的影响。

虽然目前基于用户评论在产品销量预测领域的相关研究已经有了长足发展,但大多学者都聚焦在评论行为对于产品销量的影响,基于评论文本自身从文本挖掘及用户情感倾向的分析研究只是少数,在这一方面,考虑到市场需求和汉语本身的复杂性和多样性,中文评论的文本挖掘与情感分析对于销量预测也具有重大的商业价值和意义。

2.3 用户评论的要素及价值

由于本文的研究对象是客户评论,因此首先要对在线用户评论的构成要素进行探讨,进而充分反映出本文选择客户评论作为研究对象的原因,并由其构成要素引出理论模型中变量的选择。

您需要先支付 80元 才能查看全部内容!立即支付

企业微信

Copyright © 2010-2022 毕业论文网 站点地图