用户评论效用分析系统的实现毕业论文
2021-04-02 21:15:35
摘 要
在互联网快速发展与普及的今天,各大电商平台乘势壮大与成熟,使得网络购物逐渐融入人们的日常生活。商品评论作为指导用户购买商品的重要依据,其质量却参差不齐。在海量的商品评论面前,用户不得不花费大量的时间找到有效的评论,获取其中有用信息。
针对此现状,本文研究并分析了评论的有效性,旨在实现一个通过有效性进行排序的评论分析系统,使有效的评论能够被用户快速了解。本文通过选取评论者会员等级、评论发表时间、评论文本长度以及评论关键词个数来对评论的有效性进行分析和计算。
解决方案层面,本文采用了直线型无量纲化的极值法对数据进行标准化,并采用模糊层次分析法对各指标权重进行计算。最后通过分析评论排序结果对各指标权重以及整体算法进行改进。
系统实现层面,本文将系统分为三个模块:数据获取模块、指标提取模块以及有效值计算和排序模块。使用了Jsoup爬虫和庖丁分词技术协助系统的开发和实现。
关键字:商品评论;评价指标;无量纲化;层次模糊分析法
Abstract
Nowadays, with the rapid development and popularization of the Internet, the E-commerce platform gradually grow up and become mature, which making online shopping gradually into people's daily lives. As an important basis for guiding users to buy goods, the quality of Commodity reviews is uneven. In the face of massive commodity reviews, users have to spend a lot of time finding effective reviews and getting useful information.
In view of this situation, this paper studies and analyzes the validity of the review, and aims to realize a comment analysis system which is sorted by validity, so that effective comments can be quickly discover by users. In this paper, the validity of the comment is analyzed and calculated by selecting the membership level of the commentator, commenting the publication time, the length of the comment text and the number of comment keywords.
At the level of algorithm, this paper adopts the linear dimensionality method to standardize the data, and uses the fuzzy analytic hierarchy process (FAPH) to calculate the weight of each factor. Finally, the weight of each factor and the overall algorithm are improved by analyzing the result of the review.
At the system construction level, this paper divides the system into three modules: data acquisition module, factor extraction module and effective value calculation and sorting module. This paper uses the Jsoup reptile and Pardin word segmentation technology to assist in the development and implementation of the system.
Keywords: Commodity review; Evaluating indicator; Dimensionless; Fuzzy analytical hierarchy process(FAHP)
目录
摘 要 I
Abstract II
目录 1
第1章 绪论 1
1.1研究背景 1
1.2研究目的与意义 1
1.3国内外研究现状 1
1.4技术路线 2
1.5本文结构 3
第2章 商品评论有效性分析 4
2.1商品评论分析和选取 4
2.2评论效用影响因素 5
2.3本文使用的评价指标 6
第3章 商品评论有效性判断 7
3.1多属性决策问题 7
3.2构建商品关键词词表 8
3.3商品评论有效值计算 8
3.3.1评论预处理 8
3.3.2关键词匹配 8
3.3.3数据无量纲化 9
3.3.4权重的确定 9
第4章 算法的改进 10
4.1评论效用结果分析 10
4.1.1评论整体排序情况分析 10
4.1.2针对各指标对评论有效性影响的分析 11
4.2有效值计算算法改进 12
第5章 系统原型的实现 15
5.1系统分析 15
5.2系统设计 15
5.2.1获取评论数据的解决方案 15
5.2.2提取评论有效性影响因素的解决方案 16
5.2.3计算评论的有效值与排序的解决方案 18
5.3系统实现 19
5.3.1评论数据获取模块 19
5.3.2 评论有效性影响因素提取模块 21
5.3.3评论有效值计算与排序模块 22
第6章 总结与展望 23
6.1本文总结 23
6.2未来工作展望 23
参考文献 24
致谢 25
第1章 绪论
1.1研究背景
互联网的快速发展促进了电子商务产业的建立和壮大。各大电商平台的快速成长和普及已经将网上购物融入到几乎每个人的日常生活。快捷的购物方式方便了人们的生活,但是因为其商品并不透明,用户只能“远观”而不可“亵玩”,从而难辨真假好坏,由此产生了商品评论。作为前人之言的评论,一定程度上引导了其余用户的购买意向。实际上,随着电子商务产业系统的逐渐成熟,在线商品的评论信息已经成为消费者进行网络购物决策时的重要参考依据之一[1]。消费者开始习惯于在线评论自己对商品和服务的看法,并使其评论内容对其他消费者的购物决策造成影响[2]。但随着评论的增多,一些冗杂的、无意义的,甚至是和商品毫无关联的评论逐渐出现,并且逐步增多。
这些数量众多,质量却参差不齐的评论,消耗着用户的时间和精力,用户却很难从这些评论中获取有用的信息。从而对如何选择商家,选择产品无所适从。针对目前的商品评论现状,我们需要研究并建立一个评论效用分析系统,对评论的有效性进行分析,筛选,让用户能优先看到质量高的评论,从而使评论的购买指导作用正确的发挥出来。
1.2研究目的与意义
本项目的目的在于研究并开发一个能够对评论进行分析的系统。给每条评论计算出一个准确的效用值,并以此筛选出效用值高的一部分评论,展现在用户眼前,方便用户看到高质量的用户评论。使得这些评论有效的指导用户购物。