基于Python的用户评论数据分析开题报告
2020-04-22 19:15:04
1. 研究目的与意义(文献综述)
随着电子商务的不断发展和普及,在线支付功能的便捷性和安全性不断提高,物流快递行业的迅速兴起,网上购物已成为了人们生活不可缺少的一部分。网上购物可以减少购物时间成本,但是与实体购物相比,不能现场对比产品的优劣,加上互联网信息容量过于膨胀,使得消费者经常会迷失在大量的商品信息中,从而使消费者选择自己心仪的商品变得异常困难。因此,目前主流的网上商城都为用户提供的商品评论功能,用户可以在网上发表自己对所购买商品的评价,这既可以向网上商城和商品卖家提供购物反馈信息,也可以为其他用户提供更丰富的商品信息,弥补了网上购物无法直接接触到实体商品的缺点,为用户网上购物的决策提供非常大的帮助。
然而,现在网上商城中的商品种类、数量繁多,并且商品对应的评论数量非常大,这些评论信息以爆炸式的速度在增长,一些热门商品的评论数量可达到几十万条。这里就存在一个很大的问题,如果用户需要较为全面地了解商品,那么需花费非常长的时间用于阅读大量评论。虽然各大网上商城都为用户提供了评论分类功能,即根据用户对商品的评分,将评论划分为好评、中评、差评三种类别,用户可以选择性地查看自己感兴趣类别的评论,但仍然无法为用户提供比较直观且全面的信息。
为解决商品评论数量过多造成的问题,本文通过对商品评论进行基于python技术的数据分析,从这些评论中尽可能地挖掘出对消费者和商家有用的信息。2. 研究的基本内容与方案
2.1基本内容、目标
本文以京东商城中的手机产品为例,通过python语言和mysql数据库技术对其产品信息和用户评论内容进行数据分析,主要基于手机产品的相关属性的统计和用户评价内容的分析两项核心工作。主要分析的内容有:用户评分以及好评率、手机不同颜色的分布情况、手机不同版本的分布情况、24小时评论时间分布情况、用户客户端分布情况、用户会员等级分布情况、评论内容的关键词展示等等。通过折线图、柱状图、饼图、词云等形式,向用户展示这个产品的客观评价结果并作出相应的分析,为商家以及消费者在购买策略上提供一定的帮助。
3. 研究计划与安排
2018.1.20之前:完成毕业设计选题;
2018.3.25之前:结合选题和任务书的目标要求,完成开题报告撰写;
2018.4.12之前:需求分析,确定具体功能;
4. 参考文献(12篇以上)
[1][挪]海特兰德. python基础教程(第2版·修订版).北京.人民邮电出版社. 2014
[2][澳)理查德·劳森(richard lawson).用python写网络爬虫.北京.人民邮电出版社. 2016
[3][美]米切尔(ryan mitchell).python网络数据采集.北京.人民邮电出版社. 2016