面向食品安全论坛的爬虫技术研究文献综述
2020-06-04 20:19:06
近年来,随着移动端app的兴起,饿了么、美团等外卖app变得火热起来,人们的订餐需求日益加剧,只需要轻轻一点,所选的食物就会在短时间内送上门来,然而,许多商家为了追求利益,节约资本,不断的偷工减料,更有甚者添加不安全的添加剂,虽然商家利益得到了提升,随之而来的问题是食品是否干净、安全?人们对食物的需求提升必须是建立再食物相对安全的基础上的。
人们有权利知道自己买的食物是否安全,最好能有一个比较准确的判断。
食品的安全性需要通过消费者切实的评论感受来加以判断,但是消费者的评论充满了数量多和准确性有限的特点,所以必须需要一种技术来收集和分析这些数据。
随着网络的兴起,越来越多的网站层出不穷,网站上的信息也是多的数不胜数,当你想要某些网站的所有数据的时候,那一点一点的慢慢复制粘贴是一个既费时又费力的办法,这个时候就需要网络爬虫来帮忙了。
网络爬虫能够轻松的把需要的数据收集起来,方便研究分析。
而分析就需要用到python的情感词库了,情感词库能够通过一段话里面关键的几个表明自己态度的词语通过加分减分的方式来给这段话打分,不同程度的消极或者积极的词语会给不同的分数,用分数来判断这句话是什么情绪的观点。
以此来分析消费者评论的观点。
本文就食品安全方面的问题利用网络爬虫来获取数据加以分析研究,旨在深化网络爬虫的实用性并且解释一些食品安全方面的问题。
对此,利用爬虫去去分析一些食品论坛对食物的评论,并把这些数据收集起来,通过科学的方法加以分析、研究。
(二)研究意义 面对大规模的餐营业的涌出,食品安全必然成为人们需要担心的首要问题,这次研究能够给人们带来相对准确的数据来判断食品安全与否,而对于商家则有了对于他们自身食品安全与否的评判标准,能迫使他们使自己的食品合格化。