食品安全论坛爬虫设计实现与数据可视化展示开题报告
2020-06-04 20:19:06
1. 研究目的与意义(文献综述包含参考文献)
(一)选题背景
自2015年10月1日起施行的《中华人民共和国食品安全法》对食品生产、销售、餐饮服务和食用农产品等各个环节管理做出细致规定,主要体现在以下八大亮点:刑事责任优先;违法行为最高可处30倍罚款;增加行政拘留和治安管理处罚;资格处罚力度加大五年市场禁入;一年三次违法责令停产至吊销许可证;网购食品出问题网站赔偿损失;惩罚性赔偿最低赔1000元;确立首负责任制。
实际生活中食品安全问题层出不穷。例如网上订餐,因为它快捷方便,成为了许多年轻人吃饭时的首选,然而在2016年的315晚会上,爆出了饿了么的餐厅卫生情况惨不忍睹的事件,网上呈现的菜品看似色泽鲜丽,然而在实体店中,制作间昏暗狭小,厨房内到处都是黑乎乎的油渍,掉进脏东西的饭盒,在桌上敲打几下之后就用来盛饭,用完盛饭板就放在肮脏的锅盖上。央视记者在美团外卖、饿了么、百度外卖三家平台上随机抽取北京部分地区餐厅并统计,结果显示:三大平台30家餐厅仅15家有资质!2016年9月9日,北京市食品药品监督管理局第四次约谈饿了吗、美团外卖、百度外卖等几大外卖平台。时隔半年,这些网络订餐平台依旧被曝合作餐馆存在套牌营业照、套牌卫生许可证、傍名牌、无证经营、卫生不达标采用竞价排名成为销售冠军等恶劣行径。这些问题引起了人们的广泛关注,在网上热烈讨论,特别是一些专业的食品安全论坛。如何将这些论坛中的有关食品安全的数据挖掘出来,从而跟踪人们对食品安全问题的关注度并有效疏导,是一个值得关注的问题。
2. 研究的基本内容、问题解决措施及方案
1 研究目的
整合在大学期间所学的知识,开发一个爬取食品安全论坛数据,并对数据进行语义情感分析,并将食品安全对民众影响展示出来的Web页面
2 主要研究内容及关键技术
主要研究内容:了解食品安全在各个论坛中对用户的影响,根据实际需求,规划设计论坛爬取模块,并对其进行语义分析,得到其中的具体感情,最后将其展示出来
关键技术:Node.js,D3.js,Python,mysql,docker
3 拟采取的研究方法和技术路线
研究方法:先去收集有关于食品安全的论坛→根据各个论坛编写爬虫来进行分析→对存入数据库的数据进行分析→剔除冗余数据→分析剩余数据中的情感→对数据进行建模→将建模后的数据进行可视化处理
技术路线:
寻找食品安全相关论坛 |
编写爬取论坛的爬虫 |
编写基于数据进行分析的语义词库 |
编写web页面 |
根据语义词库筛选有效信息 |
将筛选到的信息进行可视化处理 |
4 预期成果
用户能够通过页面展示,了解食品安全事件产生的各种影响,从而能够对食品安全问题产生思考
5 研究准备
查阅知网和图书馆的文献,对于这方面的知识有一定的了解
寻找食品安全方面的论坛或者新闻评论
对准备采用的技术进行巩固学习
6 重点、难点分析
对需要的信息进行爬取,并筛选出其中有效的信息,以及对有效信息的情感词汇进行分类并使其可视化,是本次研究的重难点