基于Python的爬虫与影评统计开题报告
2020-05-05 17:12:19
1. 研究目的与意义(文献综述包含参考文献)
随着互联网的普及和发展,在当今的网络空间电子数据量愈来愈大。
根据中国互联网络信息中心(cnnic)在京发布第42次《中国互联网络发展状况统计报告》。
截至2018年6月.我国网民规模达8.02亿,互联网普及率为57.7%;2018年上半年新增网民2968万人,较2017年末增长3.8%;我国手机网民规模达7、88亿,网民通过手机接入互联网的比例高达98.3%[1]。
剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!
2. 研究的基本内容、问题解决措施及方案
本文的研究问题: 1. 采用python语言对指定电影的影评进行爬虫,快速收集大量影评文字信息; 2. 采用自然语言处理(nlp)算法,自动处理每条文本,判断影评发表者对电影的支持程度,分为0-5颗星。
0代表完全否定,5代表非常赞同; 3. 统计各影评者的打分,并于算法预测值进行比较; 4. 对预测值进行综合打分,并与豆瓣打分进行比较。
拟采用的研究手段: 1. 在爬虫方面采用python爬虫,python具有更高的开发效率,以及更强的开发功能python的标准库和第三方库强大到你无法想象,无论你想从事任何方向的技术编程,你几乎都能找到相应的库支持。
剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付