基于协同过滤的推荐系统研究与设计开题报告

2020-05-28 06:58:47

1. 研究目的与意义（文献综述包含参考文献）

1. 前言

信息科技经过60余年的发展，已经渗透到国家治理、经济运行的方方面面。政治、经济活动中很大一部分的活动都与数据的创造、采集、传输和使用相关，随着网络应用日益深化，大数据应用的影响日益扩大。在这个大背景下，从公司战略到产业生态，从学术研究到生产实践，从城镇管理乃至国家治理，都将发生本质的变化。

全球数据正在呈爆炸式增长，数据已经渗透到每一个行业和业务职能领域，并成为重要的生产因素。大数据的使用将成为企业成长和竞争的关键，人们对大数据的运用将支撑新一波的生产力增长和消费者收益浪潮。数据已经存在于全球经济中的每一个部门，就如固定资产和人力资本等生产要素一样，如果没有它，许多现代经济活动就不会发生。我们观察到一些新兴的互联网公司，利用新技术大规模地收集数据，预判客户行为，然后在不同的行业纵横捭阖，而缺少数据资产以及强大的数据分析能力的公司则无疑处在被颠覆的边缘。

剩余内容已隐藏，您需要先支付后才能查看该篇文章全部内容！

2. 研究的基本内容、问题解决措施及方案

1. 本课题要研究或解决的问题

随着互联网的高速发展，海量音乐对用户的个性化推荐也成为一个重要课题，不同的音乐具有不同的风格，分为很多音乐流派和音乐人，并且同一音乐流派不同的音乐人对音乐的理解也各不相同，在众多的音乐听众中，每个用户都有自己特有的爱好，如何准确地从海量的音乐资源中找到用户喜欢的音乐、准确地挖掘用户可能会喜欢的音乐是本课题要解决的问题。

2. 拟采用的研究手段（途径）

推荐系统成为解决本课题的良好方案。它能够根据用户的兴趣或者收听音乐的历史进行个性化音乐的推荐，减少了搜索时间，产生更大的社会和经济价值。

本课题旨在实现一个Hadoop云平台下基于协同过滤算法的音乐推荐系统原型的研究与设计。开发拟采用VMware_workstation_full_10.0.2虚拟化平台，在该平台上安装了CentOS虚拟机，并在虚拟机上搭建了Hadoop集群环境，虚拟机的硬件配置与软件配置如表所示。

OS	CentOS6.5
JDK Version	1.7.0_79
Hadoop	1.2.1
Hardware	1G内存、20G硬盘

协同过滤推荐（Collaborative Filtering）技术是在个性化推荐系统中最受关注也是最早使用的技术之一，它主要是对比和寻找用户偏好的过程，需要多个用户的信息来预测用户的喜好。它是以用户之间的爱好相似性为基础的，从用户的平时行为数据开始，找出与目标用户有着相似爱好倾向的其他用户组，并且运用相关算法计算出相似度较高的一些信息为用户进行推荐。同时，根据资源对象的不同，协同过滤推荐系统可以划分为基于用户（User-based）的协同过滤系统和基于项目(Item-based)的协同过滤算法。

基于用户（User-based）的协同过滤算法通过选择目标用户的最近邻居集（即最相似的若干用户）对一个他/她没有评价过的项目的偏好情况来预测它对该项目的评价，而基于项目(Item-based)的协同过滤根据用户对相似项目的评价来预测该用户对目标的评分，前者主要以用户为考虑对象，而后者主要以项目为考虑对象。

本课题是在基于项目的协同过滤算法的基础上，对用户的评分数据做一系列的筛选，挑选出和目标项目相似的项目群，进而预测用户对目标项目的偏好程度，产生推荐，采用该算法可以有效解决协同过滤推荐算法中的数据稀疏性、及时性等问题和弊端。

同时，本课题针对海量音乐的个性化推荐算法进行研究时，以MapReduce的并行方法设计了基于Hadoop云平台下的协同过滤算法，利用MapReduce的并行方法，将传统的协同过滤算法并行化，使算法的运行速度和执行效率显著提高，更适合大数据的处理。

剩余内容已隐藏，您需要先支付 10元 才能查看该篇文章全部内容！立即支付

注册

找回密码