基于推荐系统的用户偏好分析开题报告
2021-12-12 14:09:12
1. 研究目的与意义及国内外研究现状
随着互联网时代的到来,数据逐渐从小样本数据向海量数据发展。所以,对于如何从大量数据中提取到有用的信息,并提高信息利用率成为当今热门的研究话题。在现有的数据处理技术中,数据挖掘就是为了简化数据提取过程而发展出来的一门新技术。个性化推荐系统是一项在解决信息超载问题上非常有用的方法,它通过将系统用户爱好,需求等结合起来,为用户推送用户感兴趣的信息,是一种个性定制的系统。比起搜索引擎,个性定制系统能主动为用户找到有用的信息,并进行个性化计算,发现用户的兴趣点。一个优秀的推荐系统,能为用户进行个性化定制服务,从而在用户间建立起精密的联系,使得自身和用于之间产生不可或缺之感,提高用户的忠诚度。
国内外研究现状
目前电商领域的一个重要的研究内容就是电子商务的个性化推荐系统。一个成功的推荐系统能准确地捕捉到用户的需求,而适当的推荐算法又是推荐系统的一个关键性因素。s.j.gong针对协同过滤的可扩展性和稀疏性问题,提出了一种加入用户聚类技术和项目集群技术的个性化推荐方式。j.bobadilla等针对新用户的冷启动问题,提出采用基于神经学习的方法设计新的相似性度量标准。除了协同过滤算法外,要想发现数据库中的关联关系,还能应用数据挖掘中的关联规则挖掘技术。国外在这方面的研究内容非常广泛,并取得了显著成效。 lazcorreta e等基于apriori数据挖掘算法,通过两步修改先验的技术,把问题转化成用户适应建议的关联规则挖掘的过程。kim j等基于web使用挖掘关联规则和决策树,引入个性化推荐过程,并将其应用到互联网商场。虽然国外很多研究人员对apriori算法做了大量的研究和改进,然而这些算法都不能够避免需要多次扫描数据库的缺陷,并且可能会产生大量的候选频繁项集。jiawei han等为了避免这一缺陷,提出不产生候选频繁项集的fp-growth方法。
2. 研究的基本内容
针对互联网用户的偏好问题,利用协同过滤算法分析电信用户的上网日志行为,分别基于用户的偏好和游戏的关联度测度用户对游戏的关注度,通过评分值的比较为用户提供推荐菜单。此外,把关联规则挖掘的思想移植到协同过滤推荐中,应用Apriori算法挖掘游戏的频繁项集和强关联规则。考虑到Apriori算法需要多次扫描数据集并会产生大量候选频繁项集的缺点,本文引入FP-growth算法,利用树形结构直接生成频繁项集。
3. 实施方案、进度安排及预期效果
实施方案:
首先分别基于用户和物品做推荐,并比较这两种方法的优劣;然后用apriori算法、fp-growth做关联分析,再比较其效率高低。
进度安排:
4. 参考文献
[1] s.j.gong. a collaborative filtering recommendation algorithm based on user clustering and item clustering[j].journal of softwar,2010,5(7):745-752.
[2] j.bobadilla,f.ortega,a.hernando,et al. a collaborative filtering approach to mitigate the new user cold start problem[j].journal of electronic commerce research,2003,4(4):156-167.
[3] lazcorreta e,botella f,ndez-caballero a. towards personalized recommendation by two-step modified apriori data mining algorithm[j].expert systems with applications,2008,35:1422-1429.