基于机器学习的智能图书推荐系统研究与实现开题报告
2020-02-10 23:14:50
1. 研究目的与意义(文献综述)
随着互联网和大数据的发展,人们从信息匮乏的时代进入了信息过载的时代。大量的信息涌现,虽然为用户提供了各个领域全面的信息和资源,但同时也令用户难以找到自己真正需要,真正感兴趣的信息。为了帮助用户从茫茫信息之海中发现对自己有价值的资源,满足用户个性化的需求,同时也是帮助信息生产者将自己的产品推送给对它感兴趣的人,最大化产品的价值,推荐系统应运而生了。[10]推荐系统产生的初衷和搜索引擎类似,都是为了方便用户快速地发现有用的信息。但从某种程度上说,推荐系统和搜索引擎是互补的两种工具。搜索引擎需要用户提供明确的需求,同时也是严格地按照用户的需求为用户返回精准的信息,[1]但由于它自身的缺陷,使得一些冷门的信息难以被用户发现。而推荐系统,不需要用户提供明确的需求,它会根据用户的历史行为和偏好自动为用户推送信息,[2]有时还能挖掘出用户自己尚未察觉的潜在兴趣。同时,一个良好的推荐系统会刻意地优先推送一些冷门的信息,使得所有的信息都有机会展现在相应用户面前。
目前主要的推荐技术和算法有协同过滤,基于内容的推荐,基于知识的推荐等。目前应用最广的技术就是协同过滤技术,它的优点是可以发现新兴趣,并且随着时间的推移和系统信息量的增加,系统的推荐性能会越来越好。它存在的问题和挑战有冷启动,数据稀疏和系统建立初期推荐性能欠佳。[11]目前实现推荐系统普遍存在的难点有数据的稀疏性,扩展性,特征提取等,它们也是目前的研究热点。数据的稀疏性指的是用户只对系统中小部分物品有行为。扩展性则指目前推荐系统算法的时间复杂度较高,如果系统中的用户或物品数量过多会导致计算的时间开销过大。特征提取是说对于除文本之外的图片,视频等多媒体数据的特征提取技术仍不成熟。[12]近几年推荐技术的研究取得了明显的进展,展望推荐系统的未来,互联网推荐系统的研究将进一步改善用户在电子商务,图书馆,社交媒体等个性化领域的体验效果,帮助用户在最短的时间内找到自己真正感兴趣的信息。一些新的相关研究领域也在不断出现,如移动推荐等。[13]
图书推荐系统作为推荐系统的一种,其意义和作用也是为用户提供个性化推荐服务。它会根据用户的购书和评分行为等构建用户的兴趣模型,并根据模型为用户推荐合乎用户喜好和兴趣的书籍,[6]一方面是为了让用户更方便快捷地找到自己需要的书籍,另一方面也是增加网站的盈利,实现生产者和消费者的双赢。[15]
2. 研究的基本内容与方案
本次毕业设计将要完成一个智能图书推荐系统,能够根据用户的历史行为,兴趣偏好等信息有效,准确地向用户推荐他们可能感兴趣的图书产品。拟设计一个实际的图书出售商业网站,用户可以在该网站上进行收藏,购买等行为,这些行为即作为系统的训练和测试数据集。在此网站的基础上,开发图书推荐模块,基于用户的行为向用户推荐合适的图书。算法应具有自适应性,随着用户行为的增加,兴趣爱好的逐渐改变,所推荐的图书种类也会随之进行调整。[9]
根据在推荐领域中资深专家的说法,一个好的推荐系统一定不止一种算法。实现推荐系统的算法有很多种,而且各有各的利弊,也各有各适用的情况和场景。比如隐语义模型是推荐算法中各方面指标都比较好的,但它同时存在计算量巨大,无法实现在线推荐的问题。另外,系统的冷启动问题也需要专门地寻求措施进行解决。本系统作为毕业设计,并不投入实际商业应用,所以不需要严格达到商业推荐系统的要求。拟选用隐语义模型算法为主算法,每隔若干个小时或一天进行离线计算。[8]配合基于物品的协同过滤方法针对用户在线的行为进行实时的计算和推荐。[5]系统中使用地点上下文没有意义,但会把时间上下文结合到基于物品的协同过滤算法中[14]。对于冷启动问题,拟在用户注册时要求用户填写自己的一些基本信息及兴趣信息,[3]从而找到与该新用户相似的用户人群并推荐该群用户喜欢的物品。在完成算法设计之后,会采用离线实验和在线ab实验的方式对系统的预测准确度,覆盖率和多样性等指标进行评测,[4]必要时对算法进行调整和改进。
本系统中的图书出售网站将使用djangoweb框架进行搭建,算法的实施,测试和评估等使用python3语言在jupyter notebook上进行,评估完毕后再将代码转移到pycharm编辑器上。
系统实现过程:
3. 研究计划与安排
2019.2.18 - 2019.2.24 寻找参考文献,了解推荐系统的基本概念及基本实现方法
2019.2.25 - 2019.2.28 翻译外文文献,撰写开题报告
2019.3.1 - 2019.3.15 查阅书籍资料,深入研究了解算法的原理和实现方法
4. 参考文献(12篇以上)
[2]罗文. 协同过滤推荐算法综述[J]. 科技传播, 2015, 30(7):1282-1288.
[3]郑洪超, 李成轩. 浅析机器学习在推荐系统中的应用[J]. 计算机产品与流通, 2018(01):118.
[4]王春才, 邢晖, 李英韬. 推荐系统评测方法和指标分析[J]. 信息技术与标准化, 2015(7).
[5]房振伟, 徐海燕, 廖真. 基于协同过滤推荐算法的图书推荐研究[J]. 数字技术与应用, 2017(4):147-147.
[6]郭晓慧[1,2] . 基于改进协同过滤的图书推荐算法研究[J]. 情报探索, 2018.
[7]张腾, 何丰, 陈新德, et al. 个性化推荐中标签系统的建设[J]. 福建电脑, 2018, v.34(07):46-47 49.
[8]王升升, 赵海燕, 陈庆奎, et al. 个性化推荐中的隐语义模型[J]. 小型微型计算机系统, 2016, 37(5):881-889
[9]Walek, Bogdan. Creating adaptive web recommendation system based on user behavior[J]. Journal of Physics: Conference Series, 2018, 933:012014.
[10]Sunitha M., Adilakshmi T. (2018) Music Recommendation System with User-Based and Item-Based Collaborative Filtering Technique. In: Perez G., Mishra K., Tiwari S., Trivedi M. (eds) Networking Communication and Data Knowledge Engineering. Lecture Notes on Data Engineering and Communications Technologies, vol 3. Springer, Singapore
[11]赵冬伟."电子商务推荐系统现状研究."商业文化(上半月) .11 (2011):208.Print.
[12]张素智,赵亚楠,杨芮."推荐系统研究."湖北民族学院学报(自然科学版) .1 (2017).Print.
[13]阮光册,夏磊."互联网推荐系统研究综述."《情报学报》 .9 (2015):999-1008.Print.Rezaeimehr F , [14]Moradi P , Ahmadian S , et al. TCARS: Time- and Community-Aware Recommendation System[J]. Future Generation Computer Systems, 2017:S0167739X17305411.
[15]叶磊."推荐系统综述."《商情》 .46期 (2014):182-182.Print.