基于标签特征和用户时序行为的图书推荐算法开题报告
2020-04-12 16:12:00
1. 研究目的与意义(文献综述)
随着计算机技术和互联网的发挥,网络出现超负荷现象,用户为了找到自己需要的信息,会花费大量的时间和精力,海量的信息伴随的问题是如何筛选出有用信息。
个性化的推荐系统应运而生,并应用在网络的各个方面,例如电子商务、网页检索推荐、音乐和视频推荐、图书系统推荐等。
如果没有个性化推荐服务,用户在寻找书籍时,只能通过查找书名来获得内容,若是没有目标数据,就只能在海量的书籍中进行寻找,这些书籍存储杂乱无章,内容类型也不尽相同,用户很难找到他想继续阅读的书籍。
2. 研究的基本内容与方案
基本内容:1)学习经典的推荐算法和理论,了解各个算法的优点和缺点,阅读国内外相关的文献,对时序行为信息相关的推荐算法进行了解。
2)针对用户兴趣难以表示的问题,提出用标签的形式进行将书籍进行分类表示,用类型组合的形式对用户的兴趣进行表示。建立书籍和用户的数据库,实现相关算法,形成用户类簇,通过类型组合表示用户不同的兴趣的关联度,计算用户之间的相似性,最后进行推荐。
3)对用户兴趣随着时间的变化的时序行为而难以确定的问题进行分析,对用户这些兴趣的变化规律进行分析,引用数据集,体现出用户兴趣跳转和兴趣分段的规律,抽象出算法模型,结合兴趣段分析用户的兴趣变化情况。
4)将所得出的信息进行定义和表示,对用户真实的数据表进行参数选择实验和对比实验。将实验的数据和现有的真实数据进行对比,得出用户实际点击和预测点击的书籍的差异,对算法进行改进。
目标:
本实验将针对用户对书籍的点击和阅读行为,分析用户的兴趣和喜好,并推荐给用户他们可能感兴趣的书籍,减少读者对书籍的查询操作,对他们进行个性化的推荐。 传统的书籍推荐只是数据的堆积和总结,但在本次实验中,考虑用户与用户之间的结构关系,使用协同过滤算法,根据相似用户的兴趣和购买行为进行推荐;而且还运用分割时间分段的数据分析法,预测下一阶段用户的兴趣。所以,改进后的协同过滤算法,能够推荐更加符合用户口味的新书籍,从而增加用户对该书籍阅读器应用的粘性。 从网站运营方面来说,提高了网站的效率,使每个资源得到充分的利用,提高了网站的质量。
1.在数据的收集时,我们根据用户点击的书籍,在已建立的数据库中寻找该书籍的相关标签,再根据这些标签寻找标有这些标签的其他书籍。将这些书籍进行推荐,用户浏览这些书籍,若是读者有兴趣阅读,就会点击封面进行简介观看,跟有兴趣额就会点击阅读。我们根据用户的这些行为将对这些书籍进行打分,生成一张评分表放在数据库中。 这些读者点击的书籍我们可以认为是读者感兴趣的显式评价,但那些没有点击的文章却并不能简单的认为是度这不感兴趣的,这就需要进行隐式打分(隐式评分)。
2.在得到了信息后,我们需要对数据进行预处理,预处理阶段就是将用户的新信息(时序行为的改进算法)和以前的旧信息结合起来,存储在数据库中。
3.为了降低学习到成本,我们将兴趣相似的用户进行整理聚类,放在一个类簇里面(K-means算法)。当用户需要推荐(协同过滤算法推荐)时,我们优先从这些用户的数据集中进行计算。
4.进行相似度的计算,来寻找近邻。
5.提出传统协同过滤算法的基本条件,针对本文协同过滤算法在图书推荐系统中的应用,考虑用户兴趣随时间变化而变化的时序性、用户关系网络中的信任度的思想、项目预测评分次略的优化思想,提出改进的算法。然后具体介绍改进思想在协同过滤算法中的作用点和具体的实现模型,最后给出改进的基于协同过滤的个性化推荐方法的实现过程。
3. 研究计划与安排
第一阶段(第1周—第3周):查阅有关的参考资料并完成开题报告;翻译英文资料(不少于5000汉字),并交予指导教师检查。
第二阶段(第4周—第9周):了解个性化推荐的主流算法,分析并比较各算法的优点和不足,重点研究协同过滤算法,根据算法的特点,对其进行基于用户时序行为方面的改进方案,对用户时序行为兴趣的改变规律进行研究,得出兴趣变化的模型图。
4. 参考文献(12篇以上)
[1] 孙光福.基于时序行为的协同过滤推荐算法[J]. 软件学报,2013,14(11)
[2] 基于隐式用户反馈数据流的实时个性胡推荐[J].计算机学报,2016, 1 52-64
[3] 基于大规模隐式反馈的个性化推荐[J]. 软件学报,2014,2(9)
[4] 基于协同过滤技术的个性胡课程推荐系统研究. 情报教学,2009,05
[5] JinHyun Jooa, SangWon Bangb, GeunDuk Parka ,“Implementation of a Recommendation System using Association Rules and Collaborative Filtering . ” in ScienceDirect , Procedia Computer Science 91 ( 2016 ) 944 – 952.
[6] Jian Wei ,Jianhua He ,Kai Chen , Yi Zhou , Zuoyin Tang, “ollaborative filtering recommendational gorithm based on user preference derived from item domain features” , in Expert Systems With Applications 69 (2017) 29-39.
[7] Xin Xia , David Lo, Xinyu Wang , and Bo Zhou,“Tag Recommendation in Software Information Sites
” .
[8]一种结合推荐对象间关联关系的社会化推荐算法 [J] ,郭磊 , 计算机学报 , 2014,01
[9] M. Storey, C. Treude, A. van Deursen, and L. Cheng, “The impact of social media on software engineering practices and tools,” in Proceedings of the FSE/SDP workshop on Future of software engineering research. ACM, 2010, 359–364 .
[10] A. Begel, R. DeLine, and T. Zimmermann, “Social media for software engineering,” in Proceedings of the FSE/SDP workshop on Future of software engineering research. ACM, 2010, 33–38.
[11] Ericsson Corporate Communications. Global Smart-Phone Subscriptions to Reach 5.6 Billion by 2019. Ericsson Mobility Report; 2013.
[12]Yakup Newspaper. The utilization of Big Data, The success of the Company depends.; 2013.
[13] Min-Jeong Kang. Recommendation System for Make a Purchase to Application in Smart-Phone User. Hongik University Master's Thesis; 2011.
[14]Korea Communications Agency. Elements according to the step by utilizing big data technologyPropulsion Trends and Implications. Information Communication Technology Issuesamp; Prospects No.10, 2013.
[15] P. Resnick, N. Iacovou, M. Suchak, P. Bergstrom, J. Riedl, GroupLens: an open architecture for collaborative filtering of netnews, in: Processing 1994 .