登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 毕业论文 > 计算机类 > 软件工程 > 正文

基于协同过滤算法的个人博客系统的设计与实现

 2022-11-28 11:08:15  

论文总字数:34073字

摘 要

随着以Internet为核心的计算机网络技术飞速发展[1],人们的生活节奏也变得越来越快,但还是有很多人会在快节奏的生活方式下利用琐碎的时间进行阅读,而博客就是其中一种,同时博客也被越来越多的人选择作为学习和交流的工具。相信很多人在学习的过程中都会遇到一些无法解决的问题,而百度又无法很好的去解决问题时,博客中常常会有解决问题的方法,但筛选博客的过程往往需要花费很长的时间。本文在实际需求的驱动下,了解了推荐系统的理论知识,学习了协同过滤算法[2],并基于博客系统对协同过滤算法在一定程度上进行了优化。

本文的核心工作是优化协同过滤算法,并使用优化后的协同过滤算法为个人博客系统设计一个推荐博客的功能。在协同过滤算法的优化方面,通过分析基于用户和基于物品的协同过滤的特点,本文选择了基于用户的协同过滤算法。本系统的实现中在用户注册添加了一项感兴趣的内容选项来解决冷启动问题,同时还用系统隐式评分来缓解数据稀疏的问题,并尝试综合使用基于用户的协同过滤和基于用户兴趣的推荐[3]两种方法进行混合推荐。

在博客推荐功能上使用了Apache开源的可扩展机器学习框架Mahout来实现协同过滤算法。算法需要的用户评分数据模型从数据库调取,而算法最终的推荐结果交给业务逻辑层处理。虽然利用数据库存取可以在一定程度上达到机器学习的效果,即会根据用户的行为不断改变推荐的博客文章,从而使推荐的精确度随着用户的使用不断提高,让系统越来越“懂”你,但是当数据逐渐变得庞大时数据库的响应也会变慢,从而导致推荐算法计算速度变慢。

关键词:推荐系统;协同过滤;个人博客系统;混合推荐

Design and Implementation of Personal Blog System Based on Collaborative Filtering Algorithm

Abstract

With the rapid development of Internet-based computer network technology, people's life rhythm has become faster and faster, but there are still many people who use trivial time to read in a fast-paced lifestyle. And blog is one of them, and blog is also chosen by more and more people as a tool for learning and communication. I believe many people in the process of learning will encounter some problems that can not be solved, and Baidu can not solve the problem very well, there are often ways to solve the problem in the blog, but the process of screening blog often takes a long time. Driven by actual needs, this article has learned the theoretical knowledge of the recommendation system and learned the collaborative filtering algorithm, and optimized the collaborative filtering algorithm to a certain extent based on the blog system.

The core work of this paper is to optimize the collaborative filtering algorithm, and use the optimized collaborative filtering algorithm to design a blog recommendation function for the personal blog system. In terms of the optimization of collaborative filtering algorithm, by analyzing the characteristics of user-based and item-based collaborative filtering, this paper chooses user-based collaborative filtering algorithm. In the implementation of this system, an interesting content option was added to the user registration to solve the cold start problem. At the same time, the system implicit scoring was used to alleviate the problem of data sparseness, and an attempt was made to combine user-based collaborative filtering and user-based interest. The recommended two methods are mixed recommendations.

In the blog recommendation function, the Apache open source and extensible machine learning framework Mahout is used to implement the collaborative filtering algorithm. The user rating data model required by the algorithm is retrieved from the database, and the final recommendation result of the algorithm is handed over to the business logic layer for processing. Although the use of database access can achieve the effect of machine learning to a certain extent, that is, the recommended blog posts will be constantly changed according to the user’s behavior, so that the accuracy of the recommendation will continue to improve with the user’s use, making the system more and more “understandable” You, but when the data gradually becomes huge, the response of the database will also slow down, resulting in a slower calculation speed of the recommendation algorithm.

Keywords: Recommendation System,Collaborative Filtering,Personal Blog System,Hybrid Recommendation

目录

摘要 I

Abstract II

第一章 引言 1

1.1背景与意义 1

1.2相关研究现状 1

1.3主要工作内容 2

1.4论文组织结构安排 2

第二章 相关技术基础 4

2.1协同过滤算法 4

2.1.1基于用户的协同过滤 4

2.1.2基于物品的协同过滤 5

2.2协同过滤算法的关键性问题 6

2.2.1数据稀疏性 6

2.2.2冷启动 7

2.3本章小结 7

第三章 需求分析 8

3.1功能分析 8

3.1.1用户的功能需求分析 8

3.1.2博主的功能需求分析 8

3.2划分子系统 8

3.3建立用例模型 9

3.3.1用户管理子系统 9

3.3.2博客管理子系统 10

3.3.3博客推荐子系统 11

3.4系统非功能需求分析 12

3.5本章小结 12

第四章 系统设计 13

4.1系统总体设计 13

4.1.1系统分层结构设计 13

4.1.2 系统功能模块结构设计 13

4.1.3 系统总体工作流程设计 14

4.1.4 系统数据库设计 15

4.2详细设计 19

4.2.1博客管理模块 19

4.2.2用户行为处理模块 20

4.3核心算法设计 21

4.4本章小结 23

第五章 系统实现与测试 24

5.1系统实现工具与环境 24

5.2系统核心代码分析 24

5.2.1用户行为处理 24

5.2.2核心算法推荐 30

5.3系统主要运行界面 32

5.4系统测试 37

5.4.1系统测试环境与工具 37

5.4.2系统功能测试 37

5.4.3系统性能测试 38

5.5本章小结 39

第六章 总结与展望 40

6.1总结 40

6.2展望 40

致谢 42

参考文献 43

第一章 引言

1.1背景与意义

随着全球的经济的发展,社会步伐的加快,人们的生活节奏也变得越来越快,但还是有很多人会在快节奏的生活方式下利用琐碎的时间进行阅读,而博客就是其中一种,同时博客也被越来越多的人选择作为学习和交流的工具。博客的内容丰富多彩,具有自主性、开放性、互动性和共享性的特点,是一个很好的交流的渠道,思想展现的舞台和学术探讨的园地[4]

Blog是Weblog的简称,其实Blog就是一个网页,它通常由简短且经常更新的帖子所构成。许多Blog记录着个人生活中的所见、所闻、所想[5]。时至今日,博客已经成为社会媒体网络重要的一部分。虽然国内目前已经存在许多优秀的博客平台,但是很多的用户不希望受到博客平台的限制,而是希望能够拥有自己的博客网站,对自己的博客拥有最大限度的管理权限。

剩余内容已隐藏,请支付后下载全文,论文总字数:34073字

您需要先支付 80元 才能查看全部内容!立即支付

企业微信

Copyright © 2010-2022 毕业论文网 站点地图