基于机器学习(Machine Learning)的推荐系统设计与实现毕业论文
2021-03-21 00:50:26
摘 要
目前,机器学习技术已经日益发展成熟,应用领域也日益广泛,大数据时代所需要的大量数据处理与分析技术也促进了机器学习技术的发展。机器学习技术突破了传统的计算机数据处理的理念,从原始数据中建立了与人类学习过程相似的模型,对数据进行分类、评估、处理、建模,研究常用的学习算法并进行理论分析,从而对特定的应用产生具有针对性的学习系统。
随着互联网的高速发展,人们渐渐从信息缺失的时代走向了信息过载的时代。在这个趋势下,信息的消费者希望自己在有限的时间成本下,能够尽快的获取到自己所需要的信息,而信息生产者则希望自己的信息能够从浩瀚的数据中脱颖而出,尽可能的将自己的信息展示到需要的人群手上。于是,推荐系统的广大市场需求便应运而生,推荐系统所具有的针对性筛选作用,有效的解决了信息过载所带来的问题。
本毕业设计将机器学习技术与推荐系统相结合,基于KNN(k-Nearest Neighbor)算法,采用了基于物品的协同过滤算法,进行了一个完整的电影推荐系统的设计。KNN算法又可称为K最近邻分类算法,是机器学习技术中最为简单的分类方法之一。所设计的推荐系统大体上分为数据采集、数据预处理、推荐算法设计、结果显示四个部分。本次毕业设计简述了机器学习算法在推荐系统中的应用以及评测推荐系统的指标,并在Win8.1平台下,eclipse集成开发环境中设计并实现了一个完整的基于KNN算法的电影推荐系统,计算出推荐结果并进行界面显示后,最终在MovieLens数据测试集上进行了离线实验。
关键词:推荐系统;机器学习;KNN算法;Java;协同过滤
Abstract
Nowadays, the development of machine learning technology has been increasingly matured, and the application fields of machine learning are increasingly widespread, a large amount of data processing and analysis technology that the big data era need is also promoting the development of machine learning techniques. Machine learning technology breaks through the traditional concept of computer data processing, establishes the model from the original data as the process of people study. Machine learning process the data with classification, evaluation, data processing, modeling, and it studies the commonly used learning algorithm and theory analysis, and create the learning system targeted on the specific application.
With the high-speed development of Internet, people gradually from the missing information era to the era of information overload. Under this trend, the information cost of consumers want to in the limited time, to be able to get information what they need as soon as possible, while information producers hope their information will emerge from the vast data, as far as possible will own information displayed to the require people's hands. So the recommendation system of broad market demand arises at the historic moment, recommender systems have targeted information selecting function, effectively solve the problem of information overload.
This graduation design a recommendation system combined with the machine learning technology, based on KNN (k-Nearest Neighbor) algorithm, and used the collaborative filtering algorithm based on item, for the design of a complete movie recommendation system. KNN algorithm and can be referred to as the K nearest neighbor classification algorithm, is one of the simplest classification method in machine learning technology. The designed recommendation system can be broadly divided into data acquisition, data preprocessing, the recommendation algorithm design, results show that the four parts. This graduation design is briefly describe the application of machine learning algorithms in recommender systems as well as the evaluation index of recommendation system, and with Win8.1 platform, eclipse integrated development environment,it designed and implemented a complete movie recommendation system based on KNN algorithm, to calculate the recommended results and display in the interface, eventually offline experiment was carried on the test set with the MovieLens data.
Keywords: recommendation system; machine learning; KNN algorithm; Java; collaborative filtering
目录
第1章 绪论 1
1.1 研究目的及意义 1
1.2 国内外研究现状 1
1.3 论文内容安排 3
第2章 推荐系统与机器学习 4
2.1 推荐系统的分类 4
2.1.1 基于内容的推荐 4
2.1.2 基于协同过滤的推荐 5
2.2 机器学习算法 8
2.2.1 推荐系统中常用机器学习方法 8
2.2.2 KNN算法原理 9
2.3 推荐系统性能指标 11
2.4 本章小结 11
第3章 推荐系统设计与实现 12
3.1 系统总体设计 12
3.2 数据集模块 13
3.3 KNN推荐算法模块 14
3.4 离线测评模块 16
3.5 结果显示模块 18
3.6 本章小结 19
第4章 总结与展望 20
4.1 全文工作总结 20
4.2 未来工作展望 20
参考文献 21
致谢 22
第1章 绪论
1.1 研究目的及意义
如果你突然想听一首歌,你会打开你的手机,然后思考你想听什么类型的歌,如果你明确的知道歌曲的名称,那么你会搜索框中输入名称后,很快的选择合适的歌曲点击播放;如果你不知道听什么歌,但是你有喜欢的歌手,你想听听他的新歌曲,那么你可能会在搜索框输入歌手的名字,在出现的有限数目歌曲中找到你所没有听过的歌曲点击播放;或者你有喜欢听的歌曲类型,你想听听特定曲调的歌曲,进入相应的分类目录下,找到合适的类型进行随机播放。但是,如果你只是想听听歌,没有特定的曲目,没有喜欢的歌手,没有限制的类型,那么,你如何才能找到那首你可能会满意的歌曲呢?在万能的搜索框里输入“我喜欢的歌”,结果显示的并不会是你真正的喜欢的歌。
这时候,推荐系统的存在可以让你在众多的歌曲里发掘出那些你所没有听过的歌曲,并且展示到你的面前。推荐系统是一个具有服务性质的自动化工具,他可以根据你的历史行为,从庞大的音乐体系中筛选出几种符合你的兴趣的音乐供你选择。