基于协同过滤的推荐系统研究与设计文献综述
2020-05-25 23:42:38
1. 前言
信息科技经过60余年的发展,已经渗透到国家治理、经济运行的方方面面。政治、经济活动中很大一部分的活动都与数据的创造、采集、传输和使用相关,随着网络应用日益深化,大数据应用的影响日益扩大。在这个大背景下,从公司战略到产业生态,从学术研究到生产实践,从城镇管理乃至国家治理,都将发生本质的变化。
全球数据正在呈爆炸式增长,数据已经渗透到每一个行业和业务职能领域,并成为重要的生产因素。大数据的使用将成为企业成长和竞争的关键,人们对大数据的运用将支撑新一波的生产力增长和消费者收益浪潮。数据已经存在于全球经济中的每一个部门,就如固定资产和人力资本等生产要素一样,如果没有它,许多现代经济活动就不会发生。我们观察到一些新兴的互联网公司,利用新技术大规模地收集数据,预判客户行为,然后在不同的行业纵横捭阖,而缺少数据资产以及强大的数据分析能力的公司则无疑处在被颠覆的边缘。
互联网作为一个数据平台、一个数据集散地,聚集了海量的数据,完全可以借助新的大数据理论和技术,分析其中蕴含的丰富内容、发现其中存在的统计规律,以便为互联网提供更好的服务和应用、为互联网行业今后实现更好更快的持续发展提供定量化的依据。
大数据分析在互联网上的一个重要应用就是基于用户的各种海量在线行为来分析用户的兴趣和需求。目前,最典型、最主要的互联网服务和应用包括网络新闻、搜索引擎、网络购物、网上支付、网络广告、旅行预订、即时通信、社交网络、博客、微博、网络视频、网络音乐、网络游戏等,对当中的许多服务和应用,大数据的新理论、新技术大有用武之地,将助推互联网服务和应用得到更好发展,也将使大数据的新理论、新技术在互联网行业找到新的应用点,从而实现互联网与大数据两大新兴领域的有机结合。
而云计算的出现,再一次改变了数据的存储和访问方式。在云计算出现之前,数据大多分散存储在每个人的个人电脑、每家企业的服务器中。云计算,尤其是公用云计算,把所有的数据集中存储到”数据中心”,也即所谓的”云端”,用户通过浏览器或者专用应用程序来访问一些大型的网站,通过提供基于”云”的服务,积累了大量的数据,成为事实上的”数据中心”。”数据”是这些大型网站最为核心的资产,他们不惜花费高昂的费用,付出巨大的努力,来存储这些数据。
云计算是大数据诞生的前提和必要条件。没有云计算,就会缺少数据集中采集和存储的商业基础,而云计算为大数据提供了存储空间和访问渠道;大数据则是云计算的灵魂和必然的升级方向。
2. 推荐系统及发展现状
而随着信息技术的发展,网络渗透到人们学习生活的各个领域,各种图片、微博、视频等大量信息的创建与分享变得越来越容易,大数据时代也使人们进入到了一个信息过载的时代。信息过载是由于Internet提供的信息具有广泛性和复杂性的特点,同时浏览者自身知识结构和认知能力等条件限制,导致浏览者无法正确理解和使用信息。如何让用户在信息的海洋中找到有用的信息,不被大量的无关信息淹没,成为人们关注的热点。
在这种情形下,搜索引擎成为人们快速找到目标信息的最好途径。在用户对自己需求相对明确的时候,用搜索引擎很方便地通过关键字就能找到自己需要的信息。但当用户其实并不明确自己的需要,或者他们的需求很难用简单的关键字来表述,又或者他们需要更加符合他们个人口味和喜好的结果时,搜索引擎此时就不能完全满足用户对信息发现的需求。解决这些问题的关键在于将Internet从被动接受浏览者的请求转化为主动感知浏览者的信息需求,实现网络系统对浏览者的主动信息服务。因而推荐系统(Recommendation System)应运而生。