基于协同过滤的个性化算法的研究与实现开题报告
2021-12-24 15:22:17
全文总字数:4219字
1. 研究目的与意义及国内外研究现状
WWW上的一些主要工作,例如Web站点设计,Web服务设计,Web站点的导航设计,电子商务等工作正变得越来越复杂和越来越繁重。通过Web数据挖掘,我们可以从数以亿计存储着大量多种多样的Web页面以及链接和用户对页面的访问中挖掘出我们需要的有用知识。
(1) 1.从大量信息中发现用户感兴趣是信息
在因特网上,最常用的获取信息的方法是页面浏览和关键词搜索。浏览一个页面得到的是页面的孤立信息,即缺乏刻画相关页面关联的机制。基于关键词查询的搜索引擎可以帮助用户查找相关信息的页面,但目前的搜索引擎至少有两个问题不可回避:
1.由于精确度低,使得搜索结果的可用性大打折扣。例如,你要搜索NBA的太阳队,那么就会得到像太阳帽,太阳伞等这些根本与主题无关的信息。而且这些庞大的搜索结果对用户本身来说是新的负担,为获得可用的信息用户不得不再做大量的尝试性的工作
2.这些搜索结果是凌乱的,无组织的,因而无法反复使用。
(2) 2.将web上丰富的信息转变成有用的知识
如果说传统的基于关键词检索的搜索引擎是面向查询处理的话,那么web挖掘就应该是面向web数据进行分析和知识提取的。因特网中页面内部,页面间,页面链接,页面访问等都包含大量对用户有用的信息,但這写信息的深层次含义是很难被用户直接使用的,必须经过浓缩和提炼,从某种意义上讲,这正是web挖掘所解决问题的出发点和目标。
(3)3. 对用户进行信息个性化
因特网是一个开放的网络,信息可以说是无所不包,但是这并不意味着用户对信息是没有选择的。实际上,不同的用户,不同的用户群对信息的需求是不同的。在竞争日趋激烈的今天,对网站经营者来说,要留住老客户,吸引新客户就必须提供针对性的服务。信息的个性化是将来的发展趋势,它取决于商家对客户信息的掌握程度。通过web数据挖掘,我们通过对总的用户访问行为,频度,内容等的分析,可以得到关于群体用户访问行为和方式的普遍知识,用以改进web服务方的设计,而更重要的是,通过对這些用户特征的理解和分析,可以有助于开展有针对性的电子商务活动。
国内外研究现状
伴随着个性化推荐系统风靡的影响,该技术不仅在电子商务,还在信息服务网站、在线学习等领域保持较高的研究热度。近几年来,出现诸多研究机构的同时,也涌现了一大批有关的学术论文和期刊,其中涉及到计算机科学领域、电子商务领域、市场经济、教育领域等。例如,ACM设立了推荐系统年会,而且国际上许多高质量期刊(例如IEEE Trans On Knowledge and Data Engineering, ACM Trans onInformation System等)近年来都陆续刊载了大量有关协同过滤的文章。国外有较深入研究的单位有:纽约大学、明尼苏达州立大学的GroupLens 研究小组、密歇根大学、卡内基梅隆大学、以及微软研究院等。
个性化推荐系统以及算法在国外有着极其广泛的应用,尤其是在电子商务领域具有良好的发展。纽约Cyber Dialogue对2001年在线购物中,用户对个性化推荐工具的态度和使用情况进行了调查,调查结果显示个性化推荐系统已成为电子商务网站提高销售额重要的工具。在被采访的用户中,超过50%的用户认为如果提供相应的个性化推荐功能,会比单纯的促销活动更有吸引力,63%的用户表示愿意注册为会员的目的就是想获得相应的个性化推荐服务。国外在个性化推荐以及协同过滤技术方面做得比较好的应用有:Amazon ,Last.fm , Altered Vista等。
对于个性化推荐系统尤其是协同过滤算法的研究方面,国内的起步稍晚,相应的研究比之国外稍显不足,主要体现在:
(1) 国内研究主要承袭了国外的研究理念及成果;
(2) 国内推荐系统中,自动化和个性化程度相对较差,难以根据用户的兴趣和历史行为给出准确的个性化推荐;
(3) 灵活度不高,国内大多数个性化推荐系统中,获取用户兴趣等信息多是通过注册信息等明确指定的方式得到,对于用户使用过程中表现出的兴趣特征研究较少,难以捕捉用户兴趣的动态变化,往往使得个性化推荐滞后于用户兴趣变化或对用户兴趣理解不充分。
当然随着互联网的蓬勃发展,国内电子商务领域以及个性化站点领域已逐步发展,呈现蓬勃发展之势,在个性化推荐特别是协同过滤算法方面的研究与应也得到充足的发展。目前国内做得比较好的应用有:百分点科技,无觅网,豆瓣网等。
目前,在国内外,个性化推荐系统尤其是协同过滤技术已经应用于电子商务,个性化网站、在线学习、音乐、视频、新闻等各个领域,常见应如表所示。个性化的推荐结果能够使得用户更为快捷、方使地找感兴趣的信息,进而为电子商务或其它Web应用系统带来一定的经济或其它价值
应用领域 | 国内外应用举例 |
电子商务 | Amazon,Ebay ,淘宝,京东,Levis,LIBRA, |
网页 | Stumble Upon,Siteseer,Fab,R2P,METIOREW,baidu |
音乐 | Last.fm ,Music.Yahoo.com, Ringo, 豆瓣FM,网易云音乐 |
电影 | MovieLens, Netflix.com, Moviefinder.com, Youtube, 豆瓣,优酷 |
新闻 | GroupLens, PHOAKS,今日头条 |
社交 | Facebook,twitter, QQ,新浪微博 |
其他 | Jester(笑话网站) |
2. 研究的基本内容
论文主要从以下几个方面展开:
(1) 以amazon和豆瓣网作为样例分析,分析协同过滤算法在电子商务以及社交网站的成功应用,并以此介绍个性化推荐的架构,与用户交互的形式和推荐策略。
3. 实施方案、进度安排及预期效果
一 实施方案
在 microsoft visual studio 2008 的平台上,关联数据库,由窗体创建显示在应用程序中的窗口,实现可视化。
4. 参考文献
[1]裴蕾.基于web数据挖掘的电子商务推荐系统研究[d].同济大学,2006.
[2]唐北平. 基于聚类算法的web日志挖掘系统研究与应用[d].湘潭大学,2007.
[3]刘建东. 基于web的日志挖掘技术的研究[d].哈尔滨工程大学,2003
最新文档
- 华北地区夏季降水多年、少年近地层水汽场及风场分布特征开题报告
- 天山地区典型流域降雪分布研究文献综述
- 2016年台风狮子山路径突变原因的初步分析开题报告
- 北京和寿县地区边界层急流观测与模型的对比文献综述
- 具有双Kelvin波结构MJO活动的再分析开题报告
- 基于单片机的温控风扇设计文献综述
- 1961-2015年江苏省气候资源的时空分布规律开题报告
- 智能搬运机器人文献综述
- 基于类型的电影推荐系统文献综述
- Bi6S2O15的合成及其降解有机污染的研究开题报告
- 不确定时滞奇异摄动系统的鲁棒控制器设计文献综述
- 小型双模SIW滤波器的研究与设计开题报告
- 我国绿色出行政策执行研究——以南京市为例文献综述
- 试论李碧华小说中的爱情悲剧开题报告
- 基于FPGA的电子相册设计文献综述