资源标签关联规则挖掘系统开题报告
2021-03-10 23:43:23
1. 研究目的与意义(文献综述)
随着internet的日益发展,网络信息资源正以人们难以想象的速度增长,而在大数据时代,信息过载成为普遍的问题,为了帮助用户快速准确的从网络上获取资源,推荐系统应运而生。随着 web2.0 的发展,web用户可以根据自己的需要和理解自由的对项目资源进行标注,正是这些标签连接起了用户和资源,基于这三者的动态关系,就可以分析出标签系统的一些特点,从而出现了基于标签的推荐系统。标签推荐系统允许任意用户对其感兴趣的网络资源进行无约束的标注,所有用户的标注都互为可见,这种开发模式为新环境中信息资源组织推荐和共享带来了新的机遇。
基于标签的推荐系统,主要采用以下几种技术,基于资源内容的推荐,主要是从资源本身的属性特点入手,从资源内容中提取关键词作为标签,可以较好的解决数据稀疏和冷启动问题,而且具体也分为两种,基于文本/网页内容标签推荐方法和基于图片内容的标签推荐方法。基于协同规则的推荐,协作过滤是目前研究中使用较广泛的推荐方法,协作过滤是基于从许多客户收集的品味信息自动预测客户兴趣的一种方式,有两种主要的协作过滤方法,基于用户和基于项目。基于网络的个性化推荐,由标签系统中的用户资源和标签可以构成网络的形式,基于二分图构建相应的网络后利用内边比社区外边密集的原理对网络进行社区划分,最终借鉴同一社区中其他用户的标注实现对目标用户的推荐,当然还有一些其他的推荐方法,这里就不再一一赘述了。
国外有关基于标签的推荐问题的相关研究起步相对较早,主要有以下3种(1)基于矩阵的方法(2)基于聚类的方法(3)基于图论的方法。相对于国外学者的研究而言,国内学者的研究成果相对较少,而且十分分散。曹高辉和毛进采用概念空间方法,为标签建立概念等级层次结构,邓双义针对用户喜好的标签集合和资源对应的标签集合,利用wordnet语义相似度算法,杨丹和曹俊借鉴tf-idf公式计算用户和标签之间的相似度,同时计算标签之间的相似度并对标签聚类。
2. 研究的基本内容与方案
本次课题主要目标是开发一个将用户标签资源三者良好的结合在一起的资源标签关联规则挖掘系统,基本内容是将每个用户常用的标签后面的资源进行统计,然后搞清楚用户标签对应这哪些资源,给用户进行合理的资源推荐,拟采用的技术方案是推荐系统,推荐系统是一种分析客户数据(包括用户的购买数据)以便推荐他们最合适的产品或服务的服务,通过分析收集的客户数据,找到用户之间的相似性,并且最终推荐用户可能所需要的资源,协同过滤分析用户感兴趣的资源,在用户群中找到指定用户的相似(兴趣)用户,综合这些相似用户对某一信息的评价,形成系统对该指定用户对此信息的喜好程度预测。
关联规则挖掘过程主要包含两个阶段:第一阶段必须先从资料集合中找出所有的高频项目组,第二阶段再由这些高频项目组中产生关联规则。
利用软件工程的思想,先写软件需求规格说明,然后概要设计,详细设计,编码,测试进行资源标签关联规则挖掘系统,采用的是关联规则的apriori算法。
3. 研究计划与安排
1. (1)2017/1/14—2017/2/22:确定选题,查阅文献,外文翻译和撰写开题报告;
(2)2017/2/23—2017/4/30:系统架构、程序设计与开发、系统测试与完善;
(3)2017/5/1—2017/5/25:撰写及修改毕业论文;
(4)2017/5/26—2017/6/6:准备答辩。
4. 参考文献(12篇以上)
[1] g. adomavieius, a. tuzhilin: “toward the next generationof recommender systems: a survey of the state-of-the-art and possibleextensions”. ieee trans. on knowl. and data eng., 2005, 17(6): 734—749.
[2] j.h. jooa, s.w. bangb, g.d. parka: “implementation of arecommendation system using association rules and collaborative filtering”.procedia computer science, 2016, 91: 944-952.
[3] h. ye: “a personalized collaborative filteringrecommendation using association rules mining and self-organizing map”. journalof software, 2011, 6(4): 732-739.
最新文档
- 华北地区夏季降水多年、少年近地层水汽场及风场分布特征开题报告
- 天山地区典型流域降雪分布研究文献综述
- 2016年台风狮子山路径突变原因的初步分析开题报告
- 北京和寿县地区边界层急流观测与模型的对比文献综述
- 具有双Kelvin波结构MJO活动的再分析开题报告
- 基于单片机的温控风扇设计文献综述
- 1961-2015年江苏省气候资源的时空分布规律开题报告
- 智能搬运机器人文献综述
- 基于类型的电影推荐系统文献综述
- Bi6S2O15的合成及其降解有机污染的研究开题报告
- 不确定时滞奇异摄动系统的鲁棒控制器设计文献综述
- 小型双模SIW滤波器的研究与设计开题报告
- 我国绿色出行政策执行研究——以南京市为例文献综述
- 试论李碧华小说中的爱情悲剧开题报告
- 基于FPGA的电子相册设计文献综述