基于知识图谱的个性化推荐算法应用研究文献综述
2020-04-14 21:35:07
随着大数据时代的到来,海量的数字化学习资源给线上学习带来极大的便利的同时,也带来了相当信息过载与知识迷途的问题。现如今网络承载着各种各样的信息资源,人们不仅可以从网络上获取信息,还可以在网络上发布信息,在这样的互联网环境下,任何资源都成指数增长,根据统计,中国国家图书馆藏书3119万册,而互联网中文搜索引擎百度公司所建的百度云计算中心数据存储量超过4000PB,相当于20多万个中国国家图书馆的藏书总量。但是由于人们能够接受知识的容量是有限的,为保证学习顺利,掌握的知识量不能超过记忆的容量,而如果学习的知识量超过记忆容量,就会产生认知过载[7]。
当前主流的个性化推荐技术主要为以下三种:协同过滤推荐、基于内容的推荐和混合推荐。其中协同过滤推荐对于资源形式不做限制,有利于发现新的兴趣,但是对学习者关系依赖性强,得不到准确的推荐资源;基于内容的推荐不依赖评价信息,推荐结果简单直接,但是对文本的特征不已提取局限于有丰富文本信息的资源;混合推荐结合多种推荐技术优点,但是难以实现[3]。这三种方法各都有其利弊。
而知识图谱作为一种新兴的技术,是知识工程的一个分支,是以知识工程中语义网络作为理论基础,并且结合了机器学习,自然语言处理和知识表示和推理的最新成果,在大数据的推动下受到了业界和学术界的广泛关注[1]。自2012年谷歌正式提出知识图谱的概念并将其运用于搜索引擎的改进以来[2],其对于解决大数据中文本分析和图像理解问题开始发挥了重要作用。但是目前,知识图谱的研究成果主要在股票投研情报分析、公安情报分析、反欺诈情报分析等方面[3],而在数字化学习资源推荐上并不常见。
本文将采用自底向上的方式对学生的课程情况构建知识图谱并进行个性化推荐。这是一个迭代更新的过程,其每一轮更新包括3个步骤:1)信息抽取,即从各种类型的数据源中提取出实体(概念)、属性以及实体间的相互关系,在此基础上形成本体化的知识表达;2)知识融合,在获得新知识之后,需要对其进行整合,以消除矛盾和歧义,比如某些实体可能有多种表达,某个特定称谓也许对应于多个不同的实体等;3)知识加工,对于经过融合的新知识,需要经过质量评估之后(部分需要人工参与甄别)才能将合格的部分加入到知识库中,以确保知识库的质量[9]。新增数据之后,可以进行知识推理、拓展现有知识、得到新知识。
而将知识图谱技术应用到个性化的课程推荐上,能够找到学习资源中哪些知识点在知识体系中占有重要位置,从而有效地剔除掉海量学习资源中多余的部分再展现给学习者。学习者通过知识图谱推荐的个性化课程,在学习的过程中便能做到胸有成竹,也能避免在学习过程中出现“学习迷航”与“认知过载”现象,因此,这样不但可以节省学习者的学习时间,还可以提高其学习效率。
{title}
2. 研究的基本内容与方案
{title}
本文拟使用新兴的知识图谱技术来代替传统的数字学习个性化资源推荐算法,将海量的数字化资源以特有的方式有条不紊地联系起来,并以可视化的方式呈现出来。力求优化客户的学习效率,提升客户的学习积极性。
基于知识图谱的个性化推荐可主要分为构建知识图谱和个性化推荐两大模块。其中构建知识图谱是一个迭代更新的过程,其每一轮更新包括3个步骤:1)信息抽取,即从各种类型的数据源中提取出实体(概念)、属性以及实体间的相互关系,在此基础上形成本体化的知识表达;2)知识融合,在获得新知识之后,需要对其进行整合,以消除矛盾和歧义,比如某些实体可能有多种表达,某个特定称谓也许对应于多个不同的实体等;3)知识加工,对于经过融合的新知识,需要经过质量评估之后(部分需要人工参与甄别),才能将合格的部分加入到知识库中,以确保知识库的质量。新增数据之后,可以进行知识推理、拓展现有知识、得到新知识。而个性化推荐的过程则为:资源库-gt; 资源描述库 -gt; 资源联系 -gt; 知识图谱 -gt; 资源推荐列表 -gt; 学习者,即通过对学习资源以及用户喜好构建知识图谱后,找到推荐的课程,并以图谱的形式推荐给用户(即学习者)。
3. 参考文献
[1] 漆桂林,高桓,吴天星,知识图谱研究进展[J],情报工程,2017,1:4-25.
[2] 武金刚,知识图谱——搜索引擎的进化[J],百科知识,2013,22:28-29.
[3] 赵佳男,王楠,数字学习资源推荐技术研究现状及趋势分析[J],北京邮电大学学报(社会科学版),2014,6:90-96.
[4] 汪沛,基于领域知识图谱的个性化推荐方法研究[D],昆明理工大学,2017.
[5] 刘昱,基于知识图谱的个性化学习资源推荐研究[D],河南师范大学,2018.
[6] GAO Caixia; QI Changping,Complex Network Optimization Research of Personalization-based Recommendation Algorithm [J],Advanced Materials Research,2017, Vol. 989-994:1441.
[7] 黄华升,基于知识图谱的个性化学习资源推荐研究[J],软件工程,2018,10:24-26 23.
[8] 张丙奇,基于领域知识的个性化推荐算法研究[J], 计算机工程,2005,31(21):7-9 33.
[9] 刘峤,李杨,段宏,刘瑶,秦志光,知识图谱构建技术综述,计算机研究与发展 2016,53(3):582—600.
[10] 徐增林, 盛泳潘, 贺丽荣, amp; 王雅芳. (2016). 知识图谱技术综述. 电子科技大学学报,第45卷,(4), 589-606.
[11] 杨晋吉, 胡波, 王欣明等. 一种知识图谱的排序学习个性化推荐算法[J]. 小型微型计算机系统, 2018, 第39卷(11):2419-2423.
[12] Pla Karidi, D., Stavrakas, Y. amp; Vassiliou, Y. J Ambient Intell Human Comput (2018) 9: 2035. https://doi.org/10.1007/s12652-017-0491-7.
[13] Baoxian Jia, Xin Huang, amp; Shuang Jiao. (2018). Application of Semantic Similarity Calculation Based on Knowledge Graph for Personalized Study Recommendation Service. Educational Sciences: Theory amp; Practice, 18(6), 2958–2966. https://doi.org/10.12738/estp.2018.6.195.
[14] Laura Dietz , Chenyan Xiong , Jeff Dalton , Edgar Meij, The Second Workshop on Knowledge Graphs and Semantics for Text Retrieval, Analysis, and Understanding (KG4IR), The 41st International ACM SIGIR Conference on Research amp; Development in Information Retrieval, July 08-12, 2018, Ann Arbor, MI, USA.
[15] 陆星儿,曾嘉灵,章梦瑶,郭幸君,张[1] 黄华升,基于知识图谱的个性化学习资源推荐研究[J],软件工程,2018,10:24-26 23.
[16] 常亮,张伟涛,古天龙,孙文平,宾辰忠.知识图谱的推荐系统综述[J/OL].智能系统学报,2019(02):1-10[2019-03-17].