社交网络信息挖掘算法综述论证与验证分析开题报告
2022-01-14 20:47:00
全文总字数:4542字
1. 研究目的与意义及国内外研究现状
1.选题的目的和意义 |
近年来,信息技术及互联网的发展十分迅速,与此同时智能移动设备和4G网络也快速发展普及,越来越多的定位技术被运用于网络和智能终端中,移动互联网的兴盛正在深刻地影响改变着我们的生活[1]。 在定位系统和通信技术发展的双重推动下,社交媒体,这一种新型的能够让人们创造并分享媒体信息的工具和平台,得到了飞速的发展,吸引了全球数亿的用户踊跃参与其中[7]。 地理位置定位技术的发展和社交网络的兴盛,使得越来越多的人意识到移动互联网广阔的应用前景和作为信息来源的重要性。移动社交网络将现实世界和互联网连接在了一起,我们可以通过挖掘这些带有地理位置标签的媒体数据来分析理解用户,做出归纳性的推理,预测用户的个性化行为及用户习惯,以此为基础推出面向用户的个性化服务[6]。 通过对这些社交网络信息挖掘算法的原理研究和实际验证分析,能够对比得到不同算法在挖掘带有地理信息属性的信息时的效果,经验证分析可以判断地理信息在社交网络中用于不同用途时应采取何种算法。 |
国内外研究现状
2.国内外研究现状 |
2.1国外研究现状 2.1.1大数据及大数据在各领域的应用 对于社交网络信息的挖掘应归类于“大数据”。Wiki对大数据的定义为:资料量规模巨大,在合理时间内达到撷取、处理、并整理成为帮助企业经营决策更积极目的的资讯。国外对大数据研究重点是技术研究,重视的是数据工程而不是数据科学,主要考虑分析算法和系统效率[13]。 国外在根据网络信息进行个性化推荐方面在各领域的应用研究较早。个性化广告方面,Google创立了AdWords,不仅关注搜索关键词,而且对用户的搜索历史进行记录和分析,更精确地呈现相关广告内容[13]。 电子商务领域,亚马逊将协同过滤机制的推荐应用于商品推荐,用户所得到的商品推荐会随着交互的增多而变得更加准确。新闻与内容阅读推荐的研究方面,A.Borchers等人指出协同过滤能有效解决信息过载和推荐问题。Mai-Vu Tran等对于用户兴趣模型的研究将新闻推荐研究与实体与个人兴趣模型联系在一起。近年来,移动新闻个性化推荐也成为新的热点[19][18]。 2.1.2基于地理空间信息的社交网络 随着移动通信技术的发展与移动设备获取地理数据的能力增强,位置社交网络逐渐融入了人们的生活。Facebook,Twitter,Instagram,Google等社交媒体都将地理位置这一维度添加到了自己的服务当中。用户可以及时分享当前所在地理位置、状态、事件、观点、旅途见闻、兴趣爱好等[18]。 2.2国内研究现状 2.2.1国内大数据发展现状 中国的大数据研究起步较晚但近年来发展迅速。国内在大数据研究领域的重点在大数据与云计算、数据挖掘,并行计算和分布式处理。对社交网络用户行为的分析已经成了热门研究,浏览网页时是看到的广告、新闻、购物推荐等都是数据发掘分析的应用体现[13]。 2.2.2国内基于地理信息的社交网络 网易等新闻网站都有针对用户位置的本地新闻;搜索引擎百度、搜狗会收集用户地理位置信息来展示本地化的搜索结果;应用最广的社交软件QQ、微信、微博都支持用户发布动态或聊天时分享当前地理位置;使用人数众多的移动支付应用支付宝也有很多与地理位置相关的服务[12][24]。
|
2. 研究的基本内容
3.研究内容 |
基于如微博之类的社交网络中具有地理位置属性的数据,使用多种数据挖掘算法,对这些算法的原理进行解释说明,并在实际使用中对这些算法的效果、准确性、效率等进行验证分析。 主要研究内容有: 3.1 基于位置社交网络的用户轨迹相似性挖掘方法。 该方法首先针对位置社交网络的签到点,提出了基于聚类区域半径的自适应密度聚类算法(Clustering-Area-Radius-BasedAdaptiveDensityClusteringAlgorithm,CARBADCA),该基于聚类区域半径的自适应密度聚类算法首先对用户签到点进行自适应聚类操作,得到用户访问的自适应分层位置区域;在此基础之上,提出用户轨迹相似性双重加权模型(UserTrajectorySimilarityDoubleWeightedModel,UTSDWM),首先利用向量空间模型分别计算用户在不同分层位置区域下的加权相似性,再通过加权各层次上的相似性以得到用户行为轨迹上的总体相似性[25]。 3.2 关联规则挖掘算法Apriori和FP-Growth算法。 关联规则挖掘算法是数据挖掘领域的一项重要研究内容,可以在大量数据集中发现项集之间的互相关联的特性[15]。 3.3 地理位置好友的挖掘及相似度计算。 一个用户的实际GPS数据在空间和时间维度上是连续的,将用户在社交网络上的签到点作为地理兴趣点(Point of Interest,POI),根据POI记录其内部ID、名称、经纬度、签到时间,即POI=(ValueID,Name,Location,Time)。用户在现实世界中到达某地理位置后,便可通过其在社交网络中的地理签到记录得到访问过的POI。 一次社交网络中的地理签到记录在内部通常包括用户标识信息、用户访问过的POI、访问时间及用户对访问POI的评价。对于一个特定用户的POI记录按时间顺序连接起来就可以得到该用户的POI轨迹(Poi Trajectory)[16][10]。 3.4 LBS中基于用户兴趣和时间的地理位置推荐。 随着智能手机和移动互联网的发展,基于位置服务LBS(Location-based-services)被很多社交软件使用,如Facebook、Twitter、微博、大众点评、美团等。用户可以实时签到自己的位置、分享自己的活动、发表评论,与他人分享自己的生活。比如用户可以在大众点评和美团上对刚刚光顾的餐厅进行签到发表自己的评论,其他人就可以参考他的评论来选择自己喜欢的食物和店铺。这些信息能反映用户的兴趣爱好、生活规律。利用签到包含的空间、时间、文本数据,可以给用户推荐合适的路径、位置[16]。 3.5 不同基于地理位置的社交网络信息挖掘算法的结果验证与分析。
|
3. 实施方案、进度安排及预期效果
4.实施方案、进度安排及预期效果 |
4.1实施方案: 本文基于微博等主流社交软件的带有地理位置熟悉的数据,对多种基于地理信息和社交网络的挖掘算法进行原理、过程、用途等多方面的综合论述,并实际使用这些算法处理社交网络整的数据,对其结果、效率等进行比较、验证和具体分析。 4.2进度安排: 3月份进行数据收集与处理 4月上、中旬编写毕业论文初稿 4月下旬及5月上旬进行论文修改和完善 5月20号之前定稿 4.3预期效果: 根据以上数据,利用多种模型、算法对具有地理属性的社交数据进行挖掘、处理分析,验证这些算法的实际效果,得出不同算法效果的相关分析结果。
|
4. 参考文献
5.已查阅参考文献: |
[1] 陈彦敏.基于地理位置的社交网络信息应用方法研究[J].电子技术与软件工程,2015(07):34-35. [2] 李华.社交网络的信息挖掘应用案例研究[J].科学咨询(科技管理),2015(06):83-84. [3] 石磊,杜军平,周亦鹏,叶杭,赖金财,何奕江.在线社交网络挖掘与搜索技术研究[J].智能系统学报,2016,11(06):777-787. [4] 陈红松,王钢,张鹏.基于Hadoop云平台的新浪微博社交网络关键节点挖掘算法[J].东南大学学报(自然科学版),2018,48(04):590-595. [5] 李冠辰.一个基于hadoop的并行社交网络挖掘系统[J].软件,2013,34(12):127-131. [6] 方全. 面向地理社会媒体的挖掘与应用[J].2016. [7] 袁书寒,陈维斌,傅顺开.位置服务社交网络用户行为相似性分析[J].计算机应用,2012,32(02):322-325. [8] 蒋盛益,麦智凯,庞观松,吴美玲,王连喜.微博信息挖掘技术研究综述[J].图书情报工作,2012,56(17):136-142. [9] 张晨逸,孙建伶,丁轶群.基于MB-LDA模型的微博主题挖掘[J].计算机研究与发展,2011,48(10):1795-1802. [10] 基于位置社交网络的用户轨迹相似性挖掘方法. https://ssl123a60ebe2a885756d9dcddc6475ba9e37d.vpn.nuist.edu.cn/view/30f67548a98271fe900ef918.html?from=search [11] 社交网络数据挖掘技术浅谈. https://ssl123a60ebe2a885756d9dcddc6475ba9e37d.vpn.nuist.edu.cn/view/76770bb2d4bbfd0a79563c1ec5da50e2534dd172.html [12] 胡玮.基于社交数据挖掘的个性化新闻推送研究[J].现代商业,2016(20):46-47. [13] 大数据的国内外研究现状及发展动态分析. https://ssl123a60ebe2a885756d9dcddc6475ba9e37d.vpn.nuist.edu.cn/view/4df9e1ba700abb68a882fb47.html [14] 蒋锴.含地理位置信息的社交媒体挖掘及应用[D].中国科学技术大学,2014. [15] 刘乾. 基于社交网络和地理位置信息的好友推荐方法研究[D].浙江大学,2013. [16] 任克江. 基于地理信息的检索和用户数据挖掘[D].大连理工大学,2013. [17] 连德富. 基于位置社交网络的数据挖掘[D].中国科学技术大学,2014. [18] 胡毅通. 基于时空数据挖掘的位置预测与服务推荐研究[D].东南大学,2016. [19] 朱亮. 位置社交网络的服务推荐与隐私保护研究[D].北京邮电大学,2017. [20] 张超. 位置社交网络中地理社交影响力的衡量[D].浙江大学,2013. [21] 肖飞. 时空数据中群组用户关联度评价模型与位置推荐算法研究[D].沈阳建筑大学,2016. [22] 朱一波. 面向移动社交网络的用户关系强度并行挖掘算法研究[D].南京师范大学,2018. [23] 姚振兴. 基于手机传感器数据的个体交通出行链信息采集方法研究[D].西南交通大学,2018. [24] 戴振民. 基于微博用户相似度的社交圈挖掘算法研究[D].华中科技大学,2016. [25] 李智,张莹,秦旭.基于位置社交网络的用户轨迹相似性挖掘方法:中国,102880719[A].2013-01-16.
|