基于新浪微博平台的位置微博抓取技术研究文献综述
2020-06-12 20:21:54
文 献 综 述 1 引言 Internet的高速发展使得互联网逐渐渗透到人们的日常生活中,对社会的方 方面面产生了深远的影响[1]。
随着互联网技术发展日趋成熟,微博作为新社交媒体形态的代表,其使用人群数量基数大,状态信息更新频繁、信息传播迅速,并且微博平台媒介用户占有率相对集中,因此基于微博数据的分析研究成为了十分值得关注的研究方向[2]。
近年来,微博与基于位置的服务(Location-based service,简称LBS)相结合,促使微博平台上产生了大量含有空间位置信息和时间标识的数据,即位置数据(或位置大数据)。
微博的位置数据以文本、图片等多种形式大量存在(如用户在微博位置服务平台上签到时发布的位置关联文本、位置关联照片等),具有良好的现势性和地理精确性,经数据处理、分析和价值挖掘后可广泛用于位置推荐与预测、商业营销与决策、地理国情分析、医疗卫生和民意调查等社会生活的多个领域,进而为泛在测绘、智慧城市构建和位置社会感知提供重要的信息资源保障。
[3-4] 2 研究背景 近年来随着计算机软、硬件技术和通信技术的高速发展,GIS技术也得到了迅速的发展和更广泛的应用,GIS发展的动力一方面来自于日益广泛的应用领域对GIS不断提高的要求;另一方面,计算机科学的飞速发展为GIS提供了先进的工具和手段。
GIS技术的迅猛发展,使它在信息领域的地位日益突出,成为信息技术发展的一个新方向[5]。
而数据的快速获取在GIS的发展中显得至关重要。
新浪微博作为国内的一款为大众提供娱乐休闲、生活服务的信息分享和交流平台,以其门槛低、实时性、原创性、互动性、弱关系、强扩散等特点很快在国内社交媒体中取得优势。
新浪微博用户众多,使得微博信息的传播速度也越来越快,数据在如此快速的传播中变得越来越多,形成海量数据。
新浪微博每日活跃用户数超过5 000万人[6]。