基于微博数据的用户画像与精准营销毕业论文
2020-02-15 16:52:48
摘 要
随着互联网和云计算技术的迅猛发展,大数据时代已经悄然来临。在大数据时代,使用相关的技术手段对微博用户的数据进行采集和分析,建立用户画像的模型,便于更好的了解用户的兴趣偏好以及行为偏好,使精准营销成为了可能。本文着力研究的是在利用微博的话题聚合来建立用户画像,所以本文是建立在基于微博话题的背景下建立用户画像,通过文献研究法,爬取数据法以及数据分析法,分析微博用户在某一话题下某一个人或者某一群人的用户信息,并且用这些用户信息给用户贴上标签,通过这些标签,我们就能准确的为用户建立相关的用户画像模型。企业就能够通过我们建立的用户画像模型来对目标人群进行分类管理,为他们制定良好的个性化推荐与个性化服务,进而加快企业精准营销的进度。
关键词:大数据;基于微博;用户画像;精准营销
Abstract
With the rapid development of Internet and cloud computing technology, the era of big data has quietly come. In the era of big data, relevant technical means are used to collect and analyze the data of weibo users and establish the model of user portrait, so as to better understand the interests and behavioral preferences of users and make precision marketing possible. Focus on the research of this article is on the issue of using weibo polymerization to build user portrait, so this article is based on based on weibo topics under the background of the user, through literature research, crawl data and data analysis, analysis of weibo users in a certain topic one person or a group of people under the user information, and labeled with the user information to the user, through these labels, we can accurate portraits related user model is established for the user. Enterprises can classify and manage target groups through the user portrait model established by us, develop good personalized recommendations and personalized services for them, and then accelerate the progress of enterprise precision marketing.
Keywords:Big data;Based on weibo;Personas;Precision marketing
目录
摘 要 I
Abstract II
1 绪论 1
1.1 研究背景及意义 1
1.2 相关研究综述 1
1.2.1 大数据研究综述 1
1.2.2 用户画像构建方法研究综述 2
1.2.3精准营销研究综述 3
1.3 本文研究内容 3
1.4 研究方法与研究思路 3
2 基于微博数据的用户画像 5
2.1 用户画像的概述 5
2.2 用户画像的构建方法 5
2.2.1 基于用户行为的画像方法 5
2.2.2 基于用户兴趣偏好的画像方法 6
2.2.3 基于主题的用户画像方法 6
2.2.4 基于人格特性和用户情绪的画像方法 6
2.3 用户画像的数据源获取 6
2.4 用户画像标签建模 7
3 基于微博话题的用户画像模型建立 9
3.1 数据源获取 9
3.2 用户画像构建 10
3.3 微博精准营销 13
4 用户画像在精准营销中的应用 15
4.1 发现营销的目标人群 15
4.2 更加准确迅速的掌握用户的动向 16
4.3 将潜在用户转化为目标用户 16
4.4 进行更加精确的推送 17
5 总结与展望 18
参考文献 19
致谢 20
1 绪论
研究背景及意义
新浪微博拥有非常庞大的用户群体,它与传统媒体相比,有以下显著的特征:第一,接受传播信息的受众群众具有广泛性的特点;第二,信息传播途径的普遍性;第三,进行传播的内容具有原创性;第四,微博传播的内容具有及时性。正是由于微博的这些特性,使得微博上拥有的大量的数据,所以巨大的商业价值就蕴藏在这些庞大的数据之中。首先在微博用户进行注册时,用户就已经将大量的基本信息例如姓名、性别、年龄、星座、学历、地域等提交给了微博,在之后用户进行了一定的行为后,还可以获得到用户的粉丝数、关注数、兴趣标签等,但是这些获得的数据之间的关联性还比较弱,不能够精确将一个人或者一群人的用户画像勾勒出来。为了能够更加精确地建立用户画像的模型,还需要这个人或者这群人的相应的兴趣图谱。在微博如此大量的数据之下,几乎不太可能做到把每一条微博背后的用户的兴趣爱好都挖掘出来,所以新浪微博利用人们对不同话题敏感度的不同,吸引不同的人加入不用的话题进行交流,这样不但能够获取的人群的信息,还能更好的为这一群人贴上标签,构建用户画像,为他们建立用户模型,这样作为媒体网站、广告商以及企业能够有效地进行精准营销,降低广告输出的成本。
1.2 相关研究综述
1.2.1 大数据研究综述
因为计算机能够存放的数据越来越多以及针对大数据的算法越来越高级,最近几年数据疯狂增长,这种改变使得学者对大数据的研究越来越深入,企业也在随着时代的变化而进行转型。大数据改变了人们的传统的思想观念,并且让人们意识到现代社会每天都在进步,大数据带领人们以一个全新的视角去看待各种各样的新技术的涌现,将人们旧的对待生活、工作的态度转化为现代化的思维。
从以往的调查中我们能够了解到,在2003年以前,人类产生的所有数据加起来总共只有5EB[3],这个数据对于现在来说,只相当于人们两天产生的数据,有人预测到不久的将来,全世界产生的数据将比现在多得多。在如此巨大的数据中,可能蕴藏着大量的用户的潜在需求,那么企业如何运用这些大量的数据来进行企业营销,这是目前企业有待思考的问题,也是企业的竞争力的体现。
现在的大数据在人们生活的各个方面都有所体现,由于大数据蕴藏着大量的价值,使得国内外学者从各个方面对大数据都做出了大量的研究。IBM首先提出大数据的特点--5V,大数据具有大量,高速,多样,低价值密度以及真实性这5个特点[4]。在1980年,阿尔文▪托夫勒也对大数据进行了研究,甚至将大数据称为"第三次浪潮的华彩乐章"[5]。Gartner在2012年的时候指出,最多在两年的时间内,大数据将成为未来科学技术研究的热门之一[6],因为如此大量的数据构成了大量的用户信息,这些信息蕴藏着宝贵的财富,但是如此庞大的数据的处理需要大数据技术新的发展,这样才能为企业提供更加准确的并且有效的信息,增强企业应对市场变化的风险的应变能力,才能更好地制定企业的策略。当然,我国研究人员也针对大数据做了大量的相关的研究。他们指出,现在大数据已经成为现代网络技术中的基础,所以要全面推进大数据技术的进步与发展,要快速实现数据资源的共享,并且加快对这些共享资源的开发,将企业都转型为现代化大数据型企业,帮助国家能够创新性地治理社会;其中包括:加速开放政府数据的共享,使得政府的数据透明化;助力大数据企业,使得大数据产业能够积极、健康的发展。如今大数据已被广泛应用于人们的日常生活中,在分析了大量的数据之后,可以研究大数据在创新性治理社会方面的作用,其中包括:人们的公共安全,城市的公共交通等[7]。企业也能够通过大数据,对大量的用户数据进行分析,就可以了解企业的目标人群,之后通过分析目标用户的数据,就可以获取目标用户的偏好以及需求,进而对目标用户实行精准营销。
1.2.2 用户画像构建方法研究综述
用户画像能够形容出目标用户,能够反映目标用户的需求,能够为产品提供设计以及优化的思路,因此用户画像被应用于各个地方。在实际操作中,我们往往需要利用用户的属性为用户贴上“标签”,然后将这些“标签”与用户的行为偏好结合起来。用户画像往往作为实际用户的一个“替身”,但是这个“替身”角色是根据产品和市场的变化走势来构建的,这个假想的用户角色需要能够体现出产品的目标人群。随着用户画像技术趋向成熟,用户画像可以全面并且准确地描述用户的"标签"信息,可以了解到用户的需求改变以及行为偏好,产品偏好,从而进行精准营销。随着用户画像技术的发展,近几年国内外关于用户画像研究也日益增多。第一个提出用户画像的概念的是交互设计之父A.Cooper。Amato,R.M.Quintana等将用户画像解释为一个集合,是一个从大量数据中提取出的用户信息然后构成的用户特征的集合,对这个集合进行分析,我们就可以知道用户的需求、行为偏好以及兴趣偏好等[8]。而用户画像的中文翻译是由用户画像的几个基本属性的首字母组合而成得到的。国内的学者也从多个角度研究用户画像的构建方法,他们从多个角度分析用户画像的建立方法,最基础的就是通过用户的姓名、性别、年龄等基础信息建立用户模型,然后就是可以通过用户的工作经历、收入情况来进一步完善用户的用户画像[9]。
1.2.3精准营销研究综述
精准营销是现代营销理论大师菲利普科特勒教授近年提出的。精准营销的核心是以客户为中心,增强客户的体验感,而且必须要精确和准确,通过利用一切可以利用的方法,在正确的时间,正确的地点,合适的价格,通过合适的方法,向正确的顾客提供合适的产品[10]。
目前关于精准营销有以下的理论基础:(1)顾客让渡价值理论。在《市场营销管理-分析、规划、执行和控制》中,"让渡价值"的概念的油然而生。美国西北大学教授菲利普科特勒认为,人们在购买东西的时候,都喜欢自己花费的成本能够尽可能的地,但是又希望得到的价值尽可能的大,所以人们在选择的时候,会偏向于“让渡价值”尽可能大的东西。那么根据这个理论,在竞争如此激烈的市场情况下,谁的“让渡价值”更大,谁就能获得更大的竞争力,谁就能获得更多的潜在的用户;(2)市场细分理论。市场细分理论实际上是一个分类的思想,是将市场上众多的消费者根据他们的收入水平,兴趣偏好,购买习惯等,将他们分成不同的群体,然后根据各个群体之间的差异,对不同群体实行不同的营销策略。精准营销就是要快速高效地找到目标的群体,然后对他们进行研究分析,从而以更低的营销成本达到更佳的营销效果,并且还能更好地提高顾客的忠诚度;(3)4C理论。其实4C理论和精准营销的思想是相似的,都是以客户为中心,4C指的是消费者(Customer)、成本(Cost)、便利(Convenience)和沟通(Communication),根据这些来针对客户进行营销活动。精准营销理论是对这个理论的进一步深化和拓展。因为精准营销可以实现企业对客户单对单的营销模式,正是由于这种模式,企业在进行产品设计的时候,就能够极大程度上考虑客户的个性化需求,这样才能更好地满足客户的需求,提升用户对产品的好感度。
1.3 本文研究内容
本文基于微博数据以及微博的话题聚合的特性,通过网络爬虫技术,利用八爪鱼软件,抓取微博用户的数据,建立用户模型。一共分为以下几个部分。首先是绪论,这部分介绍了本文的研究背景以及相对应的意义,进行了简洁的叙述,接着详细说明了用户画像的国内外的研究现状了;其次关于用户画像,详细地介绍了用户画像的相关知识,如何给用户贴标签,进而给用户建立用户画像;然后是利用微博话题来建立用户画像,通过对数据的抓取,建立相关的用户模型对微博的用户群体进行分析;接下来是用户画像在精准营销中的应用,详细地阐述了用户画像在精准营销中的重要作用,用户画像是实现精准营销的前提条件;最后是总结与展望,该部分对本文的研究工作及结果做了相关的总结。
1.4 研究方法与研究思路
本文主要通过查阅并理解大量的文献,并且通过互联网上的资料,利用八爪鱼软件对新浪微博的数据进行爬取,并且将爬取到的数据进行清洗,分析并且建模,最后通过对模型的分析实现精准营销的目的。研究方法包括:(1)文献研究法:通过阅读大量的文献并从中获取对研究有帮助的知识;(2)爬取数据法:通过某些爬虫软件,爬取新浪微博上一些用户的某些数据,以此为基础来建立用户画像,以达到精准营销的目的;(3)数据分析法:通过一定的工作清洗、整理并分析所爬取到的数据,并利用这些数据建立用户画像。
2 基于微博数据的用户画像
2.1 用户画像的概述
随着互联网和大数据的紧密结合,各行各业也已经逐步向更加信息化的方向发展,所以人们的行为肯定会随着社会的变化而变化。现在和以前最大的不同是,现在人们的行为能够被越来也多的人所获取,也就是随着大数据的发展,人们的隐私从以前的封闭化到现在在网络上的透明化。随着大数据技术的深入发展和应用,企业通过对数据的深入分析,通过对用户的个人信息、用户的行为信息再结合用户的兴趣偏好,构建相关的用户模型,于是“用户画像”的定义油然而生。
用户画像,是将用户打上“标签”,而这些“标签”是真实用户的一个“替身”,并且是根据产品和市场的形势来构建的,通过这些来分析并建立用户画像模型[11]。用户画像可以给用户构建很多的“标签”,这些标签包含了用户很多的信息,比如姓名、性别、年龄、身高、体重 、学历等等,这些个人信息都是重要的分类标准。此外,微博是一个话题聚集的平台,通过微博话题也可以将用户进行分类。还有就是用户的收入的多少、工作的行业等等因素会决定用户是否会进行消费以及进行消费的程度,这也是用户画像的一个重要分类标准。用户画像的目的是使企业更加深入地认识用户,我们需要知道用户到底需要什么,以及用户以后可能会需要什么,把各个人群精确地划分开,并且还要准确的知道这群人有什么特征,寻找可能有隐藏需求的用户人群,帮助企业认识各个人群之间的差异,让他们能够更好地找到精准营销的机会,提高企业的核心影响力。但是用户的信息是不断变化的,除了一些特定的静态信息外,其他信息有可能会不断地动态变化,所以这对企业的人群划分可能会造成一定的困难,因此企业必须定时地更新客户的变化的信息,并且结合之前的静态信息,完善并优化人群的用户画像,提供更加精准的营销。
2.2 用户画像的构建方法
2.2.1 基于用户行为的画像方法
对用户行为(尤其是网络用户)偏好的进行分析,是用户画像的核心。利用这种方法来建立用户画像,能够让企业了解到用户在不同的时间段所表现出的不同的行为,这些行为的改变以及导致这些行为发生变化的原因,然后尽可以将用户划入特定的群体,并且研究每个特定的群体的用户的行为之间有什么差异,通过比较这些差异来构建不同的用户画像模型,这样就能个性化地为各个不同的群体提供不同的精准营销。但是值得注意的是,虽然通过这种方法所构建出的用户画像非常的直观,企业也偏向用这种方法来建立用户画像的模型,但是随着日益增加的数据,大大增加了企业抓取用户数据的难度,如何在这海量的数据中来抓取用户的交互行为,成为了现在有待解决的问题。
2.2.2 基于用户兴趣偏好的画像方法
通过分析用户的兴趣偏好,可以得到用户对待某些事件时所产生的行为偏好和行为特征,因此通过分析用户的兴趣偏好,并建立相应的用户画像模型是现在建立用户画像模型的热门方法。从国内外学者的研究成果可以看出,这种方法主要分析用户的显性兴趣和隐性兴趣两个方面,显性兴趣是根据用户在网络上各个地方留下的信息以及痕迹,并对它们进行分析,通过这些分析得到用户画像模型;隐性兴趣则是根据得到的这些数据进行推理分析,然后建立这些用户可能存在的潜在兴趣模型用户画像。但是,用户的兴趣偏好可能会因为时间和场景的不同而不同,所以针对用户兴趣偏好的用户画像需要时刻根据用户所处的环境的改变而改变。
2.2.3 基于主题的用户画像方法
这种用户画像构建方法是通过分析用户所发布的各种文本信息,从而全面的了解用户的信息,从而构建完整的用户画像。根据国内外学者的研究成果,这种用户画像建模的方法与其他用户画像建模方法不同地方是,这种方法可以根据主题来细化用户的兴趣,这样可以有效地解决关键字数量比主题数还大的问题,不仅极大程度上节约了存放用户画像所占领的资源,而且还能加强算法的效率。但是这种方法需要的是通过关联关系找到用户与主题之间的联系,所以不能根据用户的自身特征进行用户画像的构建了。
2.2.4 基于人格特性与用户情绪的画像方法
这种用户画像模型的建立非常新颖,是根据用户的人格特征和情绪来建立用户画像的,由于这种方法非常新颖,目前的研究还并不是也别完整,只是有一些学者对这种用户画像构建的方法进行了简单的研究,而相对之下,我国学者对这个领域的研究明显示不够的[12]。
2.3 用户画像的数据源获取
要进行用户画像,首先要获得用户的数据。除了掌握用户的姓名、性别、年龄、学历等基本信息之外,还要掌握用户在全网的行为数据,通过互联网爬虫技术可以准确的掌握到用户在网站上的浏览记录,这些记录可以看出用户在网站上的看过什么东西,对什么东西感兴趣并且在搜索引擎上进行搜索,然后用户点击过什么内容,在每个内容停留了多长的时间,这些信息都是会随着用户行为的变化而跟着进行变化的数据,是动态的。将采集到的这些用户的行为信息,再结合用户的行为偏好,再结合某种联系将他们联系在一起,就能更好地建立用户画像的模型,从而达到提高预测用户需求的准确性。用户的行为偏好要与用户的基本信息保持一致,而且像用户的姓名、性别、年龄、手机号、收入、职业、地区等静态信息要保持相对的稳定,这样才能更好地将用户画像进一步完善,并且选择合适的用户标签,构建用户画像模型。
2.4 用户画像标签建模
为用户制定他们相应的标签是用户画像的主要工作,微博用户的标签通常由用户的姓名、年龄、性别、手机号、学历等基本信息,用户的行为偏好以及用户对微博话题的敏感度构成,将这些所有的“标签”相整合[13],就能够描绘出与之相对应的用户画像。用户画像的所要做的就是用“标签”来作为实际用户的一种“替身”,“标签”是一种快捷、方便、高效的方法,所以“标签”要使用简单、通俗的语言,使得人们能够快速并且准确地理解每一个标签的含义,同时一种标签表示一种含义,做到文本的简练,使得计算机能够程序化地解决与人相关信息的问题。所以用户画像的标签要做到以下两个特征,首先,标签要语义化,使得人们能够快速并且准确地知道每一个“标签”所代表的意思,然后,标签要用很简短的语言来描述,每个标签只能代表一个意思,做到文本的简练。