以微信为例的基于位置的查找和交友服务的用户行为表征:匿名性和人口统计外文翻译资料
2022-11-16 14:57:42
英语原文共 11 页,剩余内容已隐藏,支付完成后下载完整资料
以微信为例的基于位置的查找和交友服务的用户行为表征:匿名性和人口统计
摘要:微信在中国是非常受欢迎的应用程序,无论是基于位置的社交网络(BSN)还是在线社交网络(OSN)。在本文中,我们的关注点在于微信“附近的人”服务,这是一个典型的查找和调情服务,类似于Momo和Tinder。具体地,人们在该装置的当前地理位置由“附近的人”服务读取定位并获取附近的其他人的列表。然后用户可以请求建立与任何列表上的用户的一个微信友谊关系。在本文中,我们将探讨:(1)是否一种性别比另一种更倾向于使用“附近的人”服务;(2)是否使用“附近的人”服务人比普通的微信用户更喜欢匿名;(3)是否普通的微信用户匿名的比Twitter用户多。我们还采取了深入研究用户的匿名性和人口的组合方式和检查:(4)是否微信普通女性用户匿名的比普通男性更多;(5)是否使用“附近的人”的女性比男性用户匿名的更多。通过回答这些问题,我们将获得关于现代的网上约会和友谊创造的显著见解,就是应该能够告知社会学家以及未来的设计师查找和调情服务的见解。
关键字:基于位置的社交网络、匿名性、人口统计学、查找和交友服务
1 简介
智能手机和无处不在的基于位置的服务(LBSs)的广泛扩散推动了基于位置的社交网络(LBSNs)的指数增长。LBSs的子类别LBSNs,旨在使人们发现附近的用户,并建立现场交流。目前,有一种非常流行的,帮助推荐附近的餐馆(如大众点评,Yelp)的LBSN应用;为用户创建匿名平台的应用程序(例如Yik Yak,Whisper);还有帮助寻找附近潜在的约会对象,通常被称为查找和调情服务(例如Tinder,微信“附近的人”)。
在本文中,我们关注我们的微信研究。微信,既是一种LBSN又是OSN应用程序,它在全球拥有6千多万用户。与Facebook和Google 不同,微信不强制实名政策,因此用户可以在注册过程中使用假名。微信的LBSN服务,如“摇一摇”、“漂流瓶”、“朋友圈”和“附近的人”,帮助用户与附近用户建立友谊。在本文中,我们关注于“附近的人”服务,这是一种典型的查找和调情的服务,类似于Momo和Tinder。具体地,人们在该装置的当前地理位置由“附近的人”服务读取定位并获取附近的其他人的列表。然后用户可以请求建立与任何列表上的用户的一个微信友谊关系。微信可以报告在100米内每个用户有多远。
本文中,我们将探讨有关查找和调情服务下列问题:(1)是否一种性别比另一种更倾向于使用“附近的人”服务;(2)是否使用“附近的人”服务人比普通的微信用户更喜欢匿名;(3)是否普通的微信用户匿名的比Twitter用户多。我们还采取了深入研究用户的匿名性和人口的组合方式和检查:(4)是否微信普通女性用户匿名的比普通男性更多;(5)是否使用“附近的人”的女性比男性用户匿名的更多。通过回答这些问题,我们将获得关于现代的网上约会和友谊创造的显著见解,就是应该能够告知社会学家以及未来的设计师查找和调情服务的见解。
这项工作旨在探索展现匿名性和人口在基于位置的查找和调情的应用表征用户行为的可行性。利用别人的数据收集方法,为期连续7天,我们共收集8462个截图和41874微信接口相当于3,215不同的拉丁中文字母的名字。根据别人的收集方法,在别的实验伙伴的帮助下,我们将这些微信用户分为4类:匿名的,真实身份的,部分匿名的,不可分类的。
我们的研究结果汇总如下:
对于普通的微信用户,男性用户和女性用户的比例是大致相同的。然而,当涉及到使用“附近的人”服务,男性用户数与女性用户约四比一。
对于普通的微信用户,匿名用户略多于真实用户。然而,当涉及到使用“附近的人”服务,匿名用户是真实用户的两倍之多。
对于普通微信用户,谁是可识别的男性分数是几乎两倍之多的女性谁是可识别的级分,而女性谁是匿名的分数大大数量上超过男性谁是匿名的分数。然而,当涉及到使用人附近的服务,可识别的男性分数显著降低,匿名的男性分数显著增加。
根据数据显示,微信比Twitter有更多匿名用户。
我们终于建立了可用于通过附近的人查询数据集和用户的人口统计信息来检测匿名的,可识别的微信账号一个机器学习分类。因此,我们能够以新的方式重新定义匿名的概念。
本文的其余部分安排如下。第2节简要论述了微信应用的背景。第3节呈现的数据收集和数据集的框架。在第4节,我们初步比较普通的微信用户附近的人用户。在第5节,我们采取了深入的看看一位不愿透露姓名和性别,以及持续性的组合方式。在第6节,我们用机器学习重温微信用户的匿名性。第7节调查相关工作。最后,第8节总结全文。
2 研究背景
我们的研究限制在2011年最流行的应用程序LBSN-微信。自从成立以来的,它已成为中国事实上的社交网络和邮件系统,并且还可以在许多其他城市来流行的文章,我们首先描述了“附近的人”服务,然后看看微信的要求用户名实名政策。
2.1“附近的人”服务
微信应用提供了附近的人服务,需要输入一个用户的移动装置的当前地理位置,并返回微信用户的接近的列表。然后,用户可以发送请求到在与他们建立友谊微信的关系。一旦友谊关系的两个用户之间建立,用户可以留言互相看到对方的社交媒体帖子。对于附近的人列出的每个用户,微信给用户的接近程度的指标。使用100米,微信的报告,用户不到100米,200米之内,300米范围内,等等。例如,如果爱丽丝距离鲍勃368米,在微信服务器将只报告她距离鲍勃300到400米之间。我们强调的是,如果一个微信用户不使用微信“附近的人”服务,则该用户不是通过本文描述的方法可溯源。用户移动性仅可追踪如果用户反复查询微信“附近的人”服务(图1)。
如上文所描述的,微信列出开始从最接近不同距离范围内最远的附近的人。图2显示了微信的“附近的人”功能的示例图像。距离微信报告的粒度是非线性的;距离可达1000米,100米的范围内,但超越1000米,范围尺寸增大1000米的增量。此外,刷新此列表容易受到许多因素,如同步问题。因此,我们必须考虑到一个事实,即它并不总是能够发现附近的用户。
2.2微信用户分类
我们依靠人类的知识,将微信的用户归类为匿名和真实的。我们研究5所大学实验伙伴,将这些用户标记(参见图2)。具体来说,以下的方法在实验伙伴需要决定这些用户名是否包含以下内容:只是一个名字;只是一个姓氏;既有名字又有姓氏;既不是姓氏也不是名字;不知道或其他。
我们要求实验伙伴只能选择“既不是姓氏也不是名字”或“既有名字又有姓氏”选项,他们是否有充分的信心,从而避免错标特别暧昧的用户帐户。考虑到人为错误,每个账户由三个实验伙伴标记,在意见分歧的情况下,多数表决来决定。但是,如果决定仍不能达到,
图1 |
图2 |
我们(作者)为有问题的帐户决定最终的标签。通过利用这些标签,我们定义每个微信用户为下列之一:
身份:既包含名字又包含姓氏一个微信账号;匿名:既不是姓氏也不是名字的微信账号; 部分匿名:要么包含一个名字或姓氏,但不能同时包括的微信账号;半匿名:要么是部分匿名或匿名一个微信账号;不可分类的:一个微信账号既不是完全匿名,身份也不是部分匿名。例如,以公司或组织的名称命名的一个微信帐户。
可以肯定,微信不支持完全匿名(即,那些从来不与任何相关的假名账户)。然而,在本文中,我们使用通常使用的术语匿名代替经常出现在密码学中。我们把术语假名与上述两个术语认为是等同的。
图3
3 方法
3.1 数据收集
本文旨在创建一个放置两个虚拟探针在世界任何位置和使用这些探针在探头收集附近的微信用户沙的名字的距离的系统。下面我们使用BlueStacks Android模拟器模拟多个Android设备。每个仿真我们都运行微信的应用程序和另一个应用程序,命名为假的GPS,通过输入对应于所需位置的纬度和经度来设置探测器的GPS位置,以在世界上任何地方找到(见图2)。微信应用随后察觉此位置是欺骗用户。我们的实际位置使用商业光学字符识别(OCR)软件,ABBYY FineReader会自动数据收集过程,将获得的桌面图像;然后我们处理通过光学字符识别(OCR)工具的所有收集到的图像中提取的用户名和报告对于对应于每个探针的每个微信截图距离(参见图3)。别人的数据收集方法有更详细的描述。
我们在华尔街、纽约进行了真实的实验。我们在曼哈顿市中心的实验探测,然后在华尔街有2个探头,每200米放置一个,并记录人们在两个探头的位置邻近查询。两个探测器的任何位置用时从30秒至2分钟以扫描附近的人。两种探针都设置为每30分钟,以减少通信到微信服务器替代地扫描。然后,我们使用OCR提取用户名和报告每个微信截图距离。获得微信用户名之后,我们执行这些用户的大规模分析。垃圾邮件的用户将被过滤掉,依靠人类知识的所有用户随后被划分为无名氏,真实身份,部分匿名或不可分类的基础上,也就是第2.2节所述的标准。
我们收集的数据有从2015年1月19日至2015年1月25日,我们使用了OCR工具,ABBYY FineReader中,提取文本数据形式lt;用户名,距离,时间戳记,探头协调,性别gt;作为一个元组。对于此华尔街实验,名称中的字符是拉丁字符,其可以通过OCR自动确定。对于中国汉字,我们依靠人类的知识进行干预,以提高整体精度。
图4
3.2 数据集
我们用一台机器收集来自华尔街连续7天设置两个虚拟探测数据。总共8462张截图,41874项lt;用户名,距离,时间戳记,探针坐标,性别gt;形式的元组。对应于收集3,215不同拉丁中国字符名称。在5组实验伙伴的帮助下,这些用户被分成4组,对应于匿名,真实,部分匿名,和不可分类的用户。用户的划分是按2.2节所述进行。我们也考虑到了自我报告的性别作为显示在附近的人列出了对于每个用户名。出现每一天不同的用户数显示在图4。我们看到,出现在任何一天的用户数量波动约800,保证了我们在我们的数据集不够鲜明的用户帐户,而不是高频率查询的用户非常少。
为了使与微信普通用户谁没有触发微信“附近的人”功能的比较,我们要求5名女性志愿者和5名男性志愿者收集其联系人列表中的用户名作为我们的微信参照组。具体而言,在总共1136不同的用户名中通过使用在第2.2节描述的方法分为4类。
我们将数据集总结如下:微信一般用户(微信咨询小组),我们的十个测试志愿者的朋友们有1136;微信的人附近的用户:我们的实验过程中出现在连续7天任何一天至少一次用户有3,215;微信7日人民附近的用户:在实验过程中的所有7天连续出现用户有82个;Twitter用户:改编自的数据集(50173帐户)。
图5
4 比较普通用户和“附近的人”用户
在本节中,我们比较普通的微信用户和“附近的人”用户的性别和匿名数。
4.1 性别分析
我们首先通过比较性别分布对于普通用户的微信和附近的人开始,正如我们从图5看到的。普通微信用户,男性用户和女性用户的分数似乎是大致相同。然而,当涉及到使用“附近的人”服务,男性用户使用了大约四比一多于女性用户。对男性用户这种偏差出现谁出现至少一次在连续7天,和谁出现在每个7天连续用户的用户。
从这个分析,我们可以看出,男性比女性在附近的人们更加活跃。这可能可能是因为男人的隐私关注较少;或者它可能仅仅是男人试图建立新的朋友和队友的时候更积极。进一步的研究是由心理学家和社会学家需要更深层次了解使用附近的人们服务的激励机制和存款保险计划的激励措施,并在人们为什么男性更普遍使用“附近的人”服务。
4.2 匿名分析
我们现在比较匿名发行普通微信用户与那些附近的人。正如我们从图6观察,定期微信用户,匿名用户略多于识别用户。然而,当涉及到使用附近的人们服务,匿名用户的两倍之多识别用户和半匿名用户通过大约一点五十五多于识别用户。朝着人们匿名用户的这种偏见最近出现谁出现至少一次,用户和出现在每个7天连续用户。
图6
从这个分析,我们可以看出,匿名微信用户在附近的人们更加活跃。这可能可能是因为用户可能不喜欢暴露自己的查找和调情服务的身份,如附近的人们服务。由于匿名用户的身份尚不清楚,匿名用户可能在使用该服务更加舒适。此外,一些用户可能会选择匿名使用附近的人们服务的明确目的。进一步的研究是由心理学家和社会学家需要更深层次了解使用附近的人们服务的激励机制和存款保险计划的激励措施,并在附近的人,为什么匿名用户更普遍。
5 基于性别的匿名性分析
在这一节中,我们需要更加深入地了解我们的数据集,检查匿名和性别组合的方式。
我们首先按性别分布的匿名性比较普通微信用户和附近的人开始。如我们从图7看到的,所有的1136帐户的,谁是可识别的男性分数是几乎两倍之多的女性谁是可识别的级分,而女性谁是半匿名的分数大大数量上超过了分数男性谁是半匿名的。因此,我们看到,经常微信的用户中,女性选择匿名的名字比更频繁的男性。这也许是因为女性都更关心的隐私,或者是因为女性喜欢用不寻常的,幽默的名字。更多的研究,可能使用传统的调查,是需要了解选择匿名名的动机。
然而,当涉及到使用人毗邻服务(参照图8),所有的3,2
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[29751],资料为PDF文档或Word文档,PDF文档可免费转换为Word