移动互联网的内容安全研究外文翻译资料
2022-11-22 15:39:49
英语原文共 17 页,剩余内容已隐藏,支付完成后下载完整资料
无线交际(2012)66:523–53910.1007/s11277-012-0738-8
移动互联网的内容安全研究
QianfangXu·JunGuo·BoXiao
在线发布:2012年7月12日
copy;科学 商业媒体,有限责任公司。2012
抽象 在移动面临增长缺少安全的威胁.保持和提高移动互联网的安全性和安全性对于它的蓬勃发展和发展至关重要。在内容层面,用户面临越来越多的恶意或垃圾邮件内容,危害公众对合法互联网内容的兴趣因此,移动互联网信息安全已成为一个重要的研究课题在此文件我们第一个建议一个框架为内容安全管理系统用于移动互联网,和讨论如何获取相关信息从在中移动互联网快速高效的方式,如何处理和分析大量的信息收集,如何到快速发现负数或非法信息内网络,和提供detec和早期警告可能热主题。在相同时间,我们研究如何到执行对信息内容的审核和评估,使相关的安全管理操作可以完成。
关键字 移动互联网·内容安全·检测和筛选·内容审核
1简介
移动互联网是一个新生成的打开网络基于上高带宽IP,提供质量服务的语音、数据、视频等多媒体内容。更具体一些,用户可以访问更大互联网使用他们的移动电话,PDA或其他移动设备
在移动互联网上。换言之,移动互联网将移动通信和互联网连接成一个无缝网络;它是一种快速发展的新型网络。
随着移动网络和互联网越来越一体化。移动互联网可以提供用户与更多服务,有移动功能最初,组合移动通信和互联网,移动互联网提供用户的访问的互联网。作为两者之间的集成增长,移动互联网正在获得不同于有线互联网的新特性,提供了新类型的丰富的互联网应用程序和服务。
中国互联网信息中心(互联网络信息中心)的报告[1],到2011年6月底,中国移动互联网用户的数量增长到了4亿8500万。其中,318百万是访问互联网使用他们的移动电话,指示更多活动伊蒂埃斯在移动互联网上。换言之,越来越多的用户可以随时随地在移动互联网上使用手持设备访问数字内容和服务因此,移动互联网具有巨大的增长潜力,在我们的社会中扮演着更突出的角色
作为移动互联网增长和新社会网站这样作为在线论坛,即时窜改,博客社区和照片和视频共享是得到越来越多受欢迎的每天,人们的主要在线兴趣已经转移到网络娱乐,信息收集和形成在线社区此有基本更改传统总监信息传播模型,既封闭又被动它也吸引了越来越多的在线人群之间的互动。因此,移动互联网具有巨大的增长潜力,它可以在社会中发挥关键作用.
组合移动通信网络和互联网,移动互联网可以提供众多功能富服务和应用程序,但与增长关注关于信息安全从常规公共在上时间。在内容级别上,宽扩展的恶意内容等为垃圾邮件短信,病毒和恶意软件,和诈骗,色情,ille在线赌博或甚至药品交易网站有污染信息环境,阻止人们从移动互联网获取有用信息所以信息安全在移动互联网有成为越来越重要研究主题。我们基于联机监视和内容筛选支持的方法,以提供内容安全和安全
在此纸张中,我们焦点在上内容级别安全在移动互联网上第一个我们将框架用于移动互联网内容管理系统和然后我们讨论在中详细多媒体信息收集,网页分析,和标识和信息内容安全审计通过移动互联网使用框架。
2内容安全框架管理
我们的移动互联网安全管理系统框架包含4子系统:多timedia信息获取、多媒体内容存储、多媒体内容分析和处理、和用户和业务处理。每个子系统包括几个模块。内容安全管理框架提供设置逻辑关系和数据接口之间这些子系统和他们的模块,也分析不同用户行为为了更好地管理移动互联网上的数字内容,如图1.
2.1多媒体信息获取子系统
信息获取是由信息收集的策略和方法决定的。集合策略包括数据源选择、文件格式识别、收集速率和频率决定。数据源主要包括知名的新网站、论坛、博客站点、和即时消息信息。支持的文件格式包括基于文本的网页(HTML、JSP、ASP、Perl、XML、.txt、等)和图像、声音和视频文件(此为JPEG、TIFF、GIF、BMP、Mp3波、AVI、动画、3gp).集合速率和频率取决于运行时情况。集合策略既可调节,又在动态控制下可以随时添加或删除数据源和文件格式。收集率和频率也可以调整。集合策略还可以调整本身动态基于热点信息提供查询引擎和设备。
该集合基于诸如爬网程序和搜索引擎API等方法,以便从网络页收集实时信息。集合是,由多个计算机并行执行,每个程序都是多线程的,以提高吞吐量。增量集合是使用到改进集合效率,即仅新数据是收集。lected数据首先被筛选以丢弃无用的数据,然后在解码后存储在中的移动互联网内容管理系统数据库中。
目前,快速增长的社交网站仍在获得动力,因为它们是有限元图用户生成的内容。网站这样的为凯的和人人网,有已收集大量信息,特别是反映真实的交互式信息实际网站用户的意见。作为结果,不同集合方法应使用目标微博,社会新闻、在线论坛和博客网站在我们的移动互联网安全管理系统中。
可以使用提供的api,通过的目标网站,实现社交网站(如微博客网站)的数据收集。大多数社交网站公开集成api可用于第三方应用程序和服务,提供数据接口以获取最新的信息-提交新数据和搜索。,因为数据提供从这样的接口直接来从的网站原始原始数据,包括详细信息这样作为发行者,issu时间,加拿大的注释,数字的单击,的的转移,甚至特别注释以结构化格式提供,因此从结构中提取任何所需的信息和相关元数据相对简单,从而降低了收集过程的复杂性和工作负载另一方面,因为在接口上公开的数据执行不包含那些相关到网页格式和渲染,它们是最佳元数据。作为结果,提供的的()首选方法由于其实时性和相对较低的带宽消耗量。
对于那些不公开数据交换API的论坛和微博客网站,收集系统采用了方向模板爬行技术收集有用的信息。此需要美国到首页自动或手动生成模板用于此类网站。此具有在中保存的目标爬行,提高准确性,并生成精确和高质量的数据,但由于适应性较差,因此必须为不同的目标网站生成相应的模板
自动抽取技术可用于收集一般网站的信息,以便从传统网页获取结构化信息利用从提取的数据中获取有用事实的大型结构化数据库建立的培训样本,将该页面集作为贝叶斯分类器或支持Vec机分类器等适当的机器学习算法进行培训,自动生成一个组提取规则,以便为网络信息生成结构化数据
2.2信息存储子系统
主要目的历史数据这样的,多媒体语料库我们索引语言材料基于的时间和语义特征;为了提取和组织所需的培训和测试语言材料在初始创建或后续刷新筛选特征向量的。在探索最新的概念和主题并使增量构造概念格[2]多个技术作为修剪和组合是使用到维护和迈兹的概念点阵到实现最佳效率中主题取样。概念格子是类型的核心数据结构在窗体概念分析理论建议由教授Wille德国。通过案例集和概念集之间的二进制关系来描述'知识',理论有一直和成功地应用了在许多字段[3-5]。多媒体信息存储子系统包含的多媒体信息存储数据库和内容监视数据库,提供统一数据平台支持移动互联网内容安全管理系统。它筛选和存储收集信息,两个网页内容和其元数据,在顺序到中保存信息从移动访问网站中包含图像、音频amp;视频程序、排名数据和交互式审核结果等。
2.3分析和处理子系统
多媒体内容分析和处理子系统主要负责语言材料的extrac和分类。我们转换异构多媒体内容存储在内容数据库到同构数据(基于),它们的元数据。关键问题是元数据的定义和转换。然后作,我们研究了基于XML的描述语言到描述的需要的内容管理的方法。其他手上的,因为筛选器通常根据主题执行其功能,因此必须按主题对语言材料进行分类但是,通常是一篇语言材料可能有不清楚的主题,或可能为相关到几个主题直接分类尝试将不只是没有给出一个明确的类别,但也缩小了覆盖的语言材料超过可能的主题。
我们可以有效解决这个问题由概念格子的间接描述在材料。从概念格可以提取各种类型的知识,如蕴涵规则、关联规则、分类规则等概念格建立语言材料和概念之间的关系,而主题则由概念描述因此,概念格使我们能够通过评估语言材料所涉及的概念与信息安全性之间的相关性来筛选语言材料语言材料是到是选择的上关系在之间筛选主题和概念到更新和{的创建筛选器。
2.4用户和业务操作子系统
用户和业务操作子系统收集、搜索和过滤来自自动收集的域模型的信息(知识、信息处理、用户感兴趣的资源、域组织框架)和用户模型(下)作为用户背景、兴趣、行为和风格)。它还可以为用户自动提供有趣和有用的信息,并提供基于康定uous学习和适应信息和用户兴趣更改的个性化服务。
为了在移动互联网中管理内容安全,我们不仅必须能够快
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[22793],资料为PDF文档或Word文档,PDF文档可免费转换为Word