大数据研究和应用现状及发展开题报告
2020-04-15 18:14:23
1. 研究目的与意义(文献综述包含参考文献)
文献综述
”大数据” 这个术语最早可追溯到apache org的开源项目nutch。当时,大数据用来描述大量数据集。而与近年来所说的”大数据”含义最近的是2008年9月杂志《nature》上的”big data”专刊,从各方面介绍了”大数据”带来的挑战,现状以及未来发展趋势。自emc赞助idc发布”数字宇宙”系列专题报告来,提出庞大的”数字宇宙”中包含大量非结构化和半结构化数据。2011年发布一篇名为”从混乱中挖掘价值” 的报告,自此,才正式出现”big data”这个词语。
直到2011年5月的”云计算相遇大数据”主题大会上emc抛出”大数据”概念,”大数据”才真正成为热点。差不多同时,全球知名咨询公司麦肯锡在研究报告《下一个前沿:创新﹑竞争和生产力》指出,数据已经渗透到每一个行业和业务职能领域,逐渐成为重要的生产因素,在业界引起巨大反映。国际顶级学术刊物又相继出版专刊来专门探讨对大数据的研究。2011年science推出”dealing with data” 专刊,讨论数据洪流带来的挑战。2012年4月欧洲信息学与数学研究协会会刊ercim news出版专刊”big data”,讨论大数据背景下的数据管理,数据密集型研究等问题。随着大数据在国外日益受重视,国内也开始积极关注大数据。2012年5月,香山科学会议组织了学术研讨会,并就大数据的理论与工程技术研究,应用及大数据研究的组方式进行了深入探讨。6月,”大数据时代,智谋未来”学术报告会开展,就大数据时代的数据挖掘,安全,平台开发等进行了全面探讨。7月,”第二届大数据世界论坛”在北京召开,同月首届中国大数据应用论坛在北京大学召开。
2. 研究的基本内容、问题解决措施及方案
(1)研究目的
系统回顾大数据基础理论与相关技术,为大数据背景下的电子商务数据平台进行数据挖掘的预研。
(2)主要研究内容及关键技术