大数据意味大知识吗? ——整合大数据分析和社会商业研究的概念模型外文翻译资料
2022-11-30 16:53:49
英语原文共 16 页,剩余内容已隐藏,支付完成后下载完整资料
大数据意味大知识吗?
——整合大数据分析和社会商业研究的概念模型
Xuemei Tian1 Libo Liu1
Published online: 1 October 2016
Springer Science Business Media New York 2016
摘要:大数据时代已经降临在很多社区团体上了,从政府、电子商务到健康组织。信息系统的设计师在为分析有见识的一代开发一种完善的大数据研究方法上面临着大的机遇和挑战。除此之外,商业智能主要在商业社区中使用,因此可以在许多关键领域利用丰富的数据和特定的分析方法来创造机会。本文的目的是通过当前和新兴的实证文档以及它们更广泛的业务影响来评估这些趋势在当前业务环境中的相关性。在这篇文章里,我们使用BigML来研究两个社交信息渠道(即基于朋友的意见和基于领导者的社交信息)如何影响社交商务网站上消费者的购买决策。我们进行了一项实证研究,在该实证研究中,我们为大数据研究整合了一个框架和理论模型,以证明大数据分析可以成功与理论模型相结合,产生更强大,更有效的消费者购买决策。该结果为IS研究和实践提供了重要而有趣的见解。
关键词:大数据,商业智能,消费者知识管理,消费者购买行为
1 介绍
自20世纪60年代以来,硬件、软件和通信之间的相互作用就已经导致了信息系统中以前无法预料的进展。这些发展伴随着“载体与内容”之间关系的转变,以及后者作为各种数据、信息、知识,甚至智慧[1]的表现。 在此期间,学者们对数据和信息超载的担忧进一步加剧,同时也开始关注组织和管理挑战的相关问题[2]。
对这些问题的一个回应就是出现了子学科,诸如竞争和商业智能,数据、信息和知识管理[3-5]。 其他的回应来自于管理和组织理论,尤其是基于资源的理论,它强调内部能力的重要性[6,7],然后还有回应是基于知识的观点[8,9],其重点是作为竞争优势和组织成功基础的无形资源(即不完善的移动,不完全可模仿和不可替代)。
随着对信息技术,信息系统和业务之间关系的理解加深,另一个核心教训就是——技术本身不可能为管理层不断提出的问题提供答案[10]。无论是关系数据库,数据挖掘还是企业系统,最新的“大事件”通常在被推向市场时都不如说是一种变革力量。对于最新的这样的突破例如大数据[11]也是这样的。如何更好地利用除了商业资产和人力资本外的大数据资产,创造出新的价值已成为企业竞争优势的沃土。 随着大数据分析成为推动知识,创新和加强决策过程的下一个前沿领域,其对整个社会的影响的重要性都不应被低估[12]。
本文的目的是通过对当前和新兴应用的实证文档以及它们更广泛的业务影响来评估这些趋势在当前业务环境中的相关性。在本文中,我们使用BigML软件包来调查两个社交信息渠道(即基于朋友的和基于意见领袖的社交信息)如何影响社交商务网站上的消费者购买决策。 我们通过把理论模型与使用BigML分析大数据相结合来进行实证研究。 这种方法论证明,大数据分析可以成功地与理论模型相结合,以产生更强大,更有效的消费者购买决策。 但是为了实现这一点,大数据技术必须进一步发展以应对所提出的大数据分析框架。
本文的其余部分安排如下。在第二节中,我们提供了有关大数据,商业智能,社交信息处理理论和在线消费者评论的文献回顾。 在第三节中,我们根据文献综述确定研究差距。在第四节中,我们进行了一个实证研究来开发和解释我们的方法,并将不同模型的结果作比较。 在第五节中,我们为最终模型提供了强有力的检查,并通过讨论我们研究更广泛的应用范围来结束。
2文献评论
2.1 大数据和商业智能
在大型主机,个人电脑,互联网和Web 1.0时代以及最近的移动和Web 2.0时代之后,大数据已被标记为技术革命的第五次浪潮[13]。它结合了数据移动中的架构范式转换,其目的不是为集中计算提供数据,而是将计算推送到分布式位置[14]。大数据分析已被用于描述数据集和分析技术,这些数据集和分析技术在如此庞大(从兆字节到百兆字节)和复杂(从传感器到社交媒体数据)的应用中需要高级和独特的数据存储,管理,分析和可视化技术[12]。考虑到看似无限的频谱,大数据可用于社交网络,网络服务器日志,流量传感器,卫星图像,广播音频流,银行交易,摇滚音乐MP3,网页内容,政府文件扫描,GPS路径,汽车遥感,金融市场等[15]。Dumbill(2012)解释说,虽然任何数据当尺寸太大而不能被传统系统处理时都可以被视为“大”,但是大幅增加的数量(有太多数量),速度(移动得太快)以及多样性(它不是以一种可用的方式进行结构化)不再适合数据库体系结构[12,15]。最近,其他研究人员提到了另外三个特征,如Daniel说 [16]:(1)价值(竞争优势的来源),(2)准确性(数据中的偏差,噪音和异常),(3)验证(指数据验证和安全性)。 Daniel [16]认为,这三个属性也代表了大数据的基本属性,它们与数据准确性相关联,这是一个与数据的长期性及其与分析结果的相关性相关的概念。除此之外数据存储以有用的数据形式还可以进行适当的增值分析。
显然,今天和以往相比,数据是关键资源,企业正努力在无数的数据点上创造数据,从而创造价值并获得竞争优势[17]。 正如下文将会看到的那样,通过技术变革,监管流程和管理决策的结合,企业正在以惊人的速度收集和存储数据, 这反过来又使组织能够利用商业智能来做出更快更可靠的基于信息的业务决策[18]。
据称,大数据技术的出现已经使信息中心系统(如数据仓库(一度用于战略决策支持)和企业资源系统(支持日常操作)等)的分离变得过时[19]。 特别是在新的官僚机构结构中交易和运营数据的集成管理部门,承诺通过更明智的决策,发现隐藏的大数据和使业务流程更加自动化来提高业务价值[20]。 此外,由此产生的决策可以基于数据和严谨性而不是直觉来实现[12],但是越来越多的情况下大数据将变革性数据发现和高级分析工具置于客户手中[21]已经表现出了对专有知识安全性风险的担忧[22]。
此外,尽管企业界对大数据有很大的热情,但有些人认为这并不是什么特别之处,只是把它看作是知识管理中的特征的放大,而另一些人则预测它的流行最终会由于其复杂性和合格工人的短缺而减少[23]。 数据大小与其应用环境之间的平衡也很重要。IBM和牛津大学商学院联合进行的一项调查显示,30%的受访者不知道“大”对于他们组织意味着什么[24]。 在其他地方,有人已经观察到将充分性和相关性纳入考虑范围可能需要“不那么大的数据”[25]。因此这个技术这可能适用于较小的企业,这些企业也期望采用这些技术,例如通过SaaS或作为ERP系统的一个组成部分[26]。
大数据持续性案例的一个重要组成部分是需要教育和培训一批新的能正确使用BI[27]的统计人员和分析师,大数据科学家作为多功能问题解决者在不同部门之间进行通信[28,29]。 同样对于已经熟悉组织独特的业务流程和挑战的内部分析师的专业职业发展,也被确定为业务主管的首要任务[24]。这可能会扩展到操作人员,以反映他们对正在进行的系统集成和传统组织层次结构破坏后的分析和决策能力的需求[19]。
与其他此类概念一样,商业智能(BI)的含义和解释多年来一直在改变。简而言之,BI指的是利用信息获取竞争优势的能力。这包括教育、技能以及员工过去帮助企业识别组织内的关键人才,并确保其发展和保留[29]的数据的能力。BI通常指分析关键业务数据的技术,系统,实践,方法和应用程序,以及帮助组织更好地了解其业务并通过及时决策对市场做出的响应[30]。更高级的应用程序和增强的能力可以来深入回答BI引擎提出的问题[31],商业智能和大数据计划必须共同推进,而不是单独在平行轨道上。真正的价值在于将现有的商务智能和分析功能与新的大数据技术集成在一起,并且专注于这些新功能如何扩展和现有环境如何拓宽[31]。
很显然,要实现大数据的预期效益还有很多工作要做。关于这些大型数据集(原始数据元素,信息,知识或元知识)的具体内容以及数据,信息和知识等术语之间的关系的问题需要被澄清[25]。在数据的大量干草堆中试图找到有意义的针头时,对数据的误用或“虚假发现”也有风险[11]。因此这需要数据分析,采集,提取和清洗等领域进行改进,整合,表示和解释,彻底整合系统。更通俗地说,无论是在组织方面还是在整个社会方面,大数据的利益和风险都是个问题,无论这些问题涉及隐私,安全和道德方面的潜在问题,还是新出现的数字鸿沟,数字网络鸿沟[1,32]的问题。关键是大数据发展的这个“软”层面延伸到组织层面的行为和文化发展,并将扩展到更广泛的规范和行为。
大数据的承诺是真实的,但是它的潜力和实现之间目前存在很大的差距。许多领先的研究人员,如阿格拉瓦尔等人[33]和Zicari [34]强调大数据研究中的机会和挑战,并认为挑战不仅包括明显的规模问题,还包括异质性,结构的缺乏,隐私的错误处理,及时性,出处以及可视化。这些问题阻碍了各个阶段(采集/记录,提取/清洗注释,集成/汇总/表示,分析/建模和解释)的进展。更好地理解和管理这些问题是从数据创造商业价值的关键[33]。从数据创造实际价值的任务不能仅仅通过专注于新技术的开发来实现,这也要求我们从根本上重新思考我们如何管理数据分析。本文的目的是介绍如何管理数据分析的概念。
2.2 社交信息处理理论和在线消费者评论
社交商务网站日益增涨的可用性和流行度增加了在线社交信息作为市场力量的重要性[35]。 以前的研究揭示了eWOM(电子口碑)与产品销售/收入之间的关联,并主要通过意识或说服效应来解释[36]。 Alshibly和Chiong [37]表明,客户授权可以增加电子政务的成功。以eWOM通信形式的基于意见的社交信息可以通过多种渠道进行。例如,消费者可以张贴他们的观点,并在网络日志上发表对产品的意见,浏览各种社交网站等。其他研究发现,消费者评论的数量与产品销售显有明显的相关性[38,39]。
如今,在线消费者评论在大多数在线购物网站中变得越来越普遍。消费者使用它们来寻找符合他们偏好的产品,或者找到对离线购买有用的信息。通常,在线消费者评论可以被解构为几个维度,专注于这些研究的学者已经报道了这些评论对于选择和销售产品的影响。例如,Kostyra等人[40]关注在线消费者评论的价格(即平均评级),数量(即客户评级的数量)和方差(即评级的变化)(也参见[41]),发现体积和方差只能作为价效应的调节者。而且据透露,它们对消费者的产品选择并没有直接影响。Liu [42]通过记录发现是审查量,而不是复审效价,增加了总票房收入和每周票房收入。通过将这一发现并进一步深化,Duan等人[43]提出了一个动态联立方程系统,其中两个维度可以被视为零售销售的先导和结果。也就是说,电影的票房收入和评论价都对评论量产生了极大的影响,而好的评价量促成了更好的票房表现。而且,如上所述早些时候学者们就对关于在线消费者评论影响这个问题从零售商或消费者的角度进行了调查。在我们的研究中,我们关注消费者购买决策的效果价值。
3 调查结构
在前面的文献回顾中,来源之间出现了许多共同点。首先,研究人员总体上研究了知识贡献,特别关注知识共享。尽管一些研究指出社会关系活动影响知识共享[44],但很少有研究明确调查社会关系活动。其次,大多数研究依靠调查,案例研究和焦点小组收集的主观数据来探索客户如何以及为何参与在线社区。Straub等人[45]认为实际使用和感知使用并不总是一致的。我们应当使用现场数据来衡量实际贡献,而不是使用自我报告贡献。第三,我们的工作前提是从大数据中提取有用的知识,但我们不仅需要可扩展的分析服务,还需要理论支持。
Boyer等人[46]认识到成功的BI项目的障碍不在于自身,而在于组织本身。因此他们提出了战略性企业商业智能计划,该计划将使企业用户能够在企业级信息的协作杠杆作用下做出明智的决策。这种预测似乎与今天的情况以及大数据的情况相关,大数据的分析驱动见解必须与业务战略密切相关,易于用户的最终理解,并嵌入到组织流程中,以便在适当的时候采取行动[47]。Elbashir等人[48]他们认识到高级管理层,CIO和IT经理之间的协同作用对促进整个组织价值链的决策制定至关重要。这提醒了人们知识组成部分的重要性,无论是对当前对大数据的期望,还是对许多组织仍然无法有效利用现有数据和知识的事实的认识,更不用说进入以适应大数据的需求。
可以肯定的是大数据一定会有所不同,但另一个经验教训是,可获得的数据和信息越多,决策制定过程中对人类判断的需求就越大。在报告与认知增强和工作自动化有关的大数据相关进展时,McGovern
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[21809],资料为PDF文档或Word文档,PDF文档可免费转换为Word