大数据的概念内涵及外延

近年来,大数据在全球范围内受到追捧。据国际数据资讯(IDC)公司监测,全球数据量大约每两年翻一番,预计到2020年,全球将拥有35ZB的数据量。据统计,平均每一秒都有200万用户在使用Google搜索,Facebook注册用户超过10亿,每天生成300TB以上的日志数据。同时,传感网、物联网、社交网络等技术迅猛发展,引发数据规模爆炸式增长,大数据时代已经到来。

对于大数据概念的界定,目前尚无统一的认识。由于所从事学科领域的差异,国内外学者对“大数据”有不同的看法。一些学者从计算科学角度出发,认为大数据是指无法在可容忍的时间内用传统IT技术和软硬件工具对其进行感知、获取、管理、处理和服务的数据集合。还有学者从信息资源的角度出发,指出大数据是具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。而近年来,从事社会科学领域的学者认为大数据的概念内涵不应仅仅局限在技术层面:大数据可以定义为在合理时间内采集大规模资料、处理成为常规使用者更有效决策的社会过程。基于现有学者对“大数据”的研究,本文从大数据的内涵、外延出发,将其界定如下。

从概念内涵来看,大数据是指海量数据,泛指大规模或超大规模的数据资源集合。与传统数据相比,大数据具有新的特点,现可概括为“5V”,即Volume(数据规模大)、Velocity(处理速度快)、Variety(数据类型多)、Value(价值密度低)、Veracity(数据准确性低)。

从概念外延来看,大数据还具有三个层面含义:

一是指一种新型的研究方法或发现新知识的分析技术,这是因为大数据不仅强调数据量大,更重视海量数据背后的价值信息。从本质上说,大数据是应对人类数据量剧增挑战而产生的一种新技术。据统计,全球约90%的数据产生于最近两年间,目前每天新增数据量达到2.5百万兆字节。IDC的预测则指出,2011年全球数据总量约1.8ZB,到2020年则将激增到40ZB,这其中文本、视频、图片等非结构化数据占比将达到75%。面对这样一个全球数据的爆炸性增长,没有一套全新的数据处理和分析技术是无法想象的。

二是指由数据驱动的新型决策机制。Gang-Hoon Kim等认为,大数据技术属于第五代决策分析技术。在大数据时代,小到商业机构的营销分析,大到公共领域的政府决策,开始越来越多的依靠数据做出。这种基于数据驱动的新型决策机制,表明了大数据不仅仅是一种技术,更是一种理念创新和模式创新。如美国沃尔玛连锁超市因“啤酒与尿布”的购物篮数据分析而获得的大量利润,美国总统奥巴马依靠竞选团队的数据分析而做出的竞选决策等,都是大数据时代下由数据驱动决策的经典案例。

三是指数字时代下的新型治理模式。大数据不仅仅是政府管理的一种新手段或新工具,其将带来政府管理改革的一个全新阶段。随着大数据在政府管理和公民社会生活的深入,政府部门内部及其与公民社会的关系将被重新建构。技术、组织、关系和行为的再造呼唤全新的管理模式的出现,这种新的管理模式就是数字时代的治理,这种治理模式不只是政府自身内部的一种数字化变革,还是一种广泛深远的社会变革和管理方式的创新。从这个层面看,由大数据应用带来的数字治理模式创新将成为政府管理改革的全新阶段。Amanda Clarke等认为,过去100年间,政府机构设置经历了三种模式(如下图所示)。

首先是韦伯模式,其基本特征是基于书面文献和大规模科层级结构的控制模式。这一模式下,政府信息化致力于社会集成,即办公自动化,政府获取和掌握数据资源的能力较弱。从上世纪60年代开始,韦伯式政府机构开始面向数字化转型,但其数据主要来自内部业务运转,是一个封闭和不透明的系统。在韦伯式结构中,很少使用数据来理解公民,并为政策制订提供依据。自上世纪80年代到本世纪初,新公共管理(NPM)模式成为政府管理改革的主要模式,该模式强调大型部门的解构,引入政府机构间竞争机制以及业务线管理机制等。在这一模式中,信息技术在最初被用于更好地传递服务之后,也逐渐被边缘化了,因为激进的NPM理论认为信息技术技能应当剥离给外部服务供应商。由于政府IT部门被外包出去,甚至在某些情况下被私有化,公民使用政府服务所产生的数据被计算机服务商所拥有,从而与服务供给脱节。且由于担心招来不必要的政府审计,这些服务提供商往往选择雪藏这些数据,而不是将其反馈到政府决策过程之中。这些情况的出现,导致NPM模式下的政府机构实际上既不了解公民,也不了解他们自己。

2000年以来,一种新的公共管理模式——数字时代治理(Digital-Era Governance,DEG)模式出现13。这种模式将数字化技术置于机构层级的核心位置,恢复了被NPM模式所阻隔的政府-公民数据流。DEG模式的基础有三,即对纸质和基于电话的信息系统的完全数据化,以用户为中心的服务一体化模式,以及对碎片化政府机构的重组与整合。在DEG模式下,政府将跨层级的数据管理从原先的私人部门管理转移到集中化的“智能中心”模式,这种模式类似于沃尔玛的大数据仓库管理模式,比原来的政府数据管理模式有效得多。大数据的兴起,正好与政府管理模式的这一变革遥相呼应。

0%