知名咨询公司麦肯锡(McKinsey)已决定在一份新的报告中将“大数据”确定为下一个重大问题。正如大家所预期的那样,这份报告证据确凿、语言优美,但其基本原则似乎是将大数据看作一大机会,利用云计算设备的“大资源”来从更多数据中挖掘更好的答案。我无意争辩其是否真实、是否确实有部门和机构认为这是一个突破性问题,但这个问题的确与我平时和首席信息官们探讨时的观察与发现不相符。
我们探讨的两个关键话题一个是存储的成本和方式问题,另一个是随着同事们使用的网络(内容)和Web 2.0(人)资源日益增多而带来的数据治理难题。如果把这些问题进行分解,则更多的是与小数据相关的问题,即人数、设备数和资源数量,这些都会产生和使用各类数据。这给数据存储地点以及备份方式和重复数据删除方式带来了重大难题,但在实践中,这些都是技术问题,所有存储服务供应商都急切希望带着自己的最新产品参与进来。
用谷歌或必应搜索一下“cost volume data storage”(成本 数量 数据 存储),您就会明白我的意思。再搜索一下“data governance”(数据治理),只会返回一个真正一致的名称,即“Data Governance Institute”(数据治理研究院),该机构已成立数年,发布了不少关于其数据管理框架(Data Governance Framework)的研究成果,即数据治理的工作清单和工作方式。然而,就如我在本文开头所说的那样,问题在于小数据,或者更具体地说,是从外部资源持续获取小块数据,存储于硬盘上,然后转发给公司中的其他人。
这种小数据的积累不是我们自己的系统产生的,一般也没有经过监管,但如果问问用户,他们会说真正的意义在于这些数据为他们提供了所需要的信息。如此,我们应该将其当作“不可信”数据,确保与我们自己公司的“可信”数据隔离。困难就在于此,因为经常会有一些数量可观的这种数据通过各种途径“溜进”公司,然后,一些规则就说公司已获得这些数据的所有权并对数据的准确性负责。
问题的根源在于人们越来越重视技术在前台和市场的外部应用,而传统上,IT的作用仅限于企业内部,处理企业正式流程产生的各种数据。我们希望并需要充分利用市场中的各种信息来源,提供本地决策支持,从而对事件和机会做出正确有效的反应。目前,这种情况已在许多企业中初见端倪,可归为“消费者IT”一类。坦率地讲,这应该是任何首席信息官需要关注的问题,但问题不会自然消失。事实上,这个问题将继续发展,成为消费技术给企业能力带来的关键变化之一,以促进企业营业收入的增长。
我个人将这种现象称为“语境可信”(trusted in context),所谓语境是指使用信息的人对信息所作的的判断或使用经验。比如,一个销售员从竞争对手网站了解到其面向市场的特别优惠活动,然后利用这些公开信息来调整自己的销售定位,从而做到有针对性地面向客户推广,这种情况下,这位销售员就是在语境中使用此等信息。语境是具体的、有限的,因此,可能给销售员及其企业带来的后果和风险也是有限的。但如果未经核实其意义和准确性就在大数据模型下对整个市场都使用这些信息,实际上是一种严重的扭曲。然而,在技术利用方式日新月异,互联网络模型逐步延伸,外部互动日益普遍的大背景下,这种定义未免过于简单。
我以前提到过MIKE2.0。时间过得真快,什么是MIKE2.0呢?他们网站给出的定义是:MIKE2.0表示集成知识环境的方法(Method for an Integrated Knowledge Environment),是针对企业信息管理的一种开源方法,为信息开发提供了一种框架。MIKE2.0方法是整个开源方法框架的一部分。最重要的是,它是一种动态环境,随着市场、技术和使用方法的变化而不断完善和变化。
因此,我的建议是尽量考虑大数据因素,并阅读有关该主题的各种报告,但对于你们战略和营销部门的同事是否对此表示认同,我深表疑虑。目前,多数企业面临的主要问题实际上是小数据,以及随着整个企业中越来越多的人使用存储于各种设备上的小数据,而带来了小数据量不断增加的问题。为此,我建议大家深入研究MIKE2.0,先从他们针对该话题制定的五个发展阶段开始。