我去参加在维也纳召开的 HP Discover 大会时,心中对会展内容充满了好奇结果我发现,从前的惠普又回来了,但对自身核心能力的理解更加透彻,对如何实现这些能力也满怀激情,无比专注。与许多其他此类活动一样,很多到场的博主都发文对此次活动进行了全面细致的报道,其中包括惠普的官方博客。
对这一活动和相关话题的宣传已足以引起我的兴趣,我的同事 Manuel Sevilla 对此也颇为关注,他是凯捷业务信息管理的首席技术官,正全身心参与有关“大数据”的讨论。“大”这个词不仅可用来形容这个话题,也可以用来形容相关文章的数量!Manuel 在凯捷的博客“Capping IT Off”中写了一些很有趣的东西,其中提到了 SAP HANA 和 Oracle Exadata,所以,有必要一起坐下来了解一下惠普方案和产品的展示,对比一下大家的看法。
我们都仔细考虑过惠普计划合并 Autonomy 和 Vertica 的原因和方式,也考虑过惠普新款存储和备份产品的性能与功用。我们都觉得,这可能是一场彻底的变革,下面,我要借用一下 Autonomy 的创始人 Mike Lynch 博士精彩讲述中的几句话(这篇博文的标题也是从他那里借来的)。他认为,IT 中的代表技术的“T”的具体含义已经改变过三次,但代表信息的“I”迄今为止却从未改变。他指出,我们仍然将大数据视为机器驱动的数据模型的扩展认为只是数据量增加了而已,而事实上,变革将包含海量的以人为中心的媒体数据。
为了阐述这一观点,他演示了基于媒体的信息如何组合在一起,对图像识别做出反应。这是该活动中一次令人印象相当深刻的演示,其中的观点也意义重大。我们知道,这一最重要的信息完全是非结构化的,所以不适合关系数据库,但是,Hadoop 充分发挥应有的调节作用了吗?它确实起到了调节作用,但是发送时性能不够优异,而人眼对反应的明显延迟十分敏感。所以,他对大数据和人类使用信息的看法意味着数据不仅是非结构化的,而且实际上是由不同媒体类型组成的(精彩!),但他的演示确实证明了“答案”很可能是所有媒体的集合。
从这一点看来,确实需要花些时间仔细观看演示,这会让您以不同的眼光看待事物的发展。当然,这本身是一个示例,表明“媒体”正在成为人类理解复杂话题的最佳方式。
所以,该演示很值得一看,观看时请您试想,如果用书面方式描述该话题,需要多少时间和文字。
这是一种很有趣的数据集合,您必须具备针对传达真实信息的模糊排列搜索非结构化数据的能力。因此,惠普选择收购 Autonomy,而不是进入商务智能市场与现有对手竞争。不过,还必须具备快速发送存储数据的能力,这就需要有新的硬件。但是,在得出结论之前,我要指出,并非所有数据都是非结构化的,而且,不要假定能够将使用结构化数据与非结构化媒体的活动区分开,这种想法并不可行。这就需要将 Autonomy 与 HP Vertica 及其结构化数据的在线分析功能相融合,所以惠普计划将此产品与 Autonomy 融合,这一举动在市场中至关重要的大数据领域的确显得“特立独行”。
在我看来,惠普的收购意义深远,对 Manuel 而言,这一举动的远大前景也让其兴奋不已!