2012年美国硅谷投资的最热门主题就是大数据。2005年至今,IBM、EMC都花了超过一百亿美金投资于这个领域。
什么是大数据,目前还没有统一的定义。但不可否认的是,互联网、移动互联网的大爆发,使得数据量似乎陡然变“大”,而云带来的计算能力的革命,使得处理这些体积大、种类繁多的数据成为可能,也使得云计算有了新的商业价值落地方式,一个更大的市场正等待IT从业者去挖掘和探索。Amazon在转型,新公司如Opera都在基于数据本身来创造价值。那么,在2013年,大数据会驱动哪一块业务,衍生出哪些新的业务模式?创新者要怎么利用这些新数据和新价值?
大数据的核心在于“自动化”,而非大多数人认为的“分析挖掘”。当所有的效率都达到最高的时候,你的核心的竞争能力在哪里呢?是数据本身。怎么通过IT能力引导业务,企业数据将会成为企业的一个核心能力,靠数据本身的价值作为一个新的商业模式来获取巨大的盈利空间。
大数据跟企业本身有什么相关性呢?第一个能力是识别。比如超市,发会员卡的目的是什么?并不是为了给你打折,而是了解你的行为喜好、支付能力等,进而将用户差异化。第二个是感知,通过对个体用户的识别,快速感知整个市场的变化。第三,有了这个对于个体的识别和对整个市场的感知,就可以做到干预。
传统的BI(商业智能)是做一个统计、分析,数据更多的是做探索与发现,它发现一个规则,再把这个规则实施在条例里。大数据本身就是企业的智商。
什么样的服务形态会成为在主要的大数据里落地的应用方式?可以分成三个类型:数据能力服务、信息服务和知识服务。
数据能力服务,比如数据的长期保存,还有面向大企业的专业维护,容灾的能力。
信息服务,即大数据的检索和交付。传统的企业对于历史数据多采用备份或导出到链接的阵列或磁盘阵列的方式,这样既不节省成本,历史数据的获取成本又比较高。大数据技术可以很好地解决这一问题。
知识服务,就是数据融合催生一种新的知识服务。它体现在三个方面:第一是,时间维度上,长期持续的积累数据可以使数据本身更具价值;第二是,数据的广度方面,数据不仅服务于我,同时可以服务于更多的企业内容,属性和特性更为丰富;第三,数据模型,随着数据本身的积累,在某一个行业领域对这个行业的认知就会越来越深,同时会对行业本身形成一个干预。知识服务实际上需要三方面的能力获取。第一个,数据融合能力;第二,超强的处理能力;第三是更多的创新应用。
自动化的数据获取、分析处理和反馈是大数据的核心能力。这些能力与企业的需求有极大的匹配度,可以针对不同的需求落地大数据。
对于开发者来说,云计算是省钱、省力的事儿,但最终要赚钱靠的是应用,还得在数据上多琢磨。云计算平台是盖电厂的活儿,这是互联网巨头们才能干的事儿。可能会有个缝儿,但小的开发者能做的非常有限,比如也就挣点系统集成的钱。更多的机会还是在应用上,但最好这些应用同时又跟云相关,能把数据收集起来。数据相关的云,会给出小公司从小到大成长起来的机会。而且,在成长过程中,数据本身会逐渐变成应用的一个壁垒,迭代也会比较快,这是一种更新、更先进的模式。简单的部署类应用以前就有,但那只是演进,不是革命。
要做大数据相关的业务,首先要有数据。大数据对传统行业的改造与早期互联网乃至IT技术对传统行业的改造是类似的,一定会发生,但相对会慢。在中国,现在能自由拿到的数据还是在互联网上,但是互联网领域产生数据最多的地方还是在巨头手里。于是,应用开发者只能根据巨头的开放政策确定自己的创业体系。所以,要跟平台维持一个比较好的关系。有人提到了防止数据垄断的问题,但是这个可能挺难的,谁来防止呢?
在应用层面,其实许多需求很早就有,只是由于制度、技术等原因,没有被迅速释放出来。比如出租车应用,现在能够掌握打车人和出租车的位置,利用这个做供求的匹配。这就是非常直接的以数据为基础的应用。
大数据应用还处于比较早期的阶段,但对企业发展来讲,以后的发展重点就在于如何利用数据。围绕数据的整个生命周期,也就是数据的生态系统,从存储开始,到处理、检索、分析、可视化,都存在着不同的需求。
综合目前国内外在大数据方面的商业模式,总结起来主要有四种:利用很强的数据处理专业能力建造数据集市;使用社交平台数据做分析应用;数据使用从专业人员使用向普通人员推广;垂直数据集成(多通过API发布)。
目前在数据分析方面的创业企业比较多,如个性化推荐和舆情分析。相对来说,在大数据的处理平台,如Hadoop,非结构化数据库等技术型企业比较少。
我认为在大数据相关应用开发方面,未来会有几个趋势:第一,通过个性化推荐来解决信息过载的问题。换句话说,当一个广告打扰你的时候你觉得是广告,但当它是你需要的内容的时候就很容易被接受;第二,平台在竞争加剧下更加开放;第三,传统数据挖掘的价值跟外部社交数据和移动数据结合;第四,包括政府便民数据,这些垂直的数据集成分享会越来越多。最后,中小企业和大企业的数据布局不一样。中小企业可能更适合用自下而上的方式影响企业里做分析的个人,从而使得他们这样的分析方式能够渗透到一个企业的组织里去,影响流程。
基于大数据的应用在2013年将得到进一步的发展。Hadoop越来越成熟,将得到更多支持;其他的NoSQL数据库应用增多;数据分析在商业领域的应用开始;可能会有创业企业在数据可视化领域开始尝试。
CIO之家 www.ciozj.com 公众号:imciow