大数据时代到来的时候人类文化将进入一场革命。因为前面三个阶段是在用设备和网络为我们提供服务,这是一个整体的服务系统;当服务关联到数据本身时,信息化建设也就发生了变化,而数据就是信息化的核心。
大数据源于云计算、物联网和移动互联,而云计算是人们追求的一种模式和路径,数据是由它带来的。无论是国家还是城市,都会涉及到四块内容:经济产业发展、政府职能、社会的公共职能、军事和国防安全。关于经济产业的发展和政府职能的关系,近日召开的十八届三中全会提出“治理”,而不是“管理”,就是使管理的主体变得多元化。另外,十八届三中全会还设立了国家安全委员会。各个行业都可以涵盖到这四部分当中。在社会发展和技术发展过程中,会涉及到各种数据处理问题,技术发展和社会发展都需要突破这个问题瓶颈。所以我认为,大数据是智慧城市和移动互联发展的瓶颈。如果没有解决这个问题,我们将永远沉浸在云计算、物联网、移动互联、智慧城市等所有的梦幻当中。你的数据没有互联、没有互通、没有互享、没有互用,云计算、物联网、移动互联、智慧城市都只能是梦幻。
中美大数据差异
中国和美国对大数据的理解和重视程度是不同的。美国提出这个概念的时候是基于用数据创造了新的模式和内容。而中国在基础设施建设和整个信息系统的发展上,跟美国有着非常大的差距,这个差距能够大到十年、二十年。但是关于云计算、移动互联网这块,中国起步比美国仅仅晚两到三年,传统的信息系统的技术中国跟美国又差很多,特别是在应用系统完善性上。
所以美国对大数据的理解是要用数据分析新的模式、新的路径,那中国对大数据到底是怎样的?
无论是政府、企业,还是其他各行各业,我们要提大数据,一定要从数据的起源,从它的产生、存储、处理、统计、分析、挖掘、应用、互联互通等角度出发。站在整个数据价值链上去考虑,不能像美国那样去考虑。因为美国的系统基本成熟,中国不能照它的路去走,否则就会像中国的汽车一样,发展这么长时间仍然存在很大的问题:虽然产能第一,但汽车的核心发动机、电速箱、底盘,甚至是外形设计,都受到别人的严重制约。
因此,我们一定要用自身对数据的理解迎合中国的大数据时代,从而能够用我们的一种办法,去实现对数据的使用。
信息化的核心就是数据
目前,包括美国在内,大数据问题也不能完全解决,中国也是一样的。只有解决了大数据问题,才能真正的让云计算、移动互联网落地。国家呼吁了多年云计算,也花了不少冤枉钱,除却政策、体制、机制问题外,还有一个问题就是没有办法解决数据分析这个根本问题。
信息化的核心就是数据。数据是信息化的部分表述,无论用了什么硬件,用什么手段,安装什么系统,里面窜动的永远是不变的数据。在信息化建设过程当中,只有将数据真正关联起来、关注数据、聚焦数据的时候,才是真正的懂得了信息化的实质。
在发展模式转型的过程中,尤其是制造业,产业结构需要升级,需要创新驱动。创新驱动要从底层基础材料等各方面出发,并把信息技术当中的数据量给挖掘出来,这时候才是全面的融合。
数据的实质和作用正在发生质变。任何生产、生活必须要具备几个因素:生产要素、劳动力、土地及自然资源。土地不言而喻;自然资源是指能源、矿产等;很多年前,有人曾经提出信息和技术也可以成为生产要素,未果。但在大数据时代,我们可以将数据定性为生产要素,它不仅是技术和信息的载体,还是其表现形式。比如,专利技术可以注册资金,其实就是一个文件,它的具体表现形式可能是专利、著作等方面。这样做了以后我们更能清楚的阐述当今科技的核心实质。将来人类大脑里的经验和知识都可以逐渐的转化为数据。别人采用你的经验,其实就是使用你经验当中的数据。
为什么目前所有媒体、政府、天使投资人、VC等都关注大数据?因为当一个新的生产要素加入到任何原有的生产方式的时候,就会对原有要素的比例、权重和质量的原有存在状态产生影响,并形成新的爆发式的增长,甚至是技术性和产业性的革命,进而促进人类文明的进步。
举例来说新要素对原有要素的影响,比如,近日在网上一直热炒的“马云和王健林口水战”,马云说做阿里巴巴根本目的还有一个就是要把地产价格拉下去。为什么阿里巴巴能打动地产价?原因就在于电商平台可以用数据的力量形成了一个虚拟的交易平台,使线下商品销量降低,这样一来门面租金减少,从而地价降低,房价下降,不能形成非常大的商业圈,商业地产价格也会下降。这就是利用数据在撼动原来的资本和土地要素。未来经过五年到十年的发展,总会有一天,很多的经营店会变成应用感受店,甚至还会有一些新的模式的出现。
如何发展大数据产业?
以前是各种传播公司和科技巨头如IBM、微软、甲骨文等控制着信息系统的发展方向,是他们在引导技术的发展。但随着云计算、大数据的发展,这种模式好像遇到了挑战。
那么如何发展大数据产业?大概有以下三个方面:众包、开源和长尾。
众包——集众人之力。现在能向IBM、甲骨文、EMC、微软发起挑战的都是通过众包的模式进行的。集众人之力,也称作“群狼战术”。因为单个的某个企业买不起IBM的服务器,买不起甲骨文的数据库,买不起EMC的存储,所以要做分布式、虚拟化的调度。
因为有这样一群人开始尝试,于是出现了开源。开源的概念其实源于原来的传统产业。有一个做化妆品的大企业聘请了大量的科研人员,研究各种配方,但后来发现这样做的产品成本会非常高,每个新出的化妆品价格必须在六百到八百美元左右,而且科研人员因研究任务复杂几乎被逼疯了。其中有一个化学工程师索性把他要研究的任务扔到网上了,许多志愿者开始研究这个东西,给他出各种的主意后又把结果反馈给他,这就是开源的由来。后来该企业的研究经费降低了20%左右。开源可以汇众人之智,降低成本。
长尾——享众人之功。长尾就是指原来龙头企业能占领60%、70%的市场份额,然后逐渐的被长尾现象所替代,即龙头企业占到30%左右的市场份额,剩下的被各个领域占领,各个方向的人一起分享。因为“群狼战术”,“狼”的筹码不能缺太多,“群狼”一起分享,这样效率就提高了。
大数据时代,建设智慧城市还会遇到很多问题,有一个问题就是以数据为生产要素的新一代信息化建设处处繁华似锦,但肯定不能一花一果。所以我建议:一定要做好顶层化的设计,整个的部门想做什么,先有一个大概的方向;第二是强制化,成熟一些了,马上就往前推进行;第三一定要市场化。市场化、强制化、顶层化才能形成创新驱动。
如何判断是否要进行数据驱动创新?
数据驱动建设信息化是有量化指标和架构的,有的东西能做,有的东西暂时不要做。从技术上看着都能实现,但是有的一踩就是地雷,有的就是结果。所以我认为有几个指标供参考,什么可以用数据驱动创新,什么不可以。
1.架构力度,是指某个产业单位时间内创造出来的生产总值。
2.基础约束度一定要小,不要受体制、机制、政策、资本的各种约束。如果政府在体制和机制上,没有形成突破,诸如国家统计局,从下面采集上来的数据就有很多的问题,掺沙和水,这时候让做大数据挖掘优化,挖出来的还是沙子和水,体制和机制都有问题的时候,没有办法挖,这是一个约束度的问题。
3.投资收益度,投的少,收的多,或者叫公益度。公益度指社会服务,诸如我们的社保、文化、教育、医疗。
4.市场接受数据的力度和敏感度。力度越粗,敏感度越敏锐的才有利。比如,你给他一堆甚至都带有错误信息的数据,他都愿意买的时候,这个就可以做;你给了他一个说全国中考的50万个重点要素,孩子们读完以后能涨20分,所有的家长都觉得是谎话,但是觉得能涨20分也行,这就是力度很粗糙,敏感度很高,这可以让你迅速的形成商业模式。
5.具体的实现和应用的速度要快,中国是发展中国家,速度一定要快,速度慢不仅不能追赶别人还会被落的更远。
6.用户群和地域区域覆盖一定要广。要能跨越行业门槛。在技术上不要总想挑战世界性的难题,只要挑战你的门槛,能跨越这个高度也是可以行的。
7.社会经济发展的支撑度。如果你跑到贵州一个乡里面搞智慧城镇,那他们的收入和需求,根本没办法支撑信息系统建设的成本。
8.行业的关联度、渗透度和应用维度。你做的数据产品服务除了关注你这个行业以外还要能为别的行业服务。关联度越高,成功的可能性越大。即使我选择错了,也能够转向调头。
9.原有行业规模竞争激烈的程度。行业的规模尽量大,竞争尽量的激烈,它正在转型期,需要这样一个创新的手段去推动。
如果用以上这些指标去衡量阿里巴巴、淘宝、facebook、推特,它们几乎完全满足。
CIO之家 www.ciozj.com 公众号:imciow