在今年两会上,小米董事长雷军建议,迫切需要从国家层面上制定大数据发展规划。以往大数据的探讨多停留在行业圈,如今提升至两会议案将大数据层次的探讨又迈进了一大步。
维克托•迈尔•舍恩伯格在《大数据时代》中精髓的观点便是——可以将充斥世界的海量大数据采用数学算法予以“提纯”、钻取并随后或抽出规律,或处理成有用信息。或许更形象地采用“黑匣子”来表述大数据的意义——问题从一个端口进去,中间是一个集合成千上万数据的“黑匣子”,经过一番计算机工程后,答案从另一个端口出去。
按照这样的思路,倘若能将这项鸿篇巨制的工程上升至国家层面,那想必是极好的。在谈论雷军此次提出的中国梦之前,我们或许可以借鉴下美国的案例。事实上,早在2012年,美国政府就将“大数据战略”上升为国家战略。奥巴马政府曾宣布投资2亿美元拉动大数据相关产业发展,府方甚至将大数据定义为“未来的新石油”。
而美国,究竟从这桶新石油中挖到金子了么?有代表性的案例,拿去年底刚卸任的纽约市长布隆伯格举例好了。笔者认为,他最大的创新点是创造了美国历史上第一个在政府内创造出来的职位——“首席数字官”。这个职位的终极职责就是用大数据将纽约带入到真正的信息时代——比如可以收集建筑物发生火灾的频率、心脏病发作人数、上下班公交、地铁的高峰点人数对比,甚至当飓风桑迪袭击纽约时,人们就可以凭数据尽快知道哪里能顺利供应水电、加满油箱。
数据给纽约市府的日常运作带来颠覆性的意义:更透明。在纽约市政府的网站上,任何人都可下载数据并与他人分享;可度量。此前一些紧迫而复杂问题的方案可以通过挖掘那些未经处理的信息获得解决。更深远的意义在于意味着政府的转型,平民阶层因此与政府绑定地更紧密些。
之所以累赘式地唠叨了这么多,在于为大数据上升为中国国家层面时勾画了美好一面的蓝图。一大串纯粹性的理论陈述或许不如一组案例来得更具象一些。纽约呈现的一角场景或许中国大数据的未来。
当然,既然有优势当然有忧虑,抛却外界常讲的关于个人隐私泄露的后患外,笔者主要指的是操作和实现方面的难度。
在今年两会提及到大数据的不仅仅是雷军,还有李彦宏。李彦宏在会后回答记者问时提及了两点:一、政府部门有很多数据现在没有上网,认为没用;二、即使上网了,人们还没有建立这样的使用习惯。
这也是笔者认为摆在大数据上升为国家层面的最大障碍。说白了,中国社会还没有建立起类似实证主义的使用体系。大数据之所以能在美国上升为国家层面,原因是这个国家的确是有“用数据说话”的底蕴的。拿大家熟悉的传播学领域为例,早在上世纪中叶,传播学大家——拉扎斯菲尔德就知道如何用定量方法去研究传播效果的问题。
传播学是社会学的一个分支,在美国诞生实证主义研究之后,这门科学显然变成了“社会科学”。这种喜欢靠数据说话的传统,正是大数据起于美国、盛于美国的重要前提。
回头想想,中国可以么?至少在相关人文学科上,还没形成依靠数据说话、实证主义研究的大氛围,这个看看本、硕学生的毕业论文就大概有个了然。
中国人对数据的应用上还处于极度不自信阶段,缺乏政府机构的意识,也缺乏公民的推动。比如一项政策的出台,有时会陷入“朝令夕改”的尴尬境界,这归根于事先的调查不彻底,比如曾实行过的闯黄灯受罚的政策然后又暂缓实行。如果事先有一组数据来证明闯黄灯与出现交通事故的概率有多大,或许就可以直接实现“非常明朗”的政策,少走些弯路。所以在将大数据上升至国家层面上时,必须首先培养整个社会对使用数据的自信。
当然,中国在大数据方面也存在很多优势的,在数据源的采集上,各种硬件、软件、软硬结合的智能硬件等设备在国内发展如火如荼;在应用平台方面,电子商务网站的交易额,阿里已经超过Amazon。倘若能将这些大数据有效利用起来,该是一座多么大的金矿!
【本文作者为智能硬件从业者、PICOOC联合创始人】
CIO之家 www.ciozj.com 公众号:imciow