现在的大数据的后面是个大冰川,海平面上的普通人一般能看见,海平面以下是专业人士能看见的。Linkedin内部大约有起码20种不同的数据库,就是完全不同的技术的数据库,还不包括同样一种数据库有不同的应用。但实际上我们真正的内部企业用户,包括Linkedin本身,需要的不是一个大冰川,需要的最后是冰激淋,就想把结果出来就行,他不需要大冰川。
怎么能做到这个冰淇淋呢?咱们讲讲数据分析的变革。基本大数据分析的三个原则,这个基本的原则是我大约加入Linkedin9个月以后我们决定下来的。我们如果要做一件最重要的事的话,那个事需要有三个属性:
第一个简单,他出来的结果必须要非常非常简单,没有任何花哨的东西,任何人都能够看明白看懂。
第二个迅速,就是刚才说的速度的问题,越慢结束度越低,越快接受度越高。当然在Linkedin使用的是蓝图法则,3秒钟的法则。
第三就是要规模化,规模化各这的角度来说,我们当时思考的方法是这样的,希望Linkedin内部所有的员工每一个人都能够用数据来分析帮他们做决策,很快的做决策。
怎么做到这一点?
第一步,我们需要建立一个真正的金字塔。分析师不应该从数据开始,他必须要从客户、产品、市场、销售开始,也就是说明白公司怎么能做到这件事。他必须要明白如何在这种层面标记未来的事物,标记比数据本身重要得多。分析师本身要分析自己以后要分析什么,这样才能把正确标记加到数据库里面去。他还必须要明白,数据库之间的公用,流程,每种数据是怎么分工的。
下面就干活了。在Linkedin有一个不成文的共识,你做的东西不仅仅是有趣是不够的,必须要注重执行性。我分析到这个结果以后到底能做什么,这是很重要的。说完了做以后咱们就走到决策,决策本身一定要实现增加商业的价值,或为团队增加价值。
第二步是规模化。需要用科技来把金字塔变成一个非常小的底,而大的中心,最小的一个尖的一个过程。举个例子,Linkedin我待的九个月之内和另外一个同事合作,完成了500个不同的需求项目和模型,但是当年我们其实直接支持两百个人,500÷200,每年我才回答2.5个问题,这绝对是非数据驱动。后来我们决定是把整个做一个系统,来模拟以前我们两做的大部分工作,这个系统响应3秒钟,简单的规模化了,大概花了三个月,五个人,在内部支持销售的,在今天为止每天这个系统可以服务1000个销售员工,大约用这个系统十次,用一次大约时间是3秒到一分钟,这个系统一天就能做到以前我们两个人做不到的事情,这就是一个规模化的结果。当年出来结果是我们销售增长了175个百分点。
第三步,产品化。内部的东西大致做到OK了,就要把内部积累的这些实践、经验和产品和规模化的东西,要做到网站上去,要进来大量自然的用户、企业的用户,比如说我们前面讲的那个支持内部销售的分析系统,在去年Linkedin就对外开始了一个新的业务,用数据帮助全世界所有的销售人员变得更有效率。
第四阶段,不断的开发新的数据产品。我们发现了第一个数据产品后,做第二个就非常容易了,然后第二个产品会利用第一个产品的结果,第三个又用第二个结果,结果造成了数据产品内部的网络化、矩阵化,推动人与人之间的交流、互动、合作。这就是下一步我们准备要做的,就是把所有的产品关联起来,让它们互相提供价值。实际上这都是建立在一个平台上面的,数据是一致的,产品是多样性的,服务的对象既是同一个人又是一个同样一个人不同的面,比方说,作为一个父亲来说需要为我的孩子花钱上学,我作为上班族来说我需要买汽车上班,所以人的需求是不同的,做同样的产品挖掘不同的数据。
本文根据美国LinkedIn公司的数据分析部资深总监Simon Zhang在3月7日的阿里巴巴西湖品学大数据峰会的演讲整理而成
CIO之家 www.ciozj.com 公众号:imciow