从阿里浪看大数据的层级关系
唐学鹏 商评网

由于这个消息,还是让同事发出了疑问:是不是唱衰微博应该止步了,阿里浪一起对付腾讯,微博开始比微信要更有价值了?

因为这是两种最有前途的大数据公司的强强联合。

我想用自己的角度来重新阐释它。

现在很多人言必称大数据,其实对数据的理解非常粗糙。数据背后反映的是人类的行为,但人类的行为是有差异和层级的。为什么我要用层级这个词,我后面会做解释,所以当很多小年轻夸夸其谈“源头大数据”公司的代表,比如亚马逊、谷歌或者推特、facebook,他们就是一锅端的概念,他们其实并不清楚这些“数据公司”之间的数据是不同的(至于云储存的IBM、亚马逊,或者数据分析类的公司则会做另外一些分析),就像不同的矿一样,有的是很轻易提炼出人的行为偏好、认知特征,是富矿。有的是很难提炼出人的行为偏好,人的行动逻辑,就像贫矿,很难。

以下就是我对互联网行为的层级分类。

1,微博行为。发微博(twitter)就是一种随意放纵式的漫谈,没有任何固定的或者在当下感到紧迫的目标。从微博中很难发现那些紧迫的需求,以及稳定的偏好。在中国,新浪微博市场已经变成了话语竞争市场,更多地收敛到公知那里,他们垄断了相当部分。

2,搜索行为。打开搜索框,关键词至少代表自己当时最感兴趣的东西,哲学上称之为“可欲”,它比漫谈要更聚焦也更迫切。它至少代表着——用经济学家米塞斯的话说——一种真实的可度量的感觉。

3,淘宝行为。当一个人敢于(请注意:“敢于”这个词)用真金白银去换取某个物品的时候,物品的各种性质反映着该人在这个时点上的所有意图和欲望,在经济学意义上,购买行为产生“消费者剩余”,而“消费者剩余”意味着这一切是值得的。

4,金融行为。当一个人将自己的财富从一个地方转移到另外一个地方,或者一个企业将自己的大量资金出借给另外一家企业,等等。它的行为含义更丰富也更确定。

……

这些行为都会产生页面点击,都会产生大数据。于是,大数据也变得有层级。

我用一个简单的故事来勾勒一下数据的递进。

去年冬天的时候,我在微博上看到“电火桶”一词,就好比我在小区里面听一群人闲坐着聊到“电火桶”。火桶是没有暖气的南方人熬过冬天的必备物,小时候是炭烧火桶,烟熏火燎。但是,在没有刷这个微博前,我是不知道电火桶的。现在我听到了这个词,我就插话(发了一条微博)“好用吗?”,得到的回复是,相当好用哦。

我怀着将信将疑的心情,打开搜索框搜索了“电火桶”,明白了它是什么样的,工作机理,炭烧换成了电热片……

我思索了一下,该不该买呢,价位如何?于是我打开了淘宝,寻找这个很火的桶。看价格看销量看评价……如果一切OK的话,我会拍下。

这是一个行为的递进,我的行为意图变得越来越清晰化的过程。从漫谈了解(微博)到兴趣诱致(搜索)到实际购买(淘宝)。

我再打个比方说,你说你喜欢苹果超过桔子,这是微博,姑妄听之;你去搜索苹果,这是百度,相信你有意思;但最终你在淘宝上买的竟然是桔子而不是苹果,用伟大的经济学家贝克尔的话说,“购买才能确定真实偏好排序”,这暴露出其实你最爱的是桔子而不是苹果,前面的都是假的,就像那句著名的谚语:“看一个人做什么而不是听他说什么。”

在《大数据》一书里面,维克托喜欢用两个故事,一个是谷歌根据搜索量提前发现疾病疫情。另外一个是百货公司给未成年少女寄孕妇产品目录。后者我没有什么意见,因为购买反映的是真实偏好的流露,购买行为的数据化是清晰的、富矿型、易辨认的。而谷歌的疫情发现我则要多嘴几句。

就在2年前,印度发生了一次大流感。但是根据当地谷歌的搜索显示,“流感”搜索量最多的时候,并不是当地流感爆发加速的时候。因为这场流感是从乡村开始的,然后传到城市的。流感最厉害的时候感染了很多乡村的人,但是这些人很少上网,所以在谷歌上体现不出来。随后,城市开始流行,这时候农村已经衰减了,整体上流感已经趋于下坡路了,但印度的城市互联网很发达,很多人开始在网络上疯狂地搜索,造成了不断加速的搜索量,给人以疫情加剧的感觉。实际上,流感正在减弱。

这个故事说明了什么?大数据只有在第3级的表现是超常稳定的,而在第1级是很难提炼的,在第2级是有参考价值的。所以,我一直不看好推特和facebook的独立价值。

人类行为是有排序和层级关系的,于是它决定着所谓“大数据矿”的提炼。推特和微博为什么很苦、独立的商业模式很难?漫谈信息作为大数据提炼,矿的成色太差,太费功夫。

谷歌的搜索信息好一些,“可欲”至少意味着聚焦,所以谷歌推送“关键词广告”。

亚马逊、阿里的数据成色是更好,买代表着真实偏好的流露。

当然,最好的数据是银行的财富转移数据、大借贷数据。它代表着更高的价值。从这个意义上说,阿里改变银行业是一种胡吹。它赚的还是屌丝的钱,而不是财富行为的钱。

回到“阿里浪”,微博可以给阿里导流量做推荐,漫谈数据变成真实偏好数据,同时,阿里反过来也可以让购买的议论在微博上扩散。很显然,漫谈数据代表的社交媒体是可以在电商那里获得价值的,因为做了提升。从第1层级提升到第3层级。而电商则通过“SNS”化诱导了更多的真实购买需求。相当于买了一个电火桶之后,回到微博上嚷嚷,“这东西真他妈好,快来看啊。”

好了,回到我们的微信上。微信一直以社交网络自许,意思是社交媒体微博是一个教训,对媒体属性进行有意的一刀切的限制。微信一是拷贝QQ的游戏经验,二是跟一些企业做尝试性合作,比如支付。现在有了“阿里浪”,微信应该考虑到微信上4亿多用户量的媒体属性也是有非常巨大价值,它也可以导入到某个可变现的地方。微信不应该预设禁区,不要太张小龙。

*最后,请关注我们的微信,它是建立在职场人“一周情绪维度”的基础上推送。

微斯人,吾谁与归。它就像咖啡馆里的老友那样等着你。

CIO之家 www.ciozj.com 公众号:imciow
关联的文档
也许您喜欢