我们离真正理解大数据还有多远
Beata 网络大数据

一般大众中,大多数人(包括企业管理层)并不真正了解分析方法。要靠数据科学家们给他们上这节课。

上个月,前NBA球员,现电视篮球分析员查尔斯·巴克利说出了一些他对于分析的理解,颇为有力。休斯顿火箭队的经理DatrylMorey为人所知的一点就是,他的许多球员决策都是基于数据分析的,巴克利批评他这一点,说Morey是“相信分析的傻瓜之一”。

许多人对分析学作用的理解都和巴克利一样。波士顿的麻省理工Sloan体育分析会议上,ESPN体育中心的主播JohnAnderson多次申明表明他的观点,他相信分析学,他还“想改变人们的想法,让他们也相信。”

我并不知道数据分析竟然是一个可信可不信的东西。它已经存在了成千上百年,被证实了无数次,今天却仍然未成定论,想想就觉得奇怪。

但是这些评论人表达的意见,也反射出了公共对于数据分析的理解——几乎是需要人们相信的魔法——同时也映射出,数据科学家还有许多工作要做,才能改善公众对数据分析的理解。

来自管理层的疑问

不清楚状况的不止运动员。企业内的数据科学团队经常会表达他们的沮丧,因为他们的分析只被作为决策制定程序中的多个因素之一。管理层的决策并不是真正意义上数据导向的,决策还是遵从“薪资最高者的意见”。

不幸的是,一些主管们只要遇到一次数据分析失误,就会对它失去信心。但是失误是不可避免的。连最强的数据科学团队也不能保证100%正确。将决策制定基于数据,只是为了相比基于直觉,做出正确决策的几率更高。但是即使预测模型也只能达到75%的正确决策率,而如果是这剩下的25%的情况,它就会在整个公司面前信誉扫地。

管理层的支持是分析项目的关键,数据分析团队可以采用几种方法改善管理层对于分析的理解,如果顺利的话,争取支持。首先,他们需要改进自己交流研究结果的方式。他们应该试着解释数据为什么支持某一建议,而不应该单纯告诉决策制定者某个策略是正确的,因为数据显示如此。

二月份在拉斯维加斯召开的TDWI经理峰会上,Archipelago信息战略公司的经理合伙人Mike Lampa推荐聘请数据记者,记者需要理解分析概念,但是他/她主要需具备出色的交流能力。解释工作并不应该总落在数据科学家肩上。

公开数据参数

分析团队应当承认他们研究结果的局限性。经理们一开始就了解到模型具有可计量的失误可能,这样如果模型没有给出正确的建议,他就不会觉得那么失望。

承认数据集中的偏见和局限也非常重要。基本数据分析方法可能非常完善,但是这些因素会限制分析的有效性,且并不能始终做到对其进行讨论。解释清楚这种限制,能够帮助建立与经理的互信,以防发生分析失误。

当前数据科学家们要做到已经有很多了,但是也许是时候给他们的工作添上一条新条件了,那就是教育者。公众的大多数不能完全掌握数据分析是既成事实。不论喜欢与否,数据科学家都需要更加努力,确保让公众明白他们的工作价值所在。


CIO之家 www.ciozj.com 公众号:imciow
关联的文档
也许您喜欢