教你真正读懂数据

网友网络

在大数据大行其道的年代，几乎所有人淹没在数据的海洋里。马丁•克鲁贝克（Martin Klubeck）对数据追逐和草率跟风提出了忠告和建议，认为数据不过是冰山一角，对于IT企业来说，真正需要的，其实是“shine a light on data”。量化（Metrics），为IT企业利用数据提升业绩提供了绝佳的机会。

量化管理，是指以数字为基础，用数学的方法来考察和研究事物的运动状态和性能，以求对事物存在和发展的规模、程度等做出精确的数字描述和科学控制，实行标准化操作的管理模式。

哈佛量化社会科学研究所主任Gary King说：“我们的确正在起航。不过，在庞大的新数据来源的支持下，量化的前进步伐将会踏遍学术、商业和政府领域。没有一个领域不被触及。”

量化分析作为强大的改进工具，其价值根源来自于它天生就具备的沟通促进能力。它能激发客户和服务提供者之间的对话、员工和管理者之间的对话，这些对话应该围绕改善机会和数据异常展开。对话的基础应该是量化分析所提供的调研、分析和对指示器的解释。

量化分析结果应该是调研、讨论的催化剂，之后才是行动。对量化分析结果唯一正确的反应就是展开调研。

事实并非真相

如果在网上搜索我们所了解的那些真相（当然要有数据支持），会发现很多网站上都有“揭穿”过去以及现在那些神话的证据。公认的事实最终却被证明为是对理论的不当应用或对数据的误读。

较早前有个健康信息的例子，过去人们深信不疑的真理却与现在的认知完全相反。十年前觉得挺健康的食品现在却发现根本不是，或者以前觉得不好的食品现在却被认为非常健康。鸡蛋有没有好处？这既和食用者有关，也和时间有关。

美国政府的“食品金字塔”会定期调整。
谁还记得洛奇（Rocky）把生鸡蛋灌进自己嘴里的场景？
看起来我们每年都要遵守一个新的“饮食规定”——高蛋白，高胆固醇，低脂肪，白肉，或者鱼……过段时间就会有争论。
我们经常从过去的事实中发现新的真相，关于这种现象，有个说法很好：事实不会改变，改变的只是我们对事实的解释。

下面快速浏览一下这个可能不是真相的事实吧。

这是关于亚马逊书籍销售排行榜的。迈克·兰索恩，我们曾经一起写过一本书，他喜欢在亚马逊上看销售评级。他对这个数据非常着迷，心情会随着数值变化而改变。可问题是评级每天都在变化，不止和书的销量有关，还和其他书籍的销量相关，而且这个销量仅仅统计买家下单的数量。如果一个订单买了1000本，亚马逊只会在评级上加1。可如果分1000次下单，那统计销量就加1000，对评级的影响非常大。亚马逊也不关心是谁买的书。我自己去买也会提升评级，不考虑我是不是带着偏见购买的。

太简单了。尽管数据是“准确的”（或者至少你可以肯定它们是准确的），但对数据的解释可能会有问题。迈克应该因为书的日益普及而预计书会大卖，所以去买个新电视吗？如果评级急剧下降，他应该因为购者寥寥而抑郁吗？

对于这两个问题，答案很明显都是否定的。

这个量化结果明显被误作为事实了，实际上它只向受众传达了部分信息。

拿到量化分析结果的第一个恰当的反应就是展开调研。
量化分析结果不是事实，这在前面已经说过了。如果把它们当成事实，那就太高看它们了。如果领导层决定用量化“驱动”决策，那很危险。这超出了量化分析的能力范围，把量化分析结果视同真相是浮于表面。做出的决策和行动也会因为信息不是100%准确而蕴含风险。

量化分析结果不是事实，只是指示器。
如果把量化分析推上神坛（给指示器披上真相的外衣），就是在鼓励舍本逐末，鼓励“追逐数据”，而不是基于根本问题设计能找出答案的量化分析体系。这也向员工发送了一个完全错误却清晰无比的信号，量化结果最重要。最终就会变成试图用数字、百分比、图形和图表去操控员工的行为。

最简单的例子是客户满意度调查，即便是在焦点小组访谈中直接得到的反馈，采用时也要持怀疑态度。哪怕看到的是真正客观的数据，也有可能解释错误。客观评测工具产生的数据也可能因为软件缺陷而存在错误。

大多数时候，优秀的管理者（也包括好员工和好顾客）不依靠数据就能了解真相。如果数据与直觉不符，或者数据太合胃口，都应该进行调研。

用我推荐的方法构建量化分析体系，最大的好处是它能用完整的故事回答根本问题。如果量化分析体系搭建得好，那它可能准确而又全面，最接近事实真相。但是，照我以往的经验，不管如何努力，也不可能彻底消除错误和误解的生存空间。稍稍驻足审视一番没坏处，还可能非常有帮助。

量化分析也会犯错

因为任何数据采集方法都可能存在变数和错误，所以任何指标的整体有效性都值得怀疑。如果对信息所传达的内容不加辨别地全盘接受，那可能不定什么时候就被引入歧途。假设你车里的引擎检查灯亮了，恰好又是一辆新车。即使知道它是个故障指示器，也不应该急着下结论。去4S店检查引擎检查灯的时候，我最喜欢听到的就是检修师傅说唯一的问题就是引擎检查灯的问题。

你可能觉得用油量指示器举例更好。如果油表的指针接近空值，警示灯也亮了，你会觉得该加油了。但油表仅仅是指示器而已。它可能比引擎检查灯可靠，但也只是更可靠的指示器而已。除了各种因素外（我发现在山上的时候，本来快要归零的油表会指示油箱里还有八分之一的油），油表还可能被卡住，或者干脆坏掉。

我能理解你对油表、温度计或者电子表这些个别指标的信任。但看到量化分析报告时，里面充满了各种数据、指标和信息，我希望你能以适度谦卑的心态看待自己解读量化分析报告的能力。

这种适度谦卑让我们不急着下结论，也不会仅仅根据指示器（量化分析报告）做出决定。

量化分析是工具，是一个指示器，它并不是答案，而且可能会有多种解释。

我听人说过（太多次了）量化分析应该“驱动”决策。但我的态度和信念更倾向于量化分析应该为决策“注入活力”。

无论如何粉饰，量化分析结果也仅仅是指示器，所以第一反应只能是调研。

当然，有些量化指标非常简单，可以不经调查就接受（比如车上的油表），但即使是这种情况，也应该保持警惕，时刻提防被数据误导或得到错误数据。

最后，即便对数据（比如前面的运动统计数据）的准确性有百分百的把握，还是必须把它当成指示器。数据不能预测未来，如果可以，还踢什么比赛啊。

量化分析结果不应被看做事实，它只能表明当前和过去的状况。如果使用得当，量化分析应该能引导会话，帮我们集中注意力，走向正确的方向。量化分析不提供答案，它帮我们提出正确的问题，采取正确的行动。

指示器：定性数据与定量数据

定性数据与定量数据的区别在于，定性数据是由观点和意见组成的，定量数据是由客观数字组成的。人们可能更容易将定性数据看做指示器，而定量数据会不经任何必要的深入调研就被误认为事实。下面来看下这两大类指示器。

定性数据

客户满意度是观点——一个表示客户满意程度的定性指标。大多数定性数据采集工具都是由调查和访谈组成的。它们可能有开放式问题、多选题或评级。只要不涉及“数字”，观察也可能是定性的，而观察棒球比赛中的击球次数或与产品线相关的数字问题等则不是。当通过观察获得观察者的观点时，得到的是定性数据。

根本问题经常要用定性数据来解答。客户满意度就是这样，类似情况还有以下几种。

员工满意度如何？
顾客更喜欢哪种产品，正规的还是精简的？
最快什么时候要？
顾客肯掏多少钱购买产品或服务？
顾客希望产品或服务可以在什么时候或者几点到几点得到？
员工觉得领导欣赏自己吗？
不管采集方式如何，这些数据都是主观数据，不可能变成客观数据，甚至大多数都不能用数字表示。定性数据可以用更量化的形式表示，比如将观点转换成李克特量表值。但它们仍然是观点，尽管看起来像定量数据，但它们不是。

某些分析师，特别是某些认为客户就是上帝的分析师，认为定性数据是最好的数据。这些分析师相信通过开放式问题可以得到非常有价值的反馈，能充分了解业务流程、产品和服务。既然客户就是上帝，还有什么分析方法能比得到客户对产品和服务的观点更好的呢？

这些分析师喜欢组织专题小组和访谈。调查用来应急足够，但没办法通过调查得到非文字信息，也看不出其他迹象，而这些对于找出问题（“客户满意度怎么样？”）的答案都很有价值。

马库斯·白金汉（Marcus Buckingham）和柯特·科夫曼（Curt Coffman）写的《首先，打破一切常规》（First, Break All the Rules）（Simon & Schuster，1999）。这本书是基于作者对定性数据的分析写的。它在评论中向读者承诺可以“看透”成功的管理者和成功公司领导的“思想”。本书取得了极大成功，由此可见现今社会对定性指标的重视程度。

定量数据

定量数据通常就是指数字——不带感情色彩的客观指标。汽车上的所有仪表盘都是，还有从自动化系统采集的信息，比如自动应答器中记录的应答次数、呼叫等待时间、呼叫占用时间等。

经常会有人争论，说这种形式的数据比那种好。之所以说定量数据更好是因为它不受感情色彩影响，能够避免前后矛盾，但并不能说明定量数据就比定性数据好。定量阵营的兄弟们可能会说，人们给产品满意度的评级会受很多因素影响，而不是单纯地考察产品质量。在对服务或产品进行定性评估时需要考虑的因素包括：

提问的时间，上午、下午、晚上……
提问之前受访者的情绪如何
受访者对相似产品或服务的既往经验
房间的温度
光线
提问者的个人魅力
访谈者是否有外地口音
这个列表还能继续。定量数据不需要考虑这么多变化因素，可以直奔主题，得到具体数值。同样情景的例子可能包括以下几种。

购买产品的顾客数量
同一顾客购买产品的次数
顾客购买产品支付的金额
顾客购买的其他产品
被退回的产品数量
定量信息的支持者会说这些数据更可靠，所以更有意义。

我相信你肯定猜出来了，哪个阵营都不完全正确。我建议同时采用这两类数据。

定性数据与定量数据

大多数情况下，定性数据的缺陷可以通过引入一些定量数据来弥补，反之亦然。单独考虑定性数据，很难让人信服，因为信息的影响因素太多了。如果有个顾客说喜欢你的产品或服务，但从来没买过，这些暖心窝子的正面反馈对公司的业务发展起不到什么作用，而销售量和重复购买率这样的定量数据可以支撑这些定性反馈。

如果只看定量数据，所做的决定可能也会很不明智。比如测试产品的全部库存在一天内售罄，那我们可能就会认为这个产品很火，自然希望能卖得更多。如果没有得到定性数据的支持就做出这个假设，可能就会投入大笔资金开始大规模生产。定性问题能搞清楚该产品迅速卖完的原因。可能马上就会发现这种成功不可能再现了，因此在开足马力生产之前需要做更多的研发工作。比如有个迷迷糊糊的顾客被派来买大量的某种产品，但却阴错阳差地选了测试产品。还有可能大多数顾客购买它是因为产品外观新颖，但当问及使用感受时，他们都保证肯定不会再买这种东西了，即他们发现自己不喜欢这个产品。

不仅应该同时使用两种数据（当然也包括两种数据采集方式），而且每种数据都应该采集多份。采集完之后也要对结果进行调查。

你可能觉得定性指标能更明白地表明状况。在问一位顾客对产品是否满意时，即便她非常肯定地回答“是的”，也不能断定她真的非常满意，从她的回答中唯一可以肯定的“事实”是：她说她满意。

即便是自动应答软件采集的数据，也仅仅是指示器。

定量数据，虽然客观，也仍然仅仅是指示器。如果不知道数值出现的原因，那就只能猜。猜原因，就是在猜答案。

量化分析结果（指示器）需要解释得当。
对于任何根本问题，都鼓励使用三角交叉法来提高答案的完整性和可读性。这样就不会单独使用定性数据或定量数据。完全没必要争论哪个好，两种都应该来一点。

记住下面的原则：

量化分析结果仅仅是指示器。
量化分析结果不是事实。无论对准确性多有信心，都不要把它上升到真相的高度。
面对量化分析结果，唯一正确的做法就是展开调查。
通过增加文字叙述进行描述，是在解释量化分析结果表明了什么，就可以更好地决策，找出改善机会，或确定优化过程。
指标分为两大类：定性指标与定量指标。定性指标本质上是主观的，并且通常表明了某种观点。定量指标本质上是客观的，并且是由自动化的、公平的工具产生的。
量化分析本身不提供答案，它帮我们提出正确的问题，让我们采取正确的行动。
量化分析结果要经过解释才能发挥作用。
观众对解释还会进行解释，因此，量化分析结果不能给出真相，它们只能提供洞察力。

结论

量化分析结果仅仅是指示器，这不是说它们没有根据或不准确。即便是最客观、准确和有确实根据的量化分析结果也应该仅仅当做指示器对待。从加入空军开始，我就知道“认知即现实”。量化分析也是如此。我之所以坚持要给所有的图形、图表和表格配上文字说明，就是想限制观众在理解量化分析时自由发挥。量化分析结果的解释权不应该交给观众，这应该是你的工作，要尽职尽责地调研量化分析结果所表明的内容。应该依据对数据的调研结果，经过深思熟虑得出结论，然后把这些内容放在量化分析结果的解释中。

然后要竭尽全力地向受众兜售你对量化分析的解释。即便如此，也必须明白你的解释会被看客们再次解释。必须接受精心定义的完整描述最终也只是个指示器。它应该是精心解释过的指示器，每个特征都配以正确的解读。但它仅仅是指示器，所以要适度谦卑。

记住，量化分析仅仅是个工具。不要期望过高。

作者马丁·克鲁贝克（Martin Klubeck）圣母大学的一位战略规划顾问，实用量化分析领域的知名专家。拥有韦伯斯特大学人力资源发展硕士学位和查普曼大学的计算机科学学士学位。他是《组织改进为什么事倍功半》的合著者，在量化分析方面也发表了很多文章。怀着把复杂的问题变简单的热情，他研发出了一套简单的系统，用来开发有意义的量化分析体系。另外，他还是信息技术绩效标准构建联盟的奠基人，这个非盈利组织专注于提供业界亟需的指标标准。

本文节选自《量化：大数据时代的企业管理》一书。Martin Klubeck著，吴海星译

CIO之家 www.ciozj.com 公众号:imciow

关联的文档

也许您喜欢

hive udf开发超详细手把手教程
CSDN博客网友
大数据时代的营销大谜题
福布斯中文网 Christine Moorman
ETL在BI项目中的作用
soft.chinabyte.com zhouljsh
中小企业的大数据技术路线选择
CSDN 山水佳音
当电影碰到大数据：该怎么玩
----- 张梦依
从信息化改造到数字化转型，中国企业行至何处？
智慧云陈雪频