数据指标设计方法

来源：网易严选作者：九饼

数据指标,并不是数据分析和业务同学的专属模块。日常会用到数据指标的,还包括开发(比如机器资源利用率,选仓选配计算平均时长等),产品(自动罚款功能使用率,自动调拨推荐转换率等),以及测试、设计等。

精准的指标,能提供好的方向,明确目标,更好的指导工作。优秀指标解读思维,能让自己辨识重要度,抓住问题关键。以及系统的指标体系,能够全面完整的覆盖关注范围,以及精准快捷的定位问题。数据分析指标篇会分为三篇:指标设计、指标解读、指标体系建设,进行介绍和案例分析,帮助大家在这几个方面有更加深入的了解和提升。

指标的设计链路,可以从目的→设计→公式→口径&范围,每一步都需要跟使用场景强绑定。所以当面对不同的使用场景时,同一个指标可能有多套口径的情况。比如说客诉率,我们考核的时候,会考核一年的情况,但是日常观察,会只观察一周或者一天,同时需要保证客诉的订单和购买的订单是用一波订单,解决时间错位的问题。

因此,我们在对指标设计时,需要时刻注意指标的定位是否清晰,以及是否在所使用场景下是逻辑合理的。以下我们来详细讲述一下指标设计过程中每一块需要注意的事项。

目的

任何指标都有存在的目的。我们可以通过实际的目的,去设计对应的指标的计算方式。

从业务视角,往往都可以分为几个大的类,比如供应链业务中的三个主要模块:成本类,时效类,体验类,以及前端商品营销关注的用户类,流量类,商品类,营收类等等。

从计算视角,【量指标】的目的,是反应的是实际的规模、量级,比如活跃用户数,GMV,履约成本;【比值指标】则是反馈单位效能,如库转、arpu;【比率指标】则是更多用于评估占比情况,如毛利率、退货率、流量转换率等。

设计

一个好的指标设计,需要有明确的指向性,也就是目的性明确,能指导使用方的效率、收益、质量等。

举例1:缺货率。

对于实际生产或者汇报,这个值就是越低越好,因为不缺货,我的GMV就不受影响

举例2:GMV。

越高越好,这个就不用多解释了。

反面例子:

举例3:仓内生产人数。

当这个指标值很大,可能存在人力成本浪费;如果值很小呢,又可能会造成生产进度达不成。

改进方法:①结合其他的指标一起,形成一套指标体系,比如加上仓内生产准时率,期望人数等;②直接看人均产能。

这类指标表现出来的问题在于,数据的大小或者多少,并不能真实的给出好坏优劣的判断。

公式

到公式阶段,就需要对指标的具体计算逻辑有很明确清晰的思考了。指标的公式,尤其是不常见的指标,对设计者的要求其实是很高的。经常看到经验很丰富的业务方,在指标的公式上面犯错误。以下跟大家分享两个比较常见的坑。

坑1:计算【库转】,库存是用平均值,or截面值?

库转最原始的公式,库转(成本)=库存成本/销售成本。业务角度来讲,我们希望库转这个指标作出的指导是,看下当前的库存能售卖多少天?因此,为了让指标能更科学,分母部分的销售成本,我们使用的是最近30天的平均销售成本,目的是能更好的的平均掉促销活动带来的销量波动。

那么分子部分的库存成本呢,也用平均值么?其实不然,如果是想反馈当前的库存,多少天能销售光,那么历史的库存信息,是并不需要关心的,所以分子部分,使用的是截面库存成本值。

指标具体每一部分的计算逻辑,需要结合指标本身所想表达的意义去做公式设计,跟业务运作的逻辑强相关。

坑2:计算【客诉率】,分子分母会有时间差,那么是否需要去掉时间差?

跟时间链路有关的指标,往往都会有时间差。很容易出现研究的不是同一拨对象的问题,指标的解释性差。我们以客诉率为例,客诉率=客诉单量/支付单量,这里要讨论的问题就是,假如取11月11日的客诉率,客诉单量在11月11日会有发生,支付单量在11月11日也有发生,如果两者直接相除,可以得到一个值。

但是11月11日发生的客诉单,并不一定是在11月11日支付的,可能是11月10号,9号,8号,甚至更早之前。因此分子和分母研究的订单并不是同一拨。以及会出现客诉量跟以前差不多,但是支付订单量在双11期间会有一个比较大的涨幅,在这一天整体的客诉率会有一个比较明显的下降,然后再后一段时间,比如11月15号,用户陆续收到货了,双11期间的订单客诉起来了,但是对应的分母部分订单量回到了正常水平,导致了客诉率变得特别高,从而形成了如下图的变化趋势。

这种由于计算方式的问题导致的指标波动,不利于我们通过这个指标去分析问题和定位问题。