数据指标设计方法

来源:网易严选 作者:九饼

数据指标,并不是数据分析和业务同学的专属模块。日常会用到数据指标的,还包括开发(比如机器资源利用率,选仓选配计算平均时长等),产品(自动罚款功能使用率,自动调拨推荐转换率等),以及测试、设计等。


精准的指标,能提供好的方向,明确目标,更好的指导工作。优秀指标解读思维,能让自己辨识重要度,抓住问题关键。以及系统的指标体系,能够全面完整的覆盖关注范围,以及精准快捷的定位问题。数据分析指标篇会分为三篇:指标设计、指标解读、指标体系建设,进行介绍和案例分析,帮助大家在这几个方面有更加深入的了解和提升。

指标的设计链路,可以从目的→设计→公式→口径&范围,每一步都需要跟使用场景强绑定。所以当面对不同的使用场景时,同一个指标可能有多套口径的情况。比如说客诉率,我们考核的时候,会考核一年的情况,但是日常观察,会只观察一周或者一天,同时需要保证客诉的订单和购买的订单是用一波订单,解决时间错位的问题。

因此,我们在对指标设计时,需要时刻注意指标的定位是否清晰,以及是否在所使用场景下是逻辑合理的。以下我们来详细讲述一下指标设计过程中每一块需要注意的事项。


1

目的

任何指标都有存在的目的。我们可以通过实际的目的,去设计对应的指标的计算方式。

从业务视角,往往都可以分为几个大的类,比如供应链业务中的三个主要模块:成本类,时效类,体验类,以及前端商品营销关注的用户类,流量类,商品类,营收类等等。

从计算视角,【量指标】的目的,是反应的是实际的规模、量级,比如活跃用户数,GMV,履约成本;【比值指标】则是反馈单位效能,如库转、arpu;【比率指标】则是更多用于评估占比情况,如毛利率、退货率、流量转换率等。


2

设计


一个好的指标设计,需要有明确的指向性,也就是目的性明确,能指导使用方的效率、收益、质量等。


举例1:缺货率。

对于实际生产或者汇报,这个值就是越低越好,因为不缺货,我的GMV就不受影响

举例2:GMV。

越高越好,这个就不用多解释了。


反面例子:


举例3:仓内生产人数。

当这个指标值很大,可能存在人力成本浪费;如果值很小呢,又可能会造成生产进度达不成。

改进方法:①结合其他的指标一起,形成一套指标体系,比如加上仓内生产准时率,期望人数等;②直接看人均产能。


这类指标表现出来的问题在于,数据的大小或者多少,并不能真实的给出好坏优劣的判断。


3

公式


到公式阶段,就需要对指标的具体计算逻辑有很明确清晰的思考了。指标的公式,尤其是不常见的指标,对设计者的要求其实是很高的。经常看到经验很丰富的业务方,在指标的公式上面犯错误。以下跟大家分享两个比较常见的坑。


坑1:计算【库转】,库存是用平均值,or截面值?

库转最原始的公式,库转(成本)=库存成本/销售成本。业务角度来讲,我们希望库转这个指标作出的指导是,看下当前的库存能售卖多少天?因此,为了让指标能更科学,分母部分的销售成本,我们使用的是最近30天的平均销售成本,目的是能更好的的平均掉促销活动带来的销量波动。

那么分子部分的库存成本呢,也用平均值么?其实不然,如果是想反馈当前的库存,多少天能销售光,那么历史的库存信息,是并不需要关心的,所以分子部分,使用的是截面库存成本值。


指标具体每一部分的计算逻辑,需要结合指标本身所想表达的意义去做公式设计,跟业务运作的逻辑强相关。


坑2:计算【客诉率】,分子分母会有时间差,那么是否需要去掉时间差?

跟时间链路有关的指标,往往都会有时间差。很容易出现研究的不是同一拨对象的问题,指标的解释性差。我们以客诉率为例,客诉率=客诉单量/支付单量,这里要讨论的问题就是,假如取11月11日的客诉率,客诉单量在11月11日会有发生,支付单量在11月11日也有发生,如果两者直接相除,可以得到一个值。

但是11月11日发生的客诉单,并不一定是在11月11日支付的,可能是11月10号,9号,8号,甚至更早之前。因此分子和分母研究的订单并不是同一拨。以及会出现客诉量跟以前差不多,但是支付订单量在双11期间会有一个比较大的涨幅,在这一天整体的客诉率会有一个比较明显的下降,然后再后一段时间,比如11月15号,用户陆续收到货了,双11期间的订单客诉起来了,但是对应的分母部分订单量回到了正常水平,导致了客诉率变得特别高,从而形成了如下图的变化趋势。

这种由于计算方式的问题导致的指标波动,不利于我们通过这个指标去分析问题和定位问题。


image.png

当然这个指标也有弊端,就是滞后性。我们只能看到7天前的情况,最近的表现就无法获得了。


4

口径&范围


日常的业务沟通过程中,经常出现同样的指标,你说是A结果,我说的是B结果,这种情况一般都是互相之间没有对指标的口径或者范围对齐。

比如商品成本,可能一部分人说的是含税商品成本,另外一部分人说的是不含税;再比如单量,不同的部门会分别默认是订单量,出库单量,以及运单量,售后单量等。基于这些异常场景的考虑,我们需要根据指标的实际使用逻辑,给出详细的口径和范围的注释。

我们也可以在指标命名上,可以更细致,比如说,不含税商品成本,2c订单量,主站付费用户数,等等。以及范围,我们有时候需要详细的给出包含的信息有哪些,比如履约成本,包含内仓和外仓的,不含海外的,不含品控费用,等等。

所以当一个指标有较大范围的交流使用时,我们需要从指标命名上进行规范,最好沉淀一份指标使用白皮书,对口径和范围进行收口,统一管理以及公示。

这一点行业内是怎么做的?这里可以参考一下阿里oneDate的标准规范,用在严选可以这么来解释。

image.png

这种方式的实现,需要先进行指标命名的规范,使用的规范,进行全员的宣导和培训,统一使用习惯,教育成本较高。


5

总结


当前各行各业对于数据的依赖程度越来越高,而数据指标可以说是数据使用的元件,是把数据用活的第一步。严选所处的电商行业,算是复杂度最高的行业之一(相比我以前所处的游戏行业要复杂得多)。

在高复杂度的业务场景下,每一个人都有机会经历从简单到复杂的成长历程,以及任何一个阶段最核心的,都需要去深入的体验业务,摸透业务流程。最后就是,数据指标的设计,要带有目的性,让指标活过来,让使用者/观察者感受到指标的生命力。

相关文档推荐

DeepSeek政务应用场景与解决方案.PDF

1742949439  3.03MB 34页 积分6

2024年中国营销行业AI应用发展研究报告.PDF

1742803952  2.8MB 29页 积分4

AI落地应用最新工具集.PDF

1742450890  1.7MB 8页 积分4

DeepSeek提示词设计、幻觉避免与应用.PDF

1742351308 程希冀 2.5MB 47页 积分6

DeepSeek原理与落地应用.PDF

1741936910 肖睿 4.93MB 55页 积分6

AI辅助编程真实测评与企业落地实践.PDF

1741936506 蒋志伟 10.17MB 37页 积分6

AI大模型技术在数据库DevOps的实践.PDF

1741935803 叶正盛 2.67MB 30页 积分6

鸿蒙生态下的AI助力移动应用开发新范式.PDF

1741935592 彭松 3.37MB 24页 积分5

DeepSeek大模型及其企业应用实践.PDF

1741743773 林子雨 9.39MB 144页 积分8

相关文章推荐