预测不是衡量准确性,而是偏差率
刘宝红 E-works

    预测就如赌博,赌对说明了什么?说明了你幸运。我们其实是很难分析赌对的原因,除了基本的“从数据出发,由判断结束”的需求预测流程,以及选择更合适的数理统计模型。即使这两者都做对了,你还是可能预测失败。所以,从赌对中,我们很难学到太多的东西。这就如你问那位九十多岁的老寿星长寿的秘诀,他说他吃饭,他运动,他睡觉--他其实也不知道为什么长寿,否则的话,为什么不教给他的老伴儿,这样,老伴儿就不会在三十年前去世了。

    成功并不能让我们更聪明多少,也很难复制。否则的话,马云会把他的那些成功法则一遍又一遍地复制,把地球上的钱都赚光了;苹果也是,把iPhone的成功复制到i汽车、i电视、i电冰箱,凡是你能想到的,前面都加个i。人之所以变聪明,是因为我们从失败中学习。具体地说,就是坚守基本原则的情况下,尽量避免那些失败,这样就增加成功的概率。

    就拿长寿来说,基本原则就是吃好、运动好、休息好。要避免的失败呢,就是不吸毒,少喝酒,不在XYZ公司上班--加班太多,过劳死;压力太大,容易跳楼。对于需求预测来说,坚持基本原则就是选择最合适的统计模型,走"从数据出发,由判断结束"的基本流程。而要避免的失败呢,则得从预测的偏差率中去发现--所有的预测都是错的,识别偏差,纠正差别就是调整预测的过程。

    需求预测就如发射导弹,一路飞去,一路纠偏。命准目标的过程其实就是纠正偏差的过程。

    让我们先来看偏差怎么计算。概念上很简单:实际值与预测值的差就是偏差。但预测是个循环更新的过程,如果每月滚动的话,每一个月就有个预测。那究竟该用哪个月的预测来计算偏差?这取决于供应链的响应周期:在一般的行业,生产周期加上长周期物料的采购前置期,大概在3个月左右。因此,理论上讲,用三个月前的预测(M-3)最合理:1月份,你告诉我4月份的预测是100个,我就按照这个来采购、生产。结果4月份的实际需求是80个,那么偏差就是20个,偏差率是25%。

    M-3的偏差率一般会非常高,会揭示太多的"问题"。而最大的问题呢,就是预测做得太早而不准,解决方案就是缩短供应链的响应周期,这样我们就不需要那么早地做预测了。所以时间是最大的因素,对于需求预测来说又不可控,反倒把很多别的可控因素给掩盖了。

    打个不一定很恰当的比方。乔丹的投篮命准率是49.7%,这是他在三分线内外的命准率。假定乔丹一过中场就投篮,估计命准率只有5%。分析为什么95%的球都投丢了,结论很容易是他离篮板太远了。其实即使乔丹在篮下,跟篮板的距离是0,也不是百分之百地命准。这意味着在距离因素以外,还有别的因素在影响他的投篮命准率,比如投篮的姿势,手腕的发力等。这些其实是可以控制的,但因为被距离因素掩盖掉了,反倒没有被发现,采取合适的纠偏措施。

    有些企业用M-1来统计偏差,用1个月前的预测作为基准。这有一定的合理性,因为一般的行业,需求预测的冻结期大概是1个月以内(意味着数量、配置和日期都不能改变),如果进入冻结期还改变预测,那对生产和供应链的代价很高,所以必须严加控制。半冻结期大概在1到2个月,这段时间内的需求变化呢,对不起,供应链你就想法消化吧。就这样,冻结期内的问题由销售买单;半冻结区内的变动由供应链买单,两头一凑,算是个折中方案吧。

    但是,对于芯片等采购提前期很长(动辄就13个星期或更长),供应灵活性很差的情况(比如芯片生产流程很长很复杂,人工干预挺困难),M-1对供应链来说就有点太不公平--M-1的预测准确度挺高,但太迟了,因为供应链的决策早都做了。这就是为什么有些企业用M-2来统计预测的准确度,分析其偏差度。当然,还有些企业采取更折中的方式,用M-1、M-2、M-3的平均值来统计需求预测的差异,这在操作上有点太复杂,也掩盖了不少有用的信息,指导意义有多大,还有待商榷。

    其实,采用多久前的预测做基准,其实是销售与供应链力量博弈的结果:销售的力量越强,就选择近期的预测做基准;供应链的胳膊越粗,就越可能用更久前的预测做基准。想必我们现在也清楚了,如果两家公司都说他们的预测偏差是30%时,如果一个用的是M-1,另一个是M-3,那他们的差距可不是一点点喔。

    定义好了偏差怎么计算,让我们进一步探讨差异是怎么分析的。总的来说,我们感兴趣有几个方面:绝对偏差(绝对值),相对偏差(百分比),偏差的方向(偏见)。

    先说绝对偏差。假定需求预测是100,实际需求是80,那么绝对偏差就是20。除以实际需求80,就得到绝对百分比偏差25%。绝对百分比让不同的产品有了可比性,所以是差异分析中较常用的一种。不过你看得出,绝对百分比掩盖了偏差方向,没法判断预测是虚高还是虚低。比如需求预测是60,实际需求是80,其百分比差异也是25%。但你知道,这是预测虚低,会造成短缺,跟预测100、实际80造成的过剩不一样,对供应链的影响也不同。

    这就是为什么有些公司拿掉绝对值,直接计算预测和实际的偏差百分比。这种偏差可以清楚地判断预测与实际的偏差方向,以揭示需求预测中的系统性偏见。比如"由判断结束"中,有几个销售人员习惯性地高估需求,而别的销售人员时高时低,更加符合统计学规律。根据这样的分析,就可有针对性地采取组织措施,纠正这几个销售人员的行为。

    有的公司把预测和实际的偏差值累计起来,就得到累计偏差,以判断预测的累计影响。比如而1月、2月、3月的预测偏高,4月、5月、6月的偏低,半年加起来可能抵消,从而没有造成呆滞库存。不过这并不意味着完美无缺。比如基于前三个月的过高预测,供应链可能不得不赶工加急,造成额外的运营成本;由于后三个月的预测偏低,工厂可能遣散一部分员工,产生遣散费用。可以说,一旦汇总,我们可能冒丧失某些信息、掩盖某些问题的风险。所以,预测的累计偏差一般不独立使用,而是和别的偏差指标一起用。

    此外,还有很多偏差的统计方法,比如统计预测值与实际值之间的方差、均方差,来衡量偏差的幅度和离散度。但不管用什么样的统计方法,超过一定限度的会成为异常值,需要根源分析,采取纠偏措施。需求预测虽说是"预测",其实大部分时间都在纠偏:发现差异,分析差异,理解差异,采取纠偏措施,比如更换统计模型,与销售、市场、产品管理会面讨论,和关联职能协商等。正是通过处理一个个的“例外”,我们才得以避免失败,从而能够成功。这就如要长寿很简单,只要解决那些可能让你死去的“例外”,活着就是长寿。


CIO之家 www.ciozj.com 公众号:imciow
关联的文档
也许您喜欢