自从大数据概念开始兴起后,好像人们都不怎么谈指标了,而津津乐道于标签。数字经济时代,谈论指标真的落伍了吗?其实未必!指标也好,标签也罢,只要用好都能发挥其价值。怎样才能用好它们呢,我觉得要从懂它们开始。说到懂它们,就要清楚它们的异同点。到底指标和标签有什么异同点呢?老黄今天就来带领大家细品一下。
1、概念不同
指标是用来定义、评价和描述特定事物的一种标准或方式。比如:新增用户数、累计用户数、用户活跃率等是衡量用户发展情况的指标,月均收入、毛利率、净利率等是用来评价企业经营状况的指标。
标签是人为设定的、根据业务场景需求,对目标对象运用一定的算法得到的高度精炼的特征标识。可见,标签是经过人为再加工后的结果。比如:说某个人是个“酒鬼”,这里“酒鬼”就是标签,一看到“酒鬼”这个标签人们就能很快知道,这个人肯定是经常喝酒、喜欢喝酒的人。
2、构成不同
指标通常由两部分构成,即名称和取值。名称是指标的外在标识符号,取值是指标的具体内容。指标名称是对事物质与量两方面特点的命名;指标取值是指标在具体时间、地域、条件下的数量表现。当然,指标取值可以是定量的数值,有时候也可以是定性的描述。比如描述一个人时,性别、年龄、身高和体重是经常用到的指标,以体重是220斤为例,指标的名称体重,指标的取值就是220斤。指标如果可以数量化的话,那么都是有单位或量纲的。从词性上说,指标几乎都是名字。
标签通常就是简单的几个字或符号。还是以某人体重为220斤为例,用标签的方式来描述的话,“大胖子”就是一个可用的标签。标签一般是不可量化的,通常都是形容词或形容词+名词。比如“大胖子”就是形容词+名词的结构。标签通常是孤立的,除了基础类标签,通过一定算法加工出来的标签一般都没有单位和量纲。
3、属性与特征不同
指标是ICT时代和BI时代的通用语言。指标注重对事物及事件的过程进行全面的、体系化的描述,指标的描述范围更广泛,既包括过程也涵盖结果;指标更注重与业务的结合,逻辑上更严谨,表现风格也比较严肃刻板。指标更侧重业务化、严格化和数量化。
标签是大数据与人工智能时代的通用语言。标签比指标更有深度、更凝练,是对指标深度加工的结果;标签注重人物和实体对象的描述,标签一般侧重对局部特征和结果的描述,注重与具体业务场景的结合,描述的范围相对较窄;标签更侧重生活化、口语化和符号化。
总之,标签源于指标,却高于指标。指标更理性,标签更感性。标签比指标更有趣、更形象化、人格化,更有画面感,但指标比标签更讲求精确性、合理性、全面性和体系化。
4、价值评价方式不同
对指标与标签的价值评估方式、评估内容与它们的应用场景相关,也与使用者的感受有关系。
对指标的价值通常用“好不好用”、“全不全面”来评价,对标签的价值通常用“准不准”、“像不像”来评价。
指标的评价较易量化,通常有一定的标准和尺度;标签的评价一般与使用者的感受、应用的结果有强关联关系,不同的人、不同的应用场景,标签能发挥的效果可能大相径庭。
还有一点,由于标签是指标进一步产品化的结果,指标是半成品,标签是成品。所以,标签有时候具有一定的商品属性。在大数据价值链上,标签是可定价、可售卖、可交易的一种数据产品。比如:在个人征信服务领域,用户的三要素、四要素在合规使用的前提下都是可以按条收费的。而指标通常是不具备售卖价值的,指标的价值可在具体应用场景里或者被融合到产品中才能体现出来。
对价值的认知上,指标可以按照重要性分为关键指标、一般指标等,或者说高价值指标、低价值指标之类的,而标签较少提及这种说法,比如有关键指标一说,而没有关键标签一说。
5、分类不同
指标有很多种分类方式。比如:按照指标计算逻辑,可以将指标分为原子指标、派生指标、组合指标三种类型;按照对事件描述内容的不同,分为过程性指标和结果性指标;按照描述对象的不同,分为用户类指标、事件类指标等;按照指标的变化频率,分为静态指标和动态指标;按领域划分,有用户类指标、收入类指标、行为类指标等;按照重要程度,分为主要指标和次要指标等;按职能来分,分为观测指标、管控指标和挑战指标。当然,还有很多其它的分类方法,不再一一列举。
标签的分类方法通常比指标要少一些。之所以这么说,是因为指标能描述的对象范围更广,对事物的描述能做维度更全面、颗粒度更细,而标签对事物(用于对人的描述比较多)的描述则是更深入、更形象的。按照标签的变化性分为静态标签和动态标签;按照标签的指代和评估指标的不同,可分为定性标签和定量标签;按照标签体系分级分层的方式,可以分为一级标签、二级标签、三级标签等,每一个层级的标签相当于一个业务维度的切面;按照复杂程度分为:基础标签、规则标签和模型标签。基础标签通常是写实的,与指标有较高的重合度,比如身高、体重等;规则标签一般是有一些简单的规则来控制,符合某种规则时才生成相应的标签;模型标签一般需要通过某些机器学习算法来生成。
6、数据量级不同
指标涉及的范围更广,从产供销到人财物等方面,都需要用指标来描述,所以,从数量级上看,指标的数据量级肯定比较大。以电信运营商为例,用户域、营销域、产品域、资源域等方面的指标数量量级以万计算。
标签通常用于对人的描述,标签的数量级比较小,通常不超过1千。标签并非越多越好,关键是要实用。当然,层级越多,标签数一般越多。
7、表现形态不同
指标的表现形态相对简单,通常以格式化的报表、直方图、趋势图、看板等图形来表示。
标签的表现形态相对复杂。我们通常说的标签是数据化的标签,数据化标签的表现形态以可视化的图表或大屏为主,比如,我们在客户画像时通常以词云图的形式来表现其特征。
事实上,在现实世界中标签还有三种表现形态:实物标签、网络标签和电子标签。实物标签是用于标明物品的品名、重量、体积、用途等信息的简要标牌,例如:商品标签、价格标签、车检标签、服装吊牌、车票、登机牌都是实物标签;网络标签(Tag)是一种互联网内容组织方式,是相关性很强的关键字,它能帮助人们通过关键词快速建立对内容总体印象;电子标签又称RFID射频标签,是一种识别效率和准确度都比较高的识别工具,通过射频信号自动识别目标对象并获取相关数据,识别工作无须人工干预,可工作于各种恶劣环境。
8、生产过程不同
指标是生产性思维、拆解式思维,讲究的是化整为零,将事物分解开来进行多角度的描述,得到很多的指标;标签则是合成性思维、聚合式思维,讲究的是化零为整,将多个分散的指标按照一定的原理进行综合加工,得出概括性的结果。
一般情况下,先有指标,后有标签。指标是业务管理导向的,需要提前规划;标签是应用导向的,跟随业务需求的而变化,面向业务可随时增加;
指标的生产通常先要扫平数据质量问题,统一数据口径;而标签生产涉及数据质量的问题较少,因为数据质量的问题已经在指标生产阶段被解决了。指标通常存在多个口径、口径不一致的问题,而标签在这方面的问题则相对较少。
9、应用场景不同
指标的应用场景很多,涉及企业的战略、管理、运营和支撑等层面。具体
包括:战略目标、市场定位、业务监测、业绩考核、任务分解、数据分析、数据建模、BI应用等;
标签的应用场景主要集中于CRM领域,尤其适合于用户运营。比如:客户画像、新增获客、沉默用户激活、存量客户维系、数据建模、数据可视化等。
指标最擅长的应用是监测、分析、评价和建模,标签最擅长的应用是标注、刻画、分类和特征提取。特别需要指出的是,由于对结果的标注也是一种标签,所以在自然语言处理和机器学习相关的算法应用场景下,标签对于监督式学习有重要价值,只是单纯的指标难以做到的。而指标在任务分配、绩效管理等领域的作用,也是标签无法做到的。
10、管理与维护的内容不同
原则上来说,指标与标签都需要建立体系化的管理机制。就指标的管理机制而言,指标管理通常涉及三个方面:需求阶段的管理、开发过程的管理、应用过程的管理。所以,对指标的管理动作主要就是:做指标、管指标、控指标。指标的日常管理涉及指标的定义、指标的分类、指标的权限管理等。对指标的监控与维护通常涉及缺失值、异常值、勾稽关系等方面的检查。
对标签的管理与维护通常按照标签的生命周期来开展的,涉及标签开发与发布、标签应用、标签价值评估和标签优化及下线四个阶段。对标签的管理动作主要就是:打标签、贴标签、用标签和改标签等。为做好标签管理与维护,有必要设立专门的标签管理团队,建立标签分类、命名、描述、和实施等方面的规范,完善配套的数据采集流程、标签加工流程、标签问题处理与反馈流程等,建立标签全生命周期管理体系,与数据资产管理制度相统一,为标签在各层面的落地及管理提供建设依据。
小结
以上是笔者从10个方面详细解读了指标与标签的不同点。当然,两者还是有不少共同点的,比如:指标和标签都是对事物的一种描述和解读,都是对数据加工的结果,都可以分维度拆解,都是企业的数据资产等等。还有一些共同点就不再一一展开。剖析指标和标签的异同点是为了更好的使用它们、驾驭它们,所以,希望以上我关于指标与标签的分析能够对诸位有所启发。
CIO之家 www.ciozj.com 公众号:imciow