用户画像的技术和方法论
姚凯飞 知乎专栏

用户画像也是近几年比较热的一个词,不过很多小伙伴对于画像的认知还只是「标签化」的层面,或者是只是利用其做一些简单的「分群分析」;如何全面地认知并做系统性地尝试,背后有非常多的点需要我们深思挖掘。

image.png

首先我们来看一下什么是互联网公司的核心。鄙人的浅见是围绕「商品、供应链、物流、营销活动」等的整一个「购物旅程」背后的「用户体验」的。

image.png

既然用户体验非常重要,那如何去「度量」和「优化整个流程」呢,那就是站在「用户角度」收集其在各个模块的数据,并利用「统计」、「概率」思维「建模分析」;在产品运营、增长过程中找到「雪球效应」的「撬动点」施以影响,最终建立起「良性的闭环」。

image.png

作为互联网从业人员,其实我们常有一些困惑,产品的用户是「谁」?他们是否「满意」?产品是否健康?有哪些「问题」?如何才能服务好我们的用户,并且让彼此的「收益最大化」?

如何去构建起更多用户使用的产品,如何创作一个更多用户喜欢的课程?就像小破站(B站)的成长中一直在解决问题,如何突破二次元的定义,如何将「用户圈层」拉开,如何让「尽量多的人能在B找到自己喜欢的内容」,如何做到「存量用户保有」及「增量用户拉取」。当然肯定不存在每个人都满意的产品和课程,但是如何在现有体系下去「最大化满意度」呢?这个我觉得是大家希望得到答案的根本。

那其中的一个手段就是以增量用户拉取,存量用户数量和价值的保有为目标,利用大数据技术精准「用户画像」,并结合「商品画像」,「解构」用户及商品,「精细化」耕作,最终在重点目标客户群体上形成突破。比如电商猜你喜欢中的个性化推荐技术,万能的淘宝上有海量的商品几乎可以满足每个人的采购商品需求,但是如何让一个用户可以精准快速地找到是大问题,「个性化」是其根本,「用户画像和塑造」则是个性化的根本,希望可以让用户感受到产品「为ta而造的满足感」。

如何解构用户呢,举一个例子就是说当你很了解某一个人的时候,你跟ta一起去吃饭,你如果在之前历次跟ta的进餐中收集了ta喜欢及不喜欢吃什么(「用户动态数据」),然后ta的性格是怎么样的(比较犹豫)(「用户数据」),是不是喜欢吃辣(「用户数据」),然后你再结合有哪些菜、是不是辣的(「商品静态数据」),两端做匹配就可以提供更好的体验了。所以不是单单用户画像,商品画像或其它维度也是需要,「最重要」的「是匹配」。

然后我们来看看目录,第一部分是说「what」,就是什么是用户画像;第二部分是说「why」,为什么我们需要用户画像以及精细化运营;然后第三部分是「how」,我们如何构建商品和用户画像;第四部分是「举例」,是一些方法论的介绍;最后,我们做一个整体的「总结」。

课程目标是希望通过分享,首先让大家去了解到用户画像和商品画像,整体概念框架以及构建的一些方法;熟悉常见的商品和用户画像的一些应用;尝试结合自己的工作做一些实践。出于对于过往公司数据及技术的保密,无法直接分享给大家特别细粒度且对应的数据。所以分享过程中我会结合业界的一些案例,以及其他「前辈」公开在网上的分享内容和数据,帮助大家去理解整个应用。

首先我们来看一下什么是用户画像,根据维基百科的定义,用户画像就是与该用户相关联的数据的可视化的展现,然后一句话来总结的话就是「用户信息标签化」。从「用户海量」的信息里面去找到一些标签,为用户去贴上这些标签,当然这些标签的「来源」就是一些用户的「行为」。

举个范冰冰的例子,客户这个实体通过客户信息的「收集」,「映射」到一个客户的画像,最终通过这些画像来「建立认知」,比如说范冰冰是一个演员,是一个女性,有参加过哪些电影节等。当然你会问那上面的这些标签有什么用呢?这会根据「具体的业务场景」来定,有些标签在X场景下它是没用的,在Y场景下则可能非常有用,当然这也提前说明了画像构建的过程肯定是需要与业务结合的展开。

比较常见的画像是我们需要建立平台客户群体化认知时,我们需要借助可视化的标签,我们看一下京东的一个食品用户画像。对于食品这个业务场景,平台上购买的用户他们是长成什么样的?比如性别比例,蓝领与白领占比,评价敏感的人的占比等,通过「拉平垂类」偏好用户画像与「全站」的「对比」,来寻找「差异点」和「优化点」。

举个例子来说,你是抢购秒杀频道的运营负责人,你通过类似的上述分析,找到了「秒杀频道」和「全站」的用户画像「差异点」,那有什么用呢?比如我们发现秒杀频道女性用户或者大龄女性用户,相对于全站占比高很多,然后我们通过全站分析出这类用户喜欢购买的品类是A、B、C;但是频道内我们发现几乎没有A、B、C这些品类的商品,或者A、B、C这些类目的价格段高了很多,甚至是大量的男性商品。那我们马上就找到了一个优化点,是否可以在该场景做一些品类和商品的调整进行一些测试,可能就会在测试中找到明显的提升。

比如食品品类下的商品运营如何去「拓宽」自己的流量池,「通过」类似上述的「分析」,比如在一个某个频道发现有非常多的18-30岁的男性,并他们在平台有非常多的电子类产品的购买,「结合」你的「专家知识」,你的碳酸饮料是否可以考虑进入这个频道呢。

上面的是较直观的应用,进一步其实我们可以借助算法挖掘「群体偏好」(没有算法基础的可以略过),对频道内商品做进一步改造。比如我们通过算法可以对近N天频道内的用户,通过算法进行商品召回和排序生成全站他们购买的商品,再通过用户在频道的「活跃度」和「频道LTV」对这些商品通过「embeding」后的向量进行「归约」,形成最终的300或者500个「商品池」,这些商品是你「典型用户」的一个集合,可以与你现有的商品集合进行「融合测试」,会有不错的收益。
用户「消费购物」非常「复杂」,需要「根据具体的业务场景」去展开的,上述方法「不一定适用所有的业务」,「不同的业务场景」需要做「调整和适配」。

顺便介绍一下什么是商品画像,可以简单的理解为?商品画像如同用户画像一样,可以简单理解成是商品海量数据的标签,根据商品的「特征、设计、功能、口味、波次、价位段、流行度、销售状况、促销力度、销售渠道」差异,将他们区分为不同的类型,然后每种类型中抽取出典型特征,「赋予」「名字、特点、场景、统计学要素等描述」。

其实「商品」和「用户画像」有很多「交集」和「互相交互」的,比如「商品有个标签」是适用人群,比如女性或者男性,可能就是有很多女性用户经常购买,或者说用户「经常购买」某个品类或者某种颜色的商品,那用户就可以「贴上类似的标签」。商品「有了标签」,运营在做活动的时候,就可以根据活动首页和「分会场人群定位」,「去选品、氛围塑造」,比如时尚会场的商品池选取,比如对于履约不好(拒收、退货、低评分)的、高点击&低转化「商品」的「控制」。

为什么why这些需要用户画像呢?其实在用户使用产品的过程中,如果我们做了对的事情让用户的体验非常棒,然后其实我们就可以有不错的「收益」。但如果我们做了用户体验较差的事情,「损失」会非常巨大。

如何在企业商业化过程中与用户达成双赢是需要逐步来探索的,一种途径是通过「数据去驱动决策」,做到「利益最大化」,也就是这里分享的。通过用户和商品画像找到并更好地服务「为你产品买单买单的那一群人」。

通过初期形成的产品,形成了我们平台的一些忠实的客户,对于这部分群体的解读,就可以驱动产销配一体化。需求(用户)与供给(商品)两端的匹配「GAP」的存在,可以推动精准的「供给体系构建」,比如「C2M、C2B」的可能尝试。

宏观和微观上我们看看画像的作用,「微观」上主要是「精细化」,比如「推荐、搜索、精准营销、定向投放、风控、定量和定性的分析、数据化的运营用户分析」。「宏观」上来说就是「具象化对于用户的认知」,在探索用户足迹的过程中,建立「市场细分和用户分群」。

这里顺便讲一下商品画像的作用,商品画像的前台作用更多是在流量分发上与用户画像的match,关联后的一些推荐、精准推送等。比如用户标签为a类目的价格段偏好,然后商品画像也有价格段的标签,比如说用户偏好的是30-50人民币的连衣裙,然后这个商品是连衣裙并且正好是在30-50人民币的,所以可能相对其它价格段的商品而言,在这一维上更合理;接着再结合其它维度的商品和用户标签的「match」就可以构建更多的匹配维度。

而偏后端一些的维度,商品画像也可以带来非常多的帮助,可以去「驱动后端的供应链」。通过商品画像的历史情况(近期曝光、点击、订单、转化等),可以去做「销量预估」,进行「备货、采购、越库、生产物流」等等环节的优化。

这里讲一下统一「建模预测分析」,首先如果有了人口属性细分,比如说一些性别,年龄段等等,就可以去明确用户是谁,他在平台上面买了什么,为什么买;有了购买行为细分以后,可以去明确「市场机会」,市场规模等关键信息;再次是「产品需求的细分」,提供根据差异化的竞争的产品规格和业务价值,可以去做更加差异化的竞争,不做海量的库存,而是更精准、成本更可控;最后是「兴趣态度的细分」,通过用户画像可以去做不同的渠道的策略,定价的策略,产品的策略,品牌策略;比如「渠道策略」,我们可以通过分渠道归因并捞取对应用户群体,并观察各个渠道群体的差异,比如类目偏好、价格段偏好等的差异,在投放过程中进行商品池和「投放策略」的优化。

总结一下就是商品和用户画像很重要,两者是「相辅相成」的,在整一个用户体验过程中非常重要。

那到底如何构建用户和商品画像呢,这里可以提一个概念叫「」侧写师,电影中经常有一些概念就是侧写师通过观察和收集犯罪现场的信息(「数据收集」),去想象作案人的心理和案发时的动作(「预测」),并最终为破案带来机会(「实施」),构建用户画像的方法论与其类似。

第一步是「收集数据」,图中方法比较多,各有优缺点,不过目前主流的还是通过用户静态数据结合海量的平台用户行为数据的方式。通过「埋点」,我们可以看到用户在我们平台上看了什么商品,点了什么商品买了什么商品,将这些数据串起来,可以作为入口去「」理解用户,更进一步,通过一些「统计、概率」知识进行建模,比如说「用户细分、生命周期划分、流失用户研究」等,做深层次的「挖掘」。
接下来我们来解构用户画像。

主要是「人口统计学属性、消费需求、购买能力、兴趣爱好、社交属性」等

用户画像的粒度简单来讲,比如年龄标签是「20-30岁」和「21岁」,这两个就是明显「不同粒度的标签」

再次就是可以从层级的角度来看,用户基本属性和行为标签为「浅层用户画像」,这些标签画像主要是「收集」就行,比如年龄,性别。第二层是稍作处理的「汇总层」,比如手机端大概什么时间活跃,经常购买的品类等。第三层是基于前2层可以做到营销的敏感度,社交关系,上网时间的预测;最后一个是更深层的,需要「结合业务知识去做定制」。比如保险领域的高中低价值、贷款需求程度,风险高低等。

网上找了一个金融领域的例子,比如根据「活跃」情况,可以区分活跃用户和流失用户,再根据时间窗口维度可以拆为48小时活跃和不活跃用户。简单的统计就可以为用户贴上各类的标签,比如过去12个月内累计订单超过20次为界限,可以划分为「高低频」用户等。不过多展开,可以自行阅读上图。

当然用户画像依赖的商品基础标签是必不可少的,比如用户服装偏好下有颜色偏好(白色),这个是通过用户历史的点击、加购、收藏等行为关联的商品所带标签的聚合,那其实底层商品的颜色标签是必不可少的。

接下来介绍的是一个构建方法论,但不是唯一方法论。

先从大维度来说,划分为动态和静态两类。比如说人口统计学的「性别、年龄、地域、收入、生活习惯」,是「相对静态」的,性别一般都不会变,年龄的话一年就涨一岁,然后地域的话也很少有大的变动,收入职业所处行业也不会有突然的变化,这些都可以划分到「静态标签」。而像「用户访问设备、用户的48小时是否活跃、内容&商品消费偏好」等属于时常在发生变动的,这些可以划入「动态特征」。

静态和动态的划分,其实是根据某个维度来定的,或者是在某个时间窗口内的。「静态画像」一般是「实时性弱更新慢」;「动态画像变化相对更快一些」,可以再「时效性、空间上有差异」。

不同的行业,不同的业务,也会有不一样的构建目标和方式。在这个过程中,通过「业务应用的要素分析」,去「驱动标签维度的扩展」,然后通过「标签维度的扩展」。然后我又可以去「驱动业务」。

上述图片介绍了常用的偏好标签建模的思路,不做过多展开,有兴趣的小伙伴可以私信交流。

那「系统化的标签生产」如何来做呢,可以参考上图,上图元素和参考了很多美团的做法,由于篇幅限制,这里不过多展开,后续的分享可以专门来将构建的细节。

重点是结合业务,「构建闭环」,用数据来提升业务理解,通过「业务理解」来快速构建画像相关的「数据体系」。

第四部分我们来介绍一些画像的应用

第一个我们介绍一下通过用户画像来做与「竞品对比分析」,在大维度战略调整和选择的时候,可以有「差异化市场定位」。根据用户标签进行市场细分和群画像分析,输出分析报告;帮助企业理解用户的「人群特征、人生阶段、消费偏好」等;帮助企业分析和友商用户群的异同,「优化市场定位和差异化产品策略」。这部分数据有自己「内部的数据」,竞品数据可以通过「第三方等间接获取」。

比如今天「shein」作为跨境快时尚平台做得不错,如果同类型的平台是否可以考虑在「年龄段」标签上做差异化,比如他们切的是18-35岁的年轻女性,那是否可以考虑35-50岁的中年女性作为用户群,在运营过程中做调整,反而在「利基点」上有不错的收益。

另一个方向的思考是,如果我们在部分用户标签维度差异较大,如果我们就是希望拿下这部分用户,那就说明我们可能有做的不对的地方,通过数据去排查问题,比如是我们投放的过程中渠道选择带来这样的差异?货是不是有问题,价格过高?品类深度不够?认识到了这种差异,可以进一步「深挖分析」或者「用户访谈」,来对我们的产品给用户的「心智营造」做调整。

通过画像数据的对比,可以去确定一件事情,就是说我们的竞品到底是谁。真正的竞品突然在你眼前,画像跟你高度重合的那个,而不是我们假想的那个。如果你发现原来被认为是竞品的典型用户群体是在「30到50岁」之间,而你们的群体在「20岁到35岁」了,那至少在当前情况下,你们是「弱竞争关系」。

定位了不同的人群,并结合数据做一定划分后,我们也可以根据情况针对性做「投放」和「媒体选取」。在广告营销推广的时候,我们结合画像对用户进行划分,区分为「大盘->成交->高价值用户」,然后我们通过某些标签进行数据分析,如上图中的「性别维度」,我们对比中发现其实女性用户比例在高价值用户中与大盘用户中「刚好反过来」 。

那接下来就有几个动作,可以对「投放渠道」、「商品」进行分析,是「引流的问题」?还是「货品」上对于男性用户天然不高?「商品运营」有没有问题?如果不做调整,是否后期的投放渠道可以选取「女性标签」会「更精准」?

我们希望根据不同的媒体目标覆盖率高低进行一个预算的分配,在平台上人群通过标签进行拆分。上面的问题,我们拆分了性别,是否有其它的维度可以进一步拆分,比如通过用户上报的APP安装列表,在平台上高价值用户有多种购物类APP和金融类APP的安装,那在投放过程中可以根据渠道的「差异」进行筛选,或者在「投放」过程中选取「对应」的一些「标签词」进行尝试。

上面的例子是结合用户画像做不同渠道的选择,逐步测试和优化。而对于商品的定位调整,可以结合商品生命的周期,尝试做一些「品类深度与宽度」的运营。

对于「不同生命周期内的用户」,其实数据和画像的丰富度也会有差异,在精细化运营过程中可以根据情况做「差异化的运营」。这里再讲一个其他案例,在用户分析维度,初期会通过用户调研访谈进行初期的产品定位,在投放扩量过程中,结合用户站内的情况作出「效率分析」,新用户有什么特征?核心的用户属性是否有变化?前后一年内获客可能会有很大差异,这种差异时常去关注,可能会了解到产品的变化是否符合预期。

在精准营销领域的的一些尝试,可以参考上图。分析历史某个时间窗口内的用户,哪些方面是有特性的,比如年龄段,性别,地域,收入,偏好等,有了这样的分析,可以选择相应的人群投放。输出到「媒体广告」,做「预算看效果」,然后将「效果数据回流」,再去「迭代」,以提高进一步的准确率。通过某个特性找人,再去分析这些潜在用户,找到可以触达他们的渠道。

上图也跟前面介绍的有点类似,作用类似,就是通过筛选已有用户中的核心用户,结合这群用户的标签,进行投放标签的初步筛选。在成本需要控制的情况下,可以通过「」核心人群标签投放->强相关人群标签投放->一般用户标签投放,这里也需要「结合不同人群经常交互」的商品进行「商品池选取」。

在看一个金融领域的应用案例,根据职业、年龄、存款等进行筛选,并结合历史理财的偏好等进行基金「推荐」。

上述的几张图其实主要也是介绍一些投放、人群圈选定向的功能。

再讲一个概念就是「CRM」,业界有很多探讨,其中也有一些问题点,如上图,后面分享我们对CRM可以专门展开。

有几个注意点也需要大家去注意的,其实我们有时候现有的用户不等于目标用户。在产品运营过程中,会发现平台上用户画像是这样的,但是结合战略以及竞品的一些情况,更大的去做差异化的竞争。重合的那部分是高价值用户,所以应该投入更多人力去做?结合用户画像去做更细粒度扩人群,是A人群还是B人群还是C人群?

然后第二点,构建什么样的用户画像,比如说用户是男性还是女性,她工资多少,喜欢什么样的商品。这些标签可能是「没有意义」的,如果要说「有意义的地方」是这些标签如何去「影响决策」,如何为用户带来更好的体验,带来「更高的留存、复购」。

「实践出真知」,需要结合具体业务场景,做尝试。

要结合业务场景去分析,然后去不要单看画像,而是要做一些对比,通过前后对比,跟竞品的对比,跟频道内与大盘的对比等手段去分析,发现不足和优势,做纠正和调整。通过数据反馈形成数据的闭环,最终在产品的迭代过程中拿到更好的业务结果。
总结一下,做画像要「有目标要有数据」,「也不拘泥于技术细节」,「大胆的尝试」,然后「先粗粒度」,「后细粒度」。


CIO之家 www.ciozj.com 公众号:imciow
关联的文档
也许您喜欢