标签分类的三种方式:按用途、按统计方式和按时效分类 您所在的位置:网站首页 效率体系分类 标签分类的三种方式:按用途、按统计方式和按时效分类

标签分类的三种方式:按用途、按统计方式和按时效分类

#标签分类的三种方式:按用途、按统计方式和按时效分类 | 来源: 网络整理| 查看: 265

2. 按统计方式分类

按统计方式分类的标签可分为事实类标签、规则类标签、预测类标签。与按用途分类不同的是,按统计方式分类的3类标签通常面向研发人员,意指标签是按何种方式计算而来,其复杂程度、产研成本由低至高。

1) 事实类标签

事实类标签是用户画像最基础、最常见的标签,通常是基于原始数据清理后的归类,用于描述客观事实。例如,姓名、会员等级、终端类型、购买次数、购买金额等。

2) 规则类标签

规则类标签,顾名思义,是基于确定的规则而产生。与事实类标签不同的是,规则类标签拥有更多的业务属性,其业务规则需与业务人员共同制定。例如,将“活跃用户”标签可定义为,“过去30天发生a行为x次”&“过去30天发生b行为x次”,进行综合评定。

① 用户活跃度标签

实际业务场景中会涉及根据用户的活跃情况,给用户贴上高活跃、中活跃、低活跃、流失等标签。那这个过程中高中低活跃度对应的时间范围是如何划分的呢?

在这里,靠拍脑门可行不通,标签讲究定义有依据、建设有方法。

首先划分用户的流失周期,运用拐点理论:X轴上数值的增加会带来Y轴数值大幅增益(减益),直到超过某个点之后,当X增加时Y的数据增益(减益)大幅下降,即经济学里面的边际收益的大幅减少,那个点就是图表中的“拐点”。

比如图中流失周期增加到5周的时候,用户回访率的缩减速度明显下降,所以这里的5周就是拐点。

我们可以用5周作为定义用户流失的期限,即一个之前访问/登录过的用户,如果之后连续5周都没有访问/登录,则定义该用户流失。划分完流失周期之后,初期可根据根据四分位数,将用户的活跃情况划分为高中低,后期根据数据情况更新规则。

② 四分位数

也称为四分位点,是指在统计学中把所有数值从小到大排列并分为四等分,处于三个分割点位置的数值。

如历史数据,选择近1个月访问APP次数在0-8之间,则取3/4分位点为6、1/4分位点为2。

高活跃用户:近1个月访问APP次数在[6,8]区间的用户 中活跃用户:近1个月访问APP次数在[2,6]区间的用户 低活跃用户:近1个月访问APP次数在[0,2]区间的用户

③ RFM标签

根据美国数据库营销研究所Arthur Hughes的研究,客户数据库中有3个神奇的要素,这3个要素构成了数据分析最好的指标:最近一次消费时间、消费频率、消费金额。

最近一次消费(Recency):指用户上一次购买的的时间,一般上一次消费时间越近的顾客是质量更佳的顾客。最近一次消费是维系顾客关系的一个重要指标。 消费频率(Frequency):顾客在限定时间周期内消费的次数。消费频率高的顾客,也是满意度最高的顾客。根据这个指标,可以把客户分成几等份,相当于划分了一个忠诚度的阶梯。 消费金额(Monetary):消费金额时产能最直接的衡量指标,也可以验证“二八定律”,公司80%的收入来自于20%的顾客。

我们在设计RFM标签时,可根据二八定律来进行标签分级。

④ 二八定律

二八定律又名80/20定律、帕累托法则,它是在19世纪末由意大利经济学家帕累托发现的。

帕累托认为,在任何一组东西中,最重要的只占其中一小部分,约20%,其余80%尽管是多数,却是次要的。给一个公司带来80%利润的是20%的客户,按照这个原则,如果能把这20%的客户找出来,提供更好的服务,这对于公司的发展和业绩增长起到至关重要的作用。

R:如历史数据中80%的用户最近访问=90日为“远”。 F:如历史交易订单量80%的用户订单量=10单为“高频”。 M:如历史交易订单金额80%的用户交易金额=2000元的为“高额”。

客户类型可划分为:

重要价值客户:R↑ F↑ M↑,消费金额、消费频次大且最近有消费的用户,则为优质客户;可倾斜更多资源、提供VIP服务、专属客服通道、个性化服务 重要保持客户:R↓ F↑ M↑,消费金额和消费频次大,但最近无消费,需要唤回;可提供有用资源,通过续订或更新产品赢回他们 重要发展客户:R↑ F↓ M↑,消费金额大,且最近有交易,但消费频次不高,需要重点识别;可交叉销售,提供会员/忠诚计划,推荐其他产品 重要挽留客户:R↓ F↓ M↑,消费金额大,但消费频次不高且最近吴晓飞,此为最潜在有价值的客户,需要挽留;可采取push消息触达,回访等措施,来提高留存率 一般价值客户:R↑ F↑ M↓,消费频次高且最近有消费,但消费金额较小;需要进一步挖掘,向上销售更高价值的产品 一般保持客户:R↓ F↑ M↓,消费频次高,但最近无消费且消费金额较小;可向上销售更高价值的产品 一般发展客户:R↑ F↓ M↓,最近有消费,但消费频次及金额较小;可按消费类型推荐其感兴趣的产品 一般挽留客户:R↓ F↓ M↓,无消费的新用户;可开展活动,免费试用,提高客户兴趣,建立品牌认知度

3) 预测类标签

预测类标签,基于现有事实及规则无法得出,需要运用决策树算法、贝叶斯算法等进行数据挖掘与训练,得出标签预测结果。

预测类标签复杂度高、开发周期长、开发成本高,且需要算法工程师参与,通常此类标签的占比较少。

3. 按时效分类

按时效分类,可分为静态标签、动态标签,方便业务人员在需求提出时做好时间维度的限制,同时方便开发人员在标签更新时,设置静态标签的更新时间更长,提升数据产出效率。

1)静态标签

静态标签通常用于描述固有属性,不随时间的变化而改变,如性别、身高、体重等。

2)动态标签

动态标签需要动态更新,来保持标签的有效性,如近7天购买次数、近30天加购次数等。

二、标签分级

随着标签的增多,当标签数量发展到成百上千量级时,业务方要从中找一个标签就会十分困难。所以标签在建设初期就需要进行分级分类的管理,就像整理电脑文件夹一般,分类清晰的标签更便于查询使用。

标签常用的分级结构为:一级标签、二级标签、三级标签、四级……逐级往下分。

注意:建设初期要注意的是层级不必生搬硬套、划分过细,根据标签建设实际情况划分即可。如果公司只有几十个标签,则划分至二级足矣,过细反而累赘。



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有