RFM模型用于分析客户价值,它需要提供三项数据,分别是最近一次消费 (Recency),消费频率 (Frequency),和消费金额 (Monetary)。最近一次消费指研究时间点减去用户最近一次消费的时间,得到的gap时间值,单位上是天或月或周或年均可,以实际业务情况为准。消费频率是研究数据范畴内用户的消费次数,消费金额指研究数据范畴内用户的消费总计金额。
RFM的原理在于将RFM这三项数据进行分类,首先是分成1~5分计分方式,然后接着将1~5分计分方式按平均值大小分成两类群体(高价值和低价值群体)。最后RFM分别为两类群体即2*2*2=8种组合,8种组合对应着8类价值人群,最终结合此8类价值人群提供有针对性的营销策略。
最近一次消费 (Recency),其代表当前时间减去用户最近一次消费的时间差值gap,意义上数字越大代表用户的价值越低,数字上越小用户的价值越高;在传入SPSSAU系统时,如果默认让SPSSAU自动将数据进行1~5分计分方式处理,SPSSAU默认会对该值越大项编码为1,该值越小项编码为5,这样从1~5分计分时,数字就变成数字越大代表价值越高。
RFM的内部计算上分为两步,第1步是将RFM这三项数据变成1~5分计分形式,第2步是将1~5分计分形式转换成两组别(分别用数字0和1表示);转换成1~5分或者数字0和1后,数字的意义均变成数字越大代表价值越高。
默认情况下:SPSSAU会将原始数据按照20%/40%/60%/80%分位数,自动分成5组并且计分为1~5分;内部计算上得到1~5分计分形式后,SPSSAU会进一步将数字转化成0和1两个类别(按对应的平均值);
当然,研究者可以自行对数据处理成1~5分形式(比如自行使用数据编码功能里面的范围编码),如果提供的数据已经是1~5计分形式,那么参数上选择‘类别自动’即可;
如果研究者提供的数据是0和1即两个类别形式,此时参数上选择‘不处理’即可。
当前某企业从数据库中提取出100个用户购买信息,并且对数据进行汇总整理成RFM的数据格式,即一行代表一个用户,一共3列指标数据,分别是:最近一次消费时间gap值 (Recency),消费频率 (Frequency),和消费金额 (Monetary)。数据格式类似如下表:
一般情况下,最近一次消费时间gap,如果是从数据库中抽取得到,那么一般是比如“最近一次购买日期”,那么需要在EXCEL里面进行简单公式计算,得到‘最近一次消费时间gap’,即当前时间点减去最近一次消费时间。
RFM模型研究客户价值情况,最终将客户分成8个不同的类别(8种用户类型)。具体RFM模型如何将数据划分为8种类别用户上,其内部计算上分为两步;
第1步是将数据转换成1~5分计分方式(转化后分值越高代表价值越高),SPSSAU默认是按20%/40%/60%/80%分位数将数据计为1~5分。SPSSAU具体计分方式如下表所示:
标准 | R分值 | F分值 | M分值 |
< 20%分位数 | 5(5分) | 1(1分) | 1(1分) |
20%(含)~40%分位数 | 4(4分) | 2(2分) | 2(2分) |
40%(含)~60%分位数 | 3(3分) | 3(3分) | 3(3分) |
60%(含)~80%分位数 | 2(2分) | 4(4分) | 4(4分) |
>80%分位数 | 1(1分) | 5(5分) | 5(5分) |
第2步是将1~5分值,按分别对应的平均值进行划分,划分为0和1,数字0代表低价值群体,数字1代表高价值群体。如下表所示:
标准 | R价值类别 | F价值类别 | M价值类别 |
< 平均值 | 0(低价值) | 0(低价值) | 0(低价值) |
>=平均值 | 1(高价值) | 1(高价值) | 1(高价值) |
最后将RFM的组别建立组合,共计2*2*2=8种组合,即8种用户类型,如下表:
R这个数据,提供的原始数据时数字越大代表最近一次消费时间gap越大,即用户很久没有消费,那么数字越大其实价值越小,因此在1~5计分形式时,SPSSAU已经做了调换;
如果是提供的数据已经为1~5分计分形式,那么参数上选择‘类别自动’即可;
如果是提供的数据已经为0~1即两类别数据,那么参数上选择‘不处理’即可。
本例子SPSSAU操作截图如下:
RFM的放置顺序不能出错,一定是先R,再F,再M;
如果需要将‘用户类型’保存起来用于后续的分析使用(比如进一步深入分析性别与用户类别的关联关系),那么需要选中‘用户类型’;类似地,如果需要保存1~5分计分数据或0和1两类别数据,那么需要分别选中‘保存分值’和‘保存类别’;
本次数据并非1~5分计分形式,也不是01两类别数据,因为默认让SPSSAU全自动处理即可。
SPSSAU输出四个表格,分别如下说明。
编号 | 表格 | 说明 |
1 | RFM分值分布 | 1~5分计分数据时,分别的占比或频数 |
2 | RFM三项的分位数 | RFM这三项,分别是分位数数据,SPSSAU就是结合此分位数数据将数据划分为1~5分计分形式 |
3 | RFM类别分布 | 划分为两个类别即高低价值群体分布,包括频数和占比 |
4 | RFM用户类型分布 | 最终2*2*2=8种用户类型时的数据分布,包括频数和占比 |
如果参数选择情况不同,可能输出表格结果不完全一致。
RFM分值分布 | ||||||
项 | 1分 | 2分 | 3分 | 4分 | 5分 | 平均分 |
R(最近一次消费时间) | 24.0% | 16.0% | 20.0% | 22.0% | 18.0% | 2.94 |
F(消费频率) | 19.0% | 21.0% | 18.0% | 22.0% | 20.0% | 3.03 |
M(消费金额) | 20.0% | 20.0% | 20.0% | 20.0% | 20.0% | 3.00 |
上表格展示RFM1~5分计分数据的分布情况,数字越大代表价值越高。由于SPSSAU默认使用20%/40%/60%/80%分位数划分为五个分值,因此每个分值的占比基本均在20%左右,并没有出现个别分值时明显的样本偏多或者偏少。
RFM三项的分位数 | ||||
项 | 20%分位数 | 40%分位数 | 60%分位数 | 80%分位数 |
R(最近一次消费时间) | 20 | 48.4 | 69.2 | 80 |
F(消费频率) | 3 | 5.4 | 11 | 14.8 |
M(消费金额) | 522.6 | 1202.2 | 1684.8 | 2195.6 |
上表格展示出20%/40%/60%/80%分位数具体数据,1~5分值数据的划分,就是由上表格的数字进行切割得到的。比如R时小于20%分位数数字20,那么计为5分,R时大于80%分位数即80时,计为1分。而F和M时,小于20%分位数均计为1分,大于80%分位数均计为5分。
RFM类别分析 | ||
项 | 低价值(0分) | 高价值(1分) |
R(最近一次消费时间) | 40.0% | 60.0% |
F(消费频率) | 58.0% | 42.0% |
M(消费金额) | 40.0% | 60.0% |
上表格展示出划分为两组别(即高低价值)群体时的数据分布,具体如何划分是结合‘RFM分值分布’里面的平均值进行切割,比如R小于平均值2.94时计为0分,大于平均值2.94时计为1分。类似F和M也是,小于对应自己的平均值时计为0分,大于平均值时计为1分。0分代表低价值群体,1分代表高价值群体。图形展示如下:
上表格展示最终2*2*2=8种用户类别,总体上分为重要用户和一般用户,重要用户再继续细分为重要价值用户,重要保持用户,重要发展用户和重要挽留用户。与此同时,上表格展示出8种类别用户的占比情况,并且使用图示如下:
最终需要结合8种类型用户特征进行下一步的Action,一般来说如下表格说明:
RFM基本原理说明 | |||||
R价值类别 | F价值类别 | M价值类别 | 用户类型 | 用户特征 | Action |
高(1分) | 高(1分) | 高(1分) | 1重要价值用户 | 最优质用户 | 应提高满意度,增加留存 |
高(1分) | 低(0分) | 高(1分) | 2重要保持用户 | 重要用户但购买频率低 | 可通过活动提高购买频率 |
低(0分) | 高(1分) | 高(1分) | 3重要发展用户 | 重要用户但最近不消费 | 触达用户防止流失 |
低(0分) | 低(0分) | 高(1分) | 4重要挽留用户 | 潜在价值用户 | 了解用户需求想办法挽留 |
高(1分) | 高(1分) | 低(0分) | 5一般价值用户 | 忠诚用户但消费金额低 | 引导其消费 |
高(1分) | 低(0分) | 低(0分) | 6一般保持用户 | 新用户 | 利用优惠吸引消费 |
低(0分) | 高(1分) | 低(0分) | 7一般发展用户 | 一般用户 | 较少关注 |
低(0分) | 低(0分) | 低(0分) | 8一般挽留用户 | 流失用户 | 较少关注 |
RFM的内部计算上分为两步,第1步是将RFM这三项数据变成1~5分计分形式,第2步是将1~5分计分形式转换成两组别(分别用数字0和1表示);转换成1~5分或者数字0和1后,数字的意义均变成数字越大代表价值越高。
默认情况下:SPSSAU会将原始数据按照20%/40%/60%/80%分位数,自动分成5组并且计分为1~5分;内部计算上得到1~5分计分形式后,SPSSAU会进一步将数字转化成0和1两个类别(按对应的平均值);
如果是提供的数据已经为1~5分计分形式,那么参数上选择‘类别自动’即可;
如果是提供的数据已经为0~1即两类别数据,那么参数上选择‘不处理’即可。
R这个数据,提供的原始数据时数字越大代表最近一次消费时间gap越大,即用户很久没有消费,那么数字越大其实价值越小,因此在1~5计分形式时,SPSSAU已经做了调换。