电商行业(淘宝为例)项目实战分析报告
项目背景
随着电商行业的发展度过红利期,获取新客的流量成本高居不下,对消费品牌的直接影响表现为销售增量减少。为了弥补乏力的增长,各个品牌越来越重视对存量人群进行精细化运营,因为与获取新客相比,对存量老客的运营维护成本更低,且能带来更高的转化率。
此次项目实战以国内头部电商淘宝为例,基于对用户行为数据的挖掘,形成数据结论,最终输出一套能提高运营效率的策略建议从而赋能业务增长。
分析目标:提高销售收入
分析时间范围:2021年11月25日 – 12月3日
数据说明
数据来源
此案例中的用户行为数据集来源如下:
https://tianchi.aliyun.com/dataset/dataDetail?dataId=649
字段说明
此数据集中已有的字段及behavior_type(行为类型)值域如下:
分析思路
明确问题 — 分析原因 — 落地建议
明确问题:通过对整体数据的分析,透视业务现状,结合分析框架明确业务问题。
分析原因:将复杂的业务问题通过多维度分析方法拆解成多个具体小问题,并选择合适的分析方法、分析模型逐一对问题进行分析。
落地建议:汇总各分析部分得到的数据结论,以业务目标为中心同时结合业务场景,提出可落地执行的策略建议,帮助赋能业务增长。
在开始项目分析前,首先要完成数据清洗,找出数据出的异常值,离群值并处理它们,这一步骤的目的是使数据更加贴近真实业务情况,从而使最终的数据结论尽可能的还原业务事实。
异常值:
• 不规范的数据,如空值、重复数据等
• 不符合分析要求的数据,如此案例中,需要分析11月25日-12月3日之间的用户行为,在此时间段之外的行为都不应该被纳入此次分析
处理异常值:
一般情况下,直接删除即可,本案例中将采取此方式进行异常值处理;
特殊情况应结合业务情况特殊分析。
数据清洗—异常值查找及处理(重复数据/空值/时间戳处理)
1) 查找是否存在重复数据
在表中应用筛选条件直接删除重复行 或查询语句 (如下图)将重复的行找到并删除
2) 查找是否存在空值
该表中不存在空值
3) 查找是否存在超出分析时间的记录
因为给定的数据中,时间相关的字段是时间戳类型,而时间戳是指格林威治时间1970年01月01日00时00分00秒(北京时间1970年01月01日08时00分00秒)起至现在的总秒数,无法直接与日期进行比较,因此,需要对其进行格式化转换成如下几个时间格式,才能方便于后续分析。
¨ dates 字段:行为发生的日期
¨ hours 字段:行为发生的小时时间
¨ datetime 字段:行为发生的日期时间
¨ weekday 字段:行为发生在星期几
时间戳的处理
此处,为了方便后文的日期分析,这里用函数 from_unixtime(时间戳,时间格式) 和weekday()两个时间函数将时间戳转为不同格式的时间对表格增添,查询如下:
转换结果如图所示:表中多出了dates,hours,datetime,weekday四列
筛选超出时间范围的数据(结果部分截图)
有了日期字段后,就可以直接将超出指定时间范围的数据剔除掉。
至此,已完成数据清洗工作,剩余的数据便是可以直接用来分析的“干净”数据。
完成数据清洗,得到可用的真是数据后,开始分析的第一步——明确问题。
I. 明确问题
目的:基于现有数据,透过业务框架来对业务现状进行观察剖析,将笼统的综合的分析需求拆解成一个一个具体的可落地的分析目标。
电商行业中,明确问题阶段最常用AIPL漏斗模型对现状进行分析明确问题点在哪。
本阶段需要对业务对象与情况有个整体的认识;
在此案例中,主旨是进行用户分析,所以要知道用户人数、他们的分布情况如何等。
Ø 用户总数
按如下语句,即可统计出现有业务中,共有983名用户在2021年11月25日-12月3日期间发生了动作。
查询结果:
AIPL漏斗分析:
知道整体有多少用户后,接下来要进一步对他们的行为进行观察,因为分析的是淘宝行为,在电商领域比较常用的方法是阿里提出的AIPL营销模型:
• A - Awareness 认知:浏览
• I - Interested 兴趣:收藏、加购
• P - Purchase 购买:购买
• L - Loyalty 忠诚:复购
AIPL营销模型可以很好地将用户行为与相应地运营周期关联起来。
例如
【A→I】: 运营中的拉新:处于AI阶段浏览、收藏、加购的用户数越多,运营拉新指标就完成得越好,但此部分同样意味着拉新成本的支出;
【I→P】: 用户在产生兴趣后首次进行购买(此步可用于参考用户行为分析)
【P→L】: 对应着运营的收割环节,即将前期推广引进的新客变现,以此回收拉新成本,具体体现在ROI。
这样,我们就可以将用户的浏览(A)、收藏+加购(I)、购买消费(P)划入到AIPL的各个流程中,便于我们根据不同的流转情况,对运营现状有整体的把握。
目前的数据是一维结构,为了方便进行复杂分析,需要对表结构进行【行列互换】(相当于将behavior动作具体分类显示),此操作通过【创建视图】来完成:
查询结果:(部分节选)
¨ AIP计算
因为AIPL中的“L”为用户的复购行为,需要单独计算。
所以这里先对A、I、P 阶段的行为进行统计,查询如图:
查询结果:
Ø L计算:
对于用户复购行为,计算思路是:
1) 通过【窗口函数】,将用户的每一次消费动作按时间顺序标号,即记录第n次消费
2) 有了每个用户的第n次消费记录字段后,即可将第一次消费 列为首次消费,而第二次开始的所有消费行为筛选出,皆为【复购消费】,统计复购消费为“L”即可
¨ 第N次消费计算:
如下语句,通过dense_rank() 窗口函数对对用户按每次消费时间进行排序,即可得到每个用户的第n次消费,将字段命名为 n_consume;并用查询语句新建视图consume
查询结果:(部分节选)
¨ 统计L行为
从consume中提取复购的次数,即 n_consume 大于1的行为都算进L中,查询如图:
查询结果:
根据前几步求出的AIPL值可得到如下的漏斗图来分析业务现状:
整体分析目的:找出用户运营存在的问题或特点,提出接下来的分析目标。
在整体分析→提出目标的过程中,应用【象限思维】,即按轻重缓急列出问题的重要性排序。有序地分析,才能将业务在有限资源的条件下选择分析结论进行落地实践。
一般来说,需要应用对比分析来判断用户运营结果的好坏,如同比、环比等,因此案例中缺少了相关数据,故无法使用对比分析,仅从业务经验出发进行判断。
回到此项目中,有了AIPL漏斗图后,我们便可直观地发现用户运营的情况:
1. 【拉新环节 A→I】 转化率仅为9%,较差,拉新完成率较低。将该问题列为优先级:重要紧急 P0;
2. 【收割之客户复购 P→L】 部分做得很好好,64%转化,可以据此总结业务经验或复购规律,进一步推广应用。将该事项列为优先级:重要不紧急 P1;
3. 【收割之客户首购 I→P 】部分效果还可以,23%转化,可以进一步挖掘用户购买转化路径。将该事项列为优先级:不重要不紧急 P2;
II. 分析原因
获得分析目标后,从实战落地角度,利用重要象限思维,对不同的分析目标,赋予不同的重要性程度,优先解决紧急的重要问题;再综合各种分析方法,以不同的维度透视数据,在数据中挖掘新的观点。
分析思路
此部分,需根据第一部分——明确问题中得出的分析目标,指定细分的分析策略:
1. 【P0: A→I 】部分是转化率低的问题,注重整体店铺运营策略的制定,在零售行业中,【人货场】分析是最常用且有效的分析方法,
2. 【P1: P→L】部分是用户复购表现很好,所以可以通过【用户复购分析】,挖掘、总结复购特征;
3. 【P2: I→P】部分目的在与进一步透析用户购买行为,可以采用【购买特征分析+ RFM模型】进行分析:对高购买率人群的特征进行挖掘分析,找到规律后应用到促进购买的环节;做RFM用户价值分析,针对价值人群进行有目的的精细的转化运营动作。
i. 【P0: A→I 】拉新环节 — 人货场分析
此部分通过【人货场】分析,解决认知用户(A)到兴趣用户(I)行为转化率低的问题。
【人货场】分析
¨ 人
【人】的部分主要在于观察用户行为特点,以总结经验。此案例中,因为数据维度有限,用户自身行为相关的数据除了商品外就是时间,而商品计划在【货】部分进行分析,故此部分可更具体转化为 分析用户A到I高效转化的时间特征。
¨ 各时段AI转化分布
如以下语句,结合group by 语句,即可计算各时段A→I转化情况。
A→I的转化率计算结果已得到,此时我们需要【比较的基准】(阈值),将现有的每小时转化率与阈值相比较,才能更明确的判断转化率高低。
这里,以常见的“平均值”作为对比的基准(阈值),查询语句如下:
得到结果如图所示:
分析结论:
因为每个时段的浏览人数不同,为确保分析的结果有效,所以需要选择浏览值大于平均值3734的时段来观察,同时,转化率大于平均值9.1%的时段,代表该时段浏览人数多且转化率高,从结果中可筛选出同时满足两个条件的时间段为:11时、15-17时、19时、22时、23时;其中,23时的转化率为10.1%,为同时满足这两个条件的时间段中的最大转化率,即为最佳投放时间。
¨ 货
人货匹配效率分析:商品推荐是否有效
目的:提高针对用户的商品推荐效率
在分析之前,需要先对A,I阶段涉及的总商品情况进行观察:
¨ 总商品数统计:
A阶段的商品数统计
I阶段的商品数统计:
查询结果:
结合【假设验证思维】,基于有效浏览与产生兴趣的商品数差异较大的情况,
提出假设:用户偏好的商品主要集中在少数商品,大部分商品被错误地推荐到用户。
验证思路:
1. 将被浏览最多的前100款商品 以及 用户最感兴趣(即加购、收藏)的前100款商品 进行交叉查询
2. 如果交叉出的商品数较少,则假设成立
(浏览量虽高,但用户并不感兴趣,推荐人群错误)
3. 反之,则假设不成立
按验证思路里说的,分别提取A(浏览量), I (用户感兴趣)的前100款单品交叉,查看交叉数量(inner join)
查询结果:
分析结论:
假设成立,用户偏好的商品主要集中在少数商品,大部分商品被错误地推荐到用户,人货匹配效率低。
s 场
【场】:除了用户行为以及商品之外的内容,广义来说指的是与用户的触点,
例如实体店的场地的布置;电商店铺页面的装修;活动的维度(场景),比如在特定的一个促销活动下; 在线上电商,则是在线店铺、平台、投放渠道等。
从这个角度,分析此段时间内是否有淘宝平台的活动对分析期间的销售产生影响:
1. 结合业务经验,数据时间段在双十一后,双十二前,即是两个大促的中间节点;
2. 进一步查询2021年双十二的相关信息如下:
• 活动:天猫双12年终品牌盛典
预热时间:2021年12月9日00:00:00-2021年12月11日23:59:59;
上线时间:2021年12月12日00:00:00-2017年12月14日23:59:59.
3. 由活动时间可知,分析时间段处于双十二预热时间前夕的低潮期,客观上营销效果整体比较平淡,进而影响AI转化率。
分析小结(A→I拉新环节)
应用【人货场】分析:
【人】:选择浏览量高且转化率高的时段对用户加大产品投放力度;满足浏览值>3734且转化率>9.1%,其中,23点转化率为10.1%,为最佳投放时间。
【货】:根据假设检验分析得到,目前人货匹配效率低,浏览量高的产品却并不是用户感兴趣的产品,平台大部分商品为长尾商品,商品被错误的推荐给非目标用户。
【场】:本次分析的时间段处于双十二预热时间前夕的低潮期,客观上一定程度影响AI转化率。
ii. 【P1: P→L】复购环节 — 复购分析
根据此前制定的分析思路,P→L部分计划进行【用户复购分析】以挖掘复购特征。
复购周期分析
目的:优化用户触达策略,即何时何地向哪些已购用户推送什么商品可提升复购率。将通过分析用户【复购周期】以解决业务中触达时间的问题。
现该问题转化为通过分析用户复购周期,以解决业务中何时触达、触达多久的问题。
(一) 何时触达
可通过计算用户平均回购周期,即可在用户发生购买行为后,在平均回购周期内对其进行营销触达。
为方便计算,这里我们新建一个记录用户第N次购买的视图取名为consume_dates
查询结果(部分节选):
计算步骤:
1. 通过以下语句先计算出每个用户每次消费的回购周期:
查询结果(部分节选):
结果说明:
如图,user_id 为100的用户 n_consume=2.回购周期=2天 即为期第二次消费时,与第一次消费间隔了2天,也就是说该用户在2天前进行了第一次消费。
2. 基于以上语句,可以将每人次的回购周期进行平均,取得最终的 平均回购周期 :
查询结果:
触达时间相关结论:
可在用户购买行为发生后的2-3天对用户进行触达。
(二) 触达多久
问题转换思路:
到底在联系顾客多久后,可以停止对该顾客的联系,即超过最长购买周期时间间隔后,证明用户已经大概率不会再回购了;所以这里可通过计算不同时段下购买的客户最长购买周期。先计算出每个顾客的最长消费间隔,再在其基础上求平均值。
计算思路:
a表记录每位用户第一次消费日期,b表记录每位用户最后一次的消费日期(max(dates),将两个时间进行datediff,即可求出每位用户的最长消费时间间隔,再在其基础上求用户的平均最长消费时间间隔。
计算步骤:
1. 统计每个客户“首次消费日期”、“最后消费日期”后,相减即可算得每个客户的消费周期,命名为“最长消费间隔”。
查询结果(部分节选):
2. 求用户的平均最长消费间隔(这里分两种方法)
1) 直接求所有用户的平均最长消费间隔
查询结果:
2) 基于1中语句,按日期进行分组,计算每天的客户平均最长消费间隔。
查询结果:
触达间隔相关结论:
顾客的平均最长处达间隔为4.4天;
在2021年11月25日周四这天,顾客的平均最长消费间隔最长,为5.7天。
分析小结(P→L复购环节)
用户复购周期分析:
1. 何时触达:顾客的平均回购周期是2.3天
2. 触达多久:顾客的平均最长触达间隔为4.4天,在2021年11月25日周四这天,顾客的平均最长消费间隔最长,为5.7天
iii. 【P2: I→P】购买环节 — 购买率特征&RFM分析
淘宝平台的用户复购率(P→L)高达64%,也就是说用户只要实现0到1的消费突破,接下来就有64%的机会复购,所以此部分重点应放在如何提升AI→P。
分析思路:
1. 总结高购买率客户特征:筛选潜在的转化用户,再通过促销优惠等方法刺激转化
2. RFM模型应用:对现有人群进行分层,针对不同类型的用户,采取更精准的营销方式
1. 用户首购特征
目的:提高AI客户的购买转化率P,促进用户实现0-1的消费突破。
思路:
通过购买率高低人群的对比,挖掘高购买率用户特征,得出不同的用户画像,通过RFM模型对用户进行分层后,给出不同人群价值的分布及对应人群价值升级的策略建议。
查询语句如下:
查询结果(部分节选):
购买率高 vs 购买率低
计算得到每个客户的购买率后,需要进一步定义高购买率和低购买率的界限;
结合【二八原则】,
认为前20%为高购买率客户,贡献80%的价值;后20%为低购买率客户。
为求得20%的客户,直接求得最后一名购买率,在其基础上*20%即可,查询语句如下:
由此前统计可知,分析数据共有为用户,即20%分位为:
• 328*0.2 =65.6.即前65位客户为高购买率客户;
• 328-65=263.即263-386位的客户为低购买率客户。
高购买率客户 购买率特征:
查询结果:
高购买率客户 品类集中度:(该人群共买了多少种商品品类)
查询结果:
低购买率客户 特征:
注意需剔除无购买人群影响
查询结果:
低购买率客户 品类集中度:
查询结果:
结论:
1. 高购买率用户平均浏览数33远小于低购买率用户平均浏览数185.高购买率用户的浏览更具有目的性。
2. 高购买率用户加购率11.7%大于低购买率用户9.5%,对所浏览商品更感兴趣。
3. 高购买率用户购买品类集中度360远大于低购买率用户137.购买品类更多元。
根据总结得到的人群画像结论:
高购买率人群:大概率为决策性用户,浏览商品数少,但加购率高,看准商品就下单购买
低购买率人群:纠结型顾客,浏览商品数很多单加购率低,看到商品会犹豫不决。
针对低购买率人群的建议:
品类集中度相对较高,可以列出这些品类,让运营更加有针对性的优化品类信息,减少用户浏览跳失率。
2. AIPL + RFM分析
为促进用户购买,需进行精细化用户运营,即可通过RFM模型实现。
RFM模型本质:对用户进行多指标的聚类。
分析思路:
先分别找到RFM在本项目中的对应含义,分别对RFM的值进行计算,定义RFM的比较标准——阈值(划分人群的标准),将之作为分类的依据,将人群细分。
由于数据限制,并无用户购买金额数据,故与AIPL模型结合,重新定义R、F、M:
• R:客户最近一次购买离分析日期的距离,用以判断购买用户活跃状态
• F:客户消费频次 →收藏、加购行为次数(A+I)
• M:客户消费金额 →购买行为次数(P+L)
因此,RFM分群结果及人群特征如下:
1. 重要价值用户(R高F高M高):用户处于购买活跃期,感兴趣商品多,购买次数多
2. 一般价值用户(R高F高M低):用户处于购买活跃期,感兴趣商品多,购买次数少
3. 重要发展用户(R高F低M高):用户处于购买活跃期,感兴趣商品少,购买次数多
4. 一般发展用户(R高F低M低):用户处于购买活跃期,感兴趣商品少,购买次数少
5. 重要唤回用户(R低F高M高):用户已不活跃,感兴趣商品多,购买次数也多
6. 一般唤回用户(R低F高M低):用户已不活跃,感兴趣商品多,购买次数少
7. 重要挽留用户(R低F低M高):用户已不活跃,感兴趣商品少,购买次数多
8. 一般挽留用户(R低F低M低):用户已不活跃,感兴趣商品少,购买次数少
计算步骤:
(1)按以上定义,计算出每个客户的R、F、M值:
查询结果(部分节选):
(2)为了划分R、F、M值的高 与低,这里采用常用的平均值法作为阈值(也可采用通过业务经验自定义阈值的方法)查询语句如下:
查询结果:
(3)根据以上RFM阈值,及RFM定义,将每个客户划分到不同的用户价值族群中。
其中,R值的定义是衡量用户的消费活跃程度,距离上一次消费越近,证明用户消费处于活跃状态;消费时间距离越近,意味着R值越小,对应的消费活跃的价值越大。
查询结果(部分节选):
(4)统计各个族群的用户数及用户占比,对用户运营现状分析,给出运营策略方向。
结论:
1. 重要型用户(M值高)累及占比为26.857%,符合二八原则,证明使用这个方法的分层逻辑是合理的
2. 从转化路径角度,重要价值用户占比较少,仅为7.426%,其中,RFM三项中只有一项与重要价值用户不同的为重要发展用户12.818%,一般价值用户3.967%,重要唤回用户3.154%,这三种是最可能转化为重要价值用户的类别。若想提高重要价值用户,可从这三类着手,其中,重要发展用户基数占比较多,可以优先对该人群进行营销,促使他们消费更多,进而转化为重要价值用户;一般价值用户与重要唤回用户基数较少,需要从其他类别补充人数,可以从基数较大的一般发展和一般挽留中转化升级为一般价值用户与重要唤回用户,再进一步使其成为重要价值用户。
III. 落地建议
将从不同维度得到的数据结论汇总到一起,在基于现有的业务单元给业务提建议。
通过AIPL营销模型,对用户现状有整体的认识,并分析、总结出三段分析目标。
现对分析结论结合业务场景总结经验及提出建议:
I. 【P0: A→I】【人货场】优化拉新
存在问题:从“认知awareness”到“兴趣interest”阶段的转化率过低
通过【人货场】分析,可得以下结论及业务建议:
【人】:(转化时间特征)选择浏览量高且转化率高的时段对用户加大产品投放力度;满足浏览值>3734且转化率>9.1%,其中,23点转化率为10.1%,为最佳投放时间。
业务建议:对于推广部门,优化投放策略,从A→I转化率高的时间点,尤其是23点,加大投放力度,提高AI转化率,进而提升整体的转化
【货】:(人货匹配效率)根据假设检验分析得到,目前人货匹配效率低,浏览量高的产品却并不是用户感兴趣的产品,平台大部分商品为长尾商品,商品被错误的推荐给非目标用户。
业务建议:对于产品部门,及时处理低转化率的商品,总结高转化率商品的产品特点去开发新品,进一步优化长尾商品以及大众商品的推荐逻辑。
【场】:(活动时间场景分析)本次分析的时间段处于双十二大促预热时间前夕的低潮期,客观上一定程度影响AI转化率。
业务建议:对于运营部门,针对转化率低的问题,可参考高转化商品的描述,优化产品标题、内容描述等;针对大促前夕的低潮期,额外的给出更多促销力度来促进用户活跃从而提高该阶段的销售。
II. 【P1: P→L】【复购分析】复制经验
业务现状:从“购买purchase”到“忠诚loyalty”阶段的转化率较高。
通过【用户复购分析】,给到用户运营部门的结论及业务建议:
1. 何时触达:顾客的平均回购周期是2.3天
业务建议:客户消费后2-3天,结合回馈手段及时进行触达
2. 触达多久:顾客的平均最长触达间隔为4.4天,在2021年11月25日周四这天,顾客的平均最长消费间隔最长,为5.7天
业务建议:距离顾客上一次消费后的4-5天内,重复1-2次触达,以确保顾客能接收到足够的营销刺激进而提升用户复购
III. 【P2: I→P】【购买特征+RFM】深入挖掘
现存问题:转化不高不低,表现较平,深入挖掘出有效策略进一步提高转化
i. 通过【购买特征分析】,给到用户运营部门的结论及业务建议:
人群画像结论:
高购买率人群:大概率为决策性用户,浏览商品数少,但加购率高,看准商品就下单购买。
低购买率人群:纠结型顾客,浏览商品数很多单加购率低,看到商品会犹豫不决。
针对高购买率客户的建议:
配合精准商品推荐模型,触达优质的长尾商品,提高购买率。
针对低购买率人群的建议:
触达热门商品,提高购买率。低购买率人群的品类集中度相对较高,可以列出这些品类,让运营更加有针对性的优化品类信息,减少用户浏览跳失率。
ii. 通过【AIPL+FRM模型分析】,给到用户运营部门的结论及业务建议:
结论:
1. 重要型用户(M值高)总占比为26.857%,符合二八原则,该方法的分层逻辑合理
2. 从转化路径角度,重要价值用户占比较少,仅为7.426%,其中,RFM三项中只有一项与重要价值用户不同的为重要发展用户12.818%,一般价值用户3.967%,重要唤回用户3.154%,这三种是最可能转化为重要价值用户的类别。
若提高重要价值用户,可从这三类着手,其中,重要发展用户基数占较多,可优先对该人群进行营销,促使他们消费更多,进而转化为重要价值用户;一般价值用户与重要唤回用户基数较少,需从其他类别补充人数,可从基数较大的一般发展用户中转化升级为一般价值用户与重要唤回用户,再进一步使其成为重要价值用户。
业务建议:
Ø 优先级P0:
s 重要价值用户(R高F高M高):用户处于购买活跃期,感兴趣的商品多,购买商品多;保持一定频率的触达,持续性维护该类用户。
s 重要发展用户(R高F低M高):用户处于购买活跃期,感兴趣商品少,购买次数多;可以通过关联算法,找出与兴趣商品关联高的商品继续推荐触达,提高用户收藏加购,进而转化为重要价值用户。
s 一般价值用户(R高F高M低):用户处于购买活跃期,感兴趣商品多,购买次数少;可与运营部门沟通,降低利润,给出折扣促进购买,进而转化为重要价值用户。
s 重要唤回用户(R低F高M高):用户已不活跃,但感兴趣商品多,购买次数也多; 对该人群进行营销,吸引该类用户的兴趣使其再进行消费。
Ø 优先级P1:
s 一般发展用户(R高F低M低):用户处于购买活跃期,感兴趣商品少,购买次数少;商品组合推荐的形式,提升连带和购买频次,转为一般价值用户。
快消品货源网提供超市货源信息,超市采购进货渠道。超市进货网提供成都食品批发,日用百货批发信息、微信淘宝网店超市采购信息和超市加盟信息.打造国内超市采购商与批发市场供应厂商搭建网上批发市场平台,是全国批发市场行业中电子商务权威性网站。
本文来源: 电商行业(淘宝为例)项目实战分析报告