一、提出问题
1、客户转化率(购买转化率、加购转化率、喜欢转化率)是多少,提出降低客户流失的建议?
2、客户最喜欢的商品类别前10名分别是哪些,从该类商品中得出什么信息?
3、客户每天的活跃时间段分布情况,并根据数据表现给业务部门提出有效信息。
二、理解数据
1、数据集介绍:
本数据集(UserBehavior.csv)包含了2017年11月25日至2017年12月3日之间,有行为的约一百万随机用户的所有行为(行为包括点击、购买、加购、喜欢)。数据集的组织形式和MovieLens-20M类似,即数据集的每一行表示一条用户行为,由用户ID、商品ID、商品类目ID、行为类型和时间戳组成,并以逗号分隔。
2、数据集字段:
注意:用户行为类型共四种,它们分别是
关于数据集规模的一些说明如下
3、数据来源
阿里巴巴天池
User Behavior Data from Taobao for Recommendation-数据集-阿里云天池tianchi.aliyun.com/dataset/dataDetail?dataId=649&userId=1
4、提取数据
使用Navicat在MySQL数据框中创建表userbehavior,然后将100万条数据导入表中
5、分析维度:客户(数量及行为)、商品、时间。
三、数据清洗
1、列名重命名
原数据集没有表头,在导入数据前先用SQL创建表格,建立表名。
2、数据类型转换
将字段时间戳数据转换成日期数据,在SQL中使用函数:
select from_unixtime(时间戳) from userbehavior;
3、更新数据
在原表中更新时间戳数据为日期数据
4、提取日期数据中的小时
四、数据可视化
(1)
(2)
(3)
五、数据可视化得出的结论
1、客户转化率(购买转化率、加购转化率、喜欢转化率)是多少,提出降低客户流失的建议?
市场上电商行业的平均成交转化率为3%,而该店家的转化率为2.27%,低于行业平均水平。
根据圆环图可知,客户的点击商品行为占据90%,说明大部分客户仍停留在激活阶段,并没有产生实际购买行为,应该从网站品牌、商品吸引力、客户服务、用户行为、访问者质量、用户体验六方面进行改进。
2、客户最喜欢的商品类别前10名分别是哪些,从该类商品中得出什么信息?
由图可知,前十种类型的商品销售量很好,因此:
(1)在进货时,要根据历史每日售量数据表现,针对性该类型商品多进货物,预防出现供不应求;
(2)多维度研究前十名类型商品的宣传手法、营销技巧、商品属性等因素,给其他售量低的类型商品提供学习与借鉴。
3、客户每天的活跃时间段分布情况,并根据数据表现给业务部门提出有效信息。
由曲线图可知,
(1)时间段:0-6(点),客户活跃数量保持平稳的最低值,因为属于人们在睡觉休息时间;
(2)时间段:6-10(点),客户活跃数量持续上升,因为人们睡醒后,陆续开始一天的生活;
(3)时间段:10-18(点),客户活跃数量基本保持平稳;
(4)时间段:19-22(点),客户活跃数量开始快速上升,在21-22点到达一天最高值,因为属于下班自由时间段,刷手机的高峰期;
(5)时间段:22-24(点):客户活跃数量在22点之后迅速下降,这个时间段人们都开始进入休息。
从中可得出结论,在休息时间段:0-6(点)和22-24(点),不适合进行促销、新品的广告推送;在21-22(点),客户活跃数量最高值期间,适合各种宣传和商品推送,激活客户;
乐发网超市批发网提供超市货源信息,超市采购进货渠道。超市进货网提供成都食品批发,日用百货批发信息、微信淘宝网店超市采购信息和超市加盟信息.打造国内超市采购商与批发市场供应厂商搭建网上批发市场平台,是全国批发市场行业中电子商务权威性网站。
本文来源: 淘宝店铺的数据分析