知行编程网知行编程网  2022-07-04 04:00 知行编程网 隐藏边栏 |   抢沙发  31 
文章评分 0 次,平均分 0.0
1、项目背景与分析说明


1)项目背景


  网购已经成为人们生活不可或缺的一部分,本次项目基于淘宝app平台数据,通过相关指标对用户行为进行分析,从而探索用户相关行为模式。


2)数据和字段说明


  本文使用的数据集包含了2014.11.18到2014.12.18之间,淘宝App移动端一个月内的用户行为数据。该数据有12256906天记录,共6列数据。


  • user_id:用户身份

  • item_id:商品id

  • behavior_type:用户行为类型(包括点击、收藏、加入购物车、支付四种行为,分别用数字1、2、3、4表示)

  • user_geohash:地理位置

  • item_category:品类id(商品所属的分类)

  • time:用户行为发生的时间


3)分析的维度


  • 流量指标分析

  • 用户行为分析

  • 漏斗流失分析

  • 用户价值RFM分析


4)电商常用分析方法

用python分析1225万条淘宝数据,终于搞清楚了我的交易行为


5)什么是漏斗分析?


“漏斗分析”是一套流程式数据分析,它能够科学反映用户行为状态,以及从起点到终点各阶段用户转化率情况的一种重要分析模型。


用python分析1225万条淘宝数据,终于搞清楚了我的交易行为


2、导入相关库



3、数据预览、数据预处理



结果如下:

用python分析1225万条淘宝数据,终于搞清楚了我的交易行为


1)计算缺失率



结果如下:

用python分析1225万条淘宝数据,终于搞清楚了我的交易行为


2)删除地理位置这一列



3)处理时间time列,将该列拆分为date日期列,和hour小时列



结果如下:

用python分析1225万条淘宝数据,终于搞清楚了我的交易行为


4)将time、date列都变为标准日期格式,将hour列变为int格式



结果如下:

用python分析1225万条淘宝数据,终于搞清楚了我的交易行为


5)将数据按照time列,升序排列



解果如下:

用python分析1225万条淘宝数据,终于搞清楚了我的交易行为


6)删除原始索引,重新生成新的索引



结果如下:

用python分析1225万条淘宝数据,终于搞清楚了我的交易行为

知识点:注意reset_index()中传入参数drop的这种用法。


7)使用describe()函数查看数据的分布,这里使用了一个include参数,注意一下



结果如下:

用python分析1225万条淘宝数据,终于搞清楚了我的交易行为

知识点:注意describe()函数中传入参数include的用法。


8)对时间数据做一个概览



结果如下:

用python分析1225万条淘宝数据,终于搞清楚了我的交易行为


4、模型构建


1)流量指标的处理


pv:指的是页面总浏览量。每个用户每刷新一次网页,就会增加一次pv。

uv:指的是独立访客数。一台电脑一个ip也就是一个独立访客。实际分析中,我们都是认为每个人只使用一台电脑,即每一个独立访客代表一个用户。


① 总计pv和uv



结果如下:

用python分析1225万条淘宝数据,终于搞清楚了我的交易行为


结果分析:从图中可以看到,该网站页面的总浏览量为12256906次,该页面的独立访客数共有10000个。

② 日期维度下的uv和pv:uv表示页面总浏览量,pv表示独立访客数



结果如下:

用python分析1225万条淘宝数据,终于搞清楚了我的交易行为


绘图如下:

用python分析1225万条淘宝数据,终于搞清楚了我的交易行为


结果分析:从图中可以看出,pv和uv数据呈现高度的正相关。双12前后,pv和uv都在350000-400000之间波动,双十二的时候,页面访问量急剧上升,证明这次活动的效果很好。


③ 时间维度下的pv和uv



结果如下:

用python分析1225万条淘宝数据,终于搞清楚了我的交易行为


绘图如下:

用python分析1225万条淘宝数据,终于搞清楚了我的交易行为


结果分析:从图中可以看出,晚上22:00-凌晨5:00,页面的访问用户数量和访问量逐渐降低,该时间段很多人都是处在休息之中。而从早上6:00-10:00用户数量逐渐呈现上升趋势,10:00-18:00有一个比较平稳的状态,这个时间段是正常的上班时间。但是18:00以后,一直到晚上22:00,用户剧烈激增,一直达到一天中访问用户数的最大值。运营人员可以参考用户的活跃时间段,采取一些促销活动。


2)用户行为指标

① 总计点击、收藏、添加购物车、支付用户的情况



结果如下:

用python分析1225万条淘宝数据,终于搞清楚了我的交易行为


结果分析:从图中可以看到,用户进行页面点击–>收藏和加如购物车–>支付,逐渐呈现下降趋势。关于这方面的分析,将在下面的漏斗图中继续更为深入的说明。


② 日期维度下,点击、收藏、添加购物车、支付用户的情况



结果如下:

用python分析1225万条淘宝数据,终于搞清楚了我的交易行为


绘图如下:

用python分析1225万条淘宝数据,终于搞清楚了我的交易行为


③ 时间维度下,点击、收藏、添加购物车、支付用户的情况



结果如下:

用python分析1225万条淘宝数据,终于搞清楚了我的交易行为


绘图如下:

用python分析1225万条淘宝数据,终于搞清楚了我的交易行为


④ 支付次数前10的用户行为细分



结果如下:

用python分析1225万条淘宝数据,终于搞清楚了我的交易行为


绘图如下:

用python分析1225万条淘宝数据,终于搞清楚了我的交易行为


结果分析:通过这个分析,我们可以看出,购买次数最多的用户,点击、收藏、加入购车的次数不一定是最多的,


⑤ ARPPU分析:平均每用户收入,即可通过“总收入/AU” 计算得出



结果如下:

用python分析1225万条淘宝数据,终于搞清楚了我的交易行为


绘图如下:

用python分析1225万条淘宝数据,终于搞清楚了我的交易行为


⑥ 日ARPU分析:表示的是平均每用户收入。ARPU = 总收入/AU得到



结果如下:

用python分析1225万条淘宝数据,终于搞清楚了我的交易行为


绘图如下:

用python分析1225万条淘宝数据,终于搞清楚了我的交易行为


⑦ 付费率PUR = APA/AU,这里用【消费人数 / 活跃用户人数】代替



结果如下:

用python分析1225万条淘宝数据,终于搞清楚了我的交易行为


⑧ 复购情况分析(复购率)



结果如下:

用python分析1225万条淘宝数据,终于搞清楚了我的交易行为


3)漏斗分析



结果如下:

用python分析1225万条淘宝数据,终于搞清楚了我的交易行为


绘图如下:

用python分析1225万条淘宝数据,终于搞清楚了我的交易行为


结果分析:由于收藏和加入购车都是有购买意向的一种用户行为,切不分先后顺序,因此我们将其合并看作一个阶段。从上面的漏斗图和funnel表可以看出,从浏览到具有购买意向(收藏和加入购物车),只有5%的转化率,但是到了真正到购买的转化率只有1%,再看“单一转化率”,从具有购买意向到真正购买的转化率达到了20%。说明从浏览到进行收藏和加入购物车的阶段,是指标提升的重要环节。


4)客户价值分析(RFM分析)



结果如下:




本篇文章来源于: 菜鸟学Python

本文为原创文章,版权归所有,欢迎分享本文,转载请保留出处!

知行编程网
知行编程网 关注:1    粉丝:1
这个人很懒,什么都没写

发表评论

表情 格式 链接 私密 签到
扫一扫二维码分享