下面给大家介绍一个实战业务案例,主题是基于人、货、场的电商平台数据分析,分析的思路非常清晰,可视化报告的部分做的也很棒,非常具有学习价值。
一、场景介绍
业务背景介绍:小风是一名刚入职的BI工程师,在试用期结束期间,导师拿着一份电商数据给到小风,要求其给出合理分析结果
分析目的:小风通过分析电商平台两年内的销售情况和发展情况,找出平台发展对应结论,并给出相应改善建议。
分析工具:FineBI(拉到文底)
二、分析思路
首先我们明确这次分析的目的对于电商平台相关数据,分析发现问题并给出相关建议,决定从传统的人,货,场角度进行分析。
场的维度我们分析平台销售的健康情况和销售分布情况,接着我们通过货品分析,了解到该平台品类销售情况和产品的价格带在哪个位置,以此可以进行ABC分类的优化和了解平台产品定位
接着会员分析,我们了解到会员的增长趋势和会员的分布情况,发现会员也大量分布在巴西沿海,同时我们还通过AARRR模型和RFM模型了解到会员转化率情况及消费属性
其他分析-物流分析,最终分析了该平台的物流情况,发现物流不准时占比偏高,物流时间也偏长,但同时物流费用占比订单费用偏高,人们的消费和收到的服务不成正比,
整体分析脑图如下所示:
三、数据整理
数据内容:基础数据表主要为以下9张,如下图所示,AAARR模型表,巴西各州辅助表,表关系,地区经纬度表是我通过其他途径获得的辅助数据表
数据整理过程:
1、以Olist_order_dataset为核心表,链接各维度表,创建订单核心各维度聚合宽表。其表间血缘关系如下所示。
2、选取订单核心表,通过左右合并依次和各维度表进行合并
3、增加过滤只需要2017年至2018年的数据
4、新增列是否准时 通过预期物流到货时间和实际到货时间比较
5、新增列新老会员
6、订单核心各维度聚合宽表创建完毕,其雪花模型如下所示。
接下来是主要宽表和RFM模型表制作:
1、首先取订单核心各维度聚合宽表对应字段。
2、新增列,距今消费时间天数,后续可计算平均消费时间天数,并以此判断R值
同理,通过会员消费频次,计算平均会员频次,比以此进行F值计算
同理,通过会员消费金额,计算平均会员消费金额,并以此进行M值计算。
c、合并RFM,对R,F,M进行拼接
d、通过IF函数对RFM进行中文定义
至此相关数据处理完毕,数据整理告一段落。
四、数据分析报告
整体框架:整体排版按照故事的叙事来进行排版,具体为如下板块,任务背景,明确目的->“场”分析->“货”分析->”人”分析->其他分析->总结建议。
图表选择:图表选择可以看这张图,了解下每种图偏向的分析内容。
场分析:通过季销售趋势图及环比,还有各州金额分布分析了解平台销售走势和销售分布,了解平台销售是否健康及销售重点区域。
1)发现相较2017年,2018年的销售金额和销售量呈环比上升趋势,最近两季度略微下降,趋向平稳。平台客单价在175Reals/单浮动。说明平台整体的态势还是向上发展的。
2)了解到订单来源主要来自巴西沿海各州,其中圣保罗州,里约热内卢州,米纳斯吉拉斯州为订单量产出州TOP3,而反观巴西内地产出偏低,小风猜测这也许巴西经济中心集中在沿海各州有关。
货分析:通过帕累托分析品类销售情况,散点图探究品类宽度和销售关系,再通过价格带分析,了解平台产品定位。通过评价占比了解产品满意情况,通过产品完整性分析验证猜测。
人分析:分析平台会员走势了解平台会员健康情况,通过地图分布了解会员分布情况,通过AARRR模型了解会员转化率,通过环形图了解新老会员销售情况。
利用RFM模型给会员分层并确定重要价值客户分布。利用会员行为分析了解会员下单时间,付费方式和平均付款时间,还知道会员低分占比及评论时间趋向。
- 发现2017年至2018年会员总体呈上升趋势,但2018年第三季度呈现下滑状态。
- 通过会员各州分布和城市分布发现,会员主要集中在圣保罗州,里约热内卢州,主要分布城市为sao paulo riode janeiro
- 一般电商模型为AARRR模型,发现平台转化率在98%左右。
其他分析:通过物流准时度分析,物流时间占订单时间分析,平均物流天数分析,物流运费金额在总金额的占比,来评估顾客物流服务投入产出比,通过低评的非准时占比和物流时间来验证猜测。
- 顾客对物流服务的投入产出比低下,造成较大不满
- 低评确实是由物流因素引起
作品展示:
关于上述FineBI数据分析工具的获取方式,看下方!
转载:https://blog.csdn.net/u014514254/article/details/113591726