木东导读:能解决问题的方案往往未必是最复杂的方案,而是最容易理解和实践的方案。本篇文章在DAU预测这件事上的方案很简单,但是很实用也很容易理解。因此木东在这里分享给大家,希望能对各种数据朋友有所帮助!
各位托尼和简妮,大家好,变成狗剩儿和翠花儿是不是也挺温馨的?不管叫什么名字,咱们回家是不是都应该好好学习一下?
今天我们就来聊点看似土里土气的东西:如何使用EXCEL—看到这儿,估计流失了60%的PV了,继续看下去的80%赚了—如何使用EXCEL进行深度数据分析。呃,是不是干货?自己判断吧!
关键字:APP推广、活跃用户(MAU/WAU/DAU)、EXCEL、幂函数/指数函数/对数函数/indirect函数
适用范围:APP推广、预算制定、效果评估
应用场景:
老板:这个App做得不错,明年给你几千万推广一下, 到年底活跃用户能达到多少?
Tony经理: 呃……几百万吧?
老板:几百万是几百万?
Tony经理:具体到多少不好说。
老板:G-U-N~~~~
如果:
---你是这位老板,手下人说算不出来,拿这篇文章去扣他年终奖吧!
---你是这位Tony,得压着下面的人算吧?下面的人也说算不出来?拿着这篇文章去扣他绩效吧!
---你就是这位干活的哥们/姐们,还不赶紧好好研读一下?
闲话少叙,进入正题:
一、影响DAU/MAU的主要因子是什么?
我们先来看一个APP的DAU变化趋势,如下图,可以明显的分成三个阶段:从1月中到2月底,DAU有一个上升的趋势;但是接下来的一段时间,DAU停滞不前了;从四月中下旬开始,又开始上升。
这说明一个什么问题呢?用脚趾头想一下,当新进来的用户大于流失的用户时,活跃用户上升;持平时,DAU基本稳定。问题的关键在于,随着用户的累积,流失的用户越来越多。但是,定量关系如何?具体有多少留存率了多少流失了?着急就对了,这正是我们要解答的问题。
回答这个问题之前,我们来梳理一下一个app的用户从无到有的用户变化过程。
假设某APP, 元旦发版,当天新增了10000用户,这批用户1月2日活跃了6000,自然引出次日留存率的概念,为60%;1月3日活跃了5千,也就是2日后的留存率为50%;…;30日后的留存率为6.5%。如下:
紧接着,1月2日又新增了20000用户,留存情况如下:
以此类推,不赘述。
Attention, 关键的步骤来了。
这个APP 1月1日发布,每天都有新增,每天也有流失(或沉默),到1月8日的时候,活跃用户能达到多少?
1月8日的DAU是多少呢?开始是竖着看的,现在换个角度横着看呗!不用我再费口舌了吧?
装逼一下,写成公式就是这样:
其中,各个指标的含义如下:
到这里,我们的第一个问题就回答清楚了:影响DAU的主要因子,是过去N日每一天的新增用户,以及每一天的用户在第N日的留存率。
提炼一下就是两个大指标:新增用户和留存率。
有人会说,新增用户可以受到很多条件的影响,比如最直接的付费推广。同样,留存率的影响也会受到诸多因素的影响,比如产品本身的改进等。能这么想说明你在思考了。但是,不管采用什么手段,最终的DAU都是通过新增和留存这两个指标产生变化的。
找到了新增和留存这两类指标,如何量化他们与活跃用户的关系呢?
一、如何量化新增、留存和DAU的关系?
我们回到前面老板的问题:假如给你一个亿,到年底APP的DAU能达到多少?
一般而言,市场上买量的价格是相对固定的,比如按照激活付费(具体价格视包的大小、app类型、人群等指标而定,问你们家BD吧)。也就是说,新增和银子是直接的对应关系。因此,要回答老板的问题,给定了预算,你能买回来的新增用户就基本定下来了。
我们接着看公式。为了彰显重要性,我们拉长时间段,再贴一下这个公式:
DAU(12.31)=New(12.31)+New(12.30)*1-DR+New(12.29)*2-DR+New(12.28) *3-DR+……+New(1.1)*364-DR
验算之前,请允许我先说点常识。任何一个模型,它都是有若干前提或假设条件的。这一点能达成共识吧?比如经济学上的理性人假设等。我们这个模型需要用现有的数据去预估未来的数据,最起码的一个假设是:短期内留存率不会发生太大的变动。(有波动也是有办法计算的,有红包就有办法。呵呵。)
有了计算公式,我们来看一下数据源。国内,友盟是使用最广泛的第三方统计平台,就以友盟为例(各平台主要指标大同小异)。(老板别紧张,向习大大保证没有泄密,图片来自百度搜索)。
我们看到,友盟在留存率上只提供9个点的数据。如果以月为维度,可见的是1-9月的留存率;以天为维度的话,那就是1-7日的留存率、14日的留存率、30日的留存率。
根据上面的公式,我们需要知道的是过去N日的新增,以及每一天的新增在第N日的留存率,还记得吧?过去N日的新增,每一天都可以从友盟看到。问题是我们只有9个点的留存数据。
那么,如何根据已有的点去推算剩下那些天的留存率呢?很简单,EXCEL教你1分钟搞定。
第一步:用现有的数据做散点图:
看完这个图,你能想到什么?我们有理由相信:8-13天的留存率是介于第7天和第14天的留存率之间,对吧?(如果不是,要么是量太少了留存率波动太大,要么是通过活动等手段刺激了活跃。这里不讨论。)
可是,具体量化是多少呢?往下看!
第二步:右键添加趋势线,选择拟合度最高的线形
从经验数据看,笔者接触的APP的留存率曲线,符合对数函数和指数函数的居多。
常识告诉我们,数据点越多,拟合的效果越好。如果有条件,可以用自己的服务器跑一跑更长期一点的留存率数据,再用多个数据点拟合曲线。
有了上图中的函数,就可以方便的计算空缺点的留存率数据了。
什么,这都不会?还好意思不给我发个红包?
写到这里,主要的思路和方法就说完了。猫给老虎当师傅的例子涌上心头,我要不要留一手呢?看在过年…和红包, 的份上,就倾囊相授吧。
如果已经看到了这儿,请继续往下,因为接下来是重点。
第三步:Excel如何变成大杀器
直接上结果先:
鉴于保密及各种原因,我只能把初级阶段的成果展示出来,上图大概是此模型的2.3版本吧(5.0版本如果贴出来现老板肯定会炒了我的)。
这个版本实现的功能:在给定未来一段时间新增的情况下(左边数字),按照一定的留存率水平,直接计算出未来这段时期内每一天DAU能够达到的水平(右边折线图)。
In a nutshell, 控制新增用户(通过控制推广费用),就能直接计算出每一天的DAU。
当然,重要的还是计算过程。核心计算过程如下:
如上图:10月15日的实际活跃用户是11万,估算出来的是11.2万,误差为1.81%。
估算的过程:红色框中的数字是根据其后的蓝色框范围中的所有值的和。蓝色框中的每一个值,都是根据前面的留存率公式计算出来的。
具体如下图:
注意上图中右边红色方框:行和列的关系。举例说吧,10月14日新增14528,这14528个用户中10月15日活跃了6577;10月13日新增了13234,这13234个用户15日活跃了4446;以此类推。为什么?记得前面提到的第n日留存率的计算吗?
注意上图中的蓝色框。这个公式是提高效率的关键。把E列每一天的新增数据乘以第n日的留存率之后映射到10月15日所在的这一行。手动根本没法完成,即使你能想到这个完美的解决方案。
好了,干货就介绍完了。再补充一点:
关于留存。这里使用的是平均留存率。如果你的APP受季节性或者其他因素的影响,而每一个次月的留存率变化会比较大,为了更准确你可以每个月的数据都单独算一条曲线再估算缺失点的数据。相对麻烦一些,亲测可行。
作者简介:
梦想超群,曾混饭于咨询公司、游戏公司、互联网公司。性格内向,体格风骚。
转载:https://blog.csdn.net/zhaodedong/article/details/101805425