这个问题要拆分成两方面来说。因为不同场景,对于数据分析的需要程度是不同的,需要的能力各不相同。
第一种:
有一部分人只是需要在一些工作中,分析部分数据,从而指导自己工作,为之后计划做支撑,这种类型的数据分析,薅一些数据分析的皮毛即可。
一、夯实基础常识——建立数据分析概念
在夯基础阶段,你需要学习统计学相关知识,这些知识点一般在一些入门书籍、学习网站就可以get到:
有哪些好的数据分析、大数据、数据挖掘的网站或数据学习网站?https://www.zhihu.com/question/34444491/answer/536851245
有哪些你看了以后大呼过瘾的数据分析书?https://www.zhihu.com/question/60241622/answer/581029698
二、了解常用的方法论——形成数据分析的思维
什么是数据分析方法论?方法论是从宏观角度出发,从管理和业务的角度提出的分析框架,指导我们接下来具体分析的方向。
1、SWOT分析法
从优势(Strength)、劣势(Weakness)、机遇(Opportunity)、威胁(Threat)四个方面分析内外环境,适用于宏观分析。运用这种方法,可以对研究对象所处的情景进行全面、系统、准确的研究,从而根据研究结果制定相应的发展战略、计划以及对策等。
2、PEST分析法
PEST 为一种企业所处宏观环境分析模型,从政治(Politics)、经济(Economy)、社会(Society)、技术(Technology)四个方面分析内外环境,适用于宏观分析。PEST分析与外部总体环境的因素互相结合就可归纳出SWOT分析中的机会与威胁。PEST/PESTLE、SWOT 与 SLEPT 可以作为企业与环境分析的基础工具。
3、AARRR海盗模型
一种以用户为中心的着眼于转化率的漏斗型的数据收集测量模型,从获取(Acquisition)、激活(Activition)、留存(Retention)、收益(Revenue)和推荐(Referral)5个环节增长。
AARRR在应用推广运营各个层次(各个阶段)需要关注的一些指标。在整个AARRR模型中,这些量化指标都具有很重要的地位,而且很多指标的影响力是跨多个层次的。及时准确地获取这些指标的具体数据,对于应用的成功运营是必不可少的。
三、掌握常用的分析方法——培养数据分析习惯
1、趋势分析
看数字、看趋势是最基础展示数据信息的方式。在数据分析中,我们可以通过直观的数字或趋势图表,迅速了解例如市场的走势、订单的数量、业绩完成的情况等等,从而直观的吸收数据信息,有助于决策的准确性和实时性。
通常我们在数据分析产品中建立一张数据指标图、线图或者柱状图,然后持续观察,重点关注异常值:
2、多维分解
多维分解是指从业务需求出发,将指标从多个维度进行拆分。为什么需要进行多维拆解?有时候一个非常笼统或者最终的指标你是看不出什么问题来的,但是进行拆分之后,很多细节问题就会浮现出来。
比如,在分析物料不良率影响因素时,监控各来源渠道的物料不良率:
比如,某品牌服装门店将月度销售数量按照不同类型、不同大小进行拆分统计,监控不同款式的销售效果:
3、漏斗分析
漏斗分析是一套流程式数据分析,绝大部分商业变现的流程,都可以归纳为漏斗。漏斗分析是我们最常见的数据分析手段之一,无论是注册转化漏斗,还是商品下单的漏斗。通过漏斗分析可以从先到后还原用户转化的路径,分析每一个转化节点的效率。
其中,我们往往关注三个要点:
- 第一,从开始到结尾,整体的转化效率是多少?
- 第二,每一步的转化率是多少?
- 第三,哪一步流失最多,原因在什么地方?流失的用户符合哪些特征?
漏斗分析要注意的两个要点:
- 第一,不但要看总体的转化率,还要关注转化过程每一步的转化率;
- 第二,漏斗分析也需要进行多维度拆解,拆解之后可能会发现不同维度下的转化率也有很大差异。
4、对比分析
多变量进行对比时,一般会用到对比分析。对比分析也有很多种:
静态对比:同一时间条件下对不同总体指标进行比较,如不同部门、不同地区、不同国家的比较,也叫“横比”。比如:OPPO(南京)跟踪订货量,将订货量细分为城南、雨花区等各个区域进行对比监控,以便后期销售量复盘时,精细化分析数据支撑下一季度的布局。
动态对比:同一总体条件下对不同时期指标数据的比较,也叫“纵比”。
除此之外,在特定行业,比如互联网行业,常用的数据分析方法还包括用户分群、留存分析、用户细查、A/B测试等等。
第二种:
专业的数据分析师能力从以下四个层次展开说:
一、需求层
需求层是最重要的,需求是数据分析的开始,也是你要分析的目标方向。
数据分析需求的来源往往有3种场景:
- 监控到现有的指标出现了异常情况需要通过数据分析去找原因;
- 公司要对现有的运营模式或者某个产品进行评估确定是否需要进行调整或者优化;
- 公司下达了战略目标或短期目标需要通过分析看如何达成。
要确定需求就必须与需求方进行沟通,清楚的确认需求的内容或者自己要分析前必须要清楚你想要的结果是什么方向。
举个简单的例子:年底将近,双十一大促销在即,数据分析师们又到了一年最辛苦,最悲催的时间段。然而,有多少无意义的加班,是因为业务部门不会提需求所导致的。需求提的不合理,业务部门看了不解决问题,就会反反复复的再提需求。导致数据分析师们辛苦加班还不落好,背上一个:“分析没深度啊!”的坏名声。其实这不能怪需求方不会提需求,而是你作为数据分析人员要用你的经验,你的专业技能,你的沟通技巧去引导,去确定,去达成一致。
所以要做到清晰的确定需求,你需要自身具备:
- 对业务、产品、需求背景有比较深的了解。了解的足够对你才能去引导去判断这个需求;
- 光了解需求方是还不够的,你需要从获得的需求快速的去结合你所掌握的技能组工具有个初步的分析思路;
- 综合判断后你再决定是否需要分析,应该怎么分析,与需求方沟通确定清楚两方理解是否一致。
如果无法做到就会出现很多无法避免的问题。
理论上数据分析师所从事的工作是给出业务方相应的数据结果,而不是解决方案。虽然也有分析两个字,但是如何设计解决方案是业务部门的事。运营部门就该做活动方案,产品经理就该出产品方案,销售部门就该想东西怎么卖。但是当下专业的数据分析师是需要比业务方更了解业务,你不了解业务下的结论领导或者需求方敢信任吗?所以,一个业务技术双精通的数据分析师,是可以替业务方搞定上边所有问题的,不依赖业务方的判断,因为他自己就是个业务高手,有丰富的实战经验与业务能力。
但这种人是可遇不可求的。大部分数据分析师还是花70%时间处理数据的技术男。
在需求层我总结一下我们所需要具备的能力:
- 对业务、产品、需求背景有足够的了解,如果不了解说明你在这块应该先去充充电;
- 然后当你无法想到分析方法的时候说明你对现有的数据不够了解。你同样该去了解了解数据的来源,数据的流转,数据的定义。
二、数据层
目标需求确定过后,现在的你就需要开始准备相关的数据了。数据层大致分为:数据获取、数据清洗、数据整理。数据应该从哪来呢?数据来源取决于你分析需求,有通过各统计网站进行数据下载(有哪些好的数据来源或者大数据平台?、有哪些「神奇」的数据获取方式?),有通过爬虫技术在互联网进行数据抓取,也有通过企业已经加工好的数据报表、有直接从企业数据库通过SQL进行取数。
通过数据库你能做到excel所无法做到的多样性及细节化,你才能通过这些详细的数据找出数据背后存在的问题。
现在的数据库主要分为关系类型数据,分布式数据库。关系类型数据代表产品为mysql(免费开源的),分布式数据库代表hadoop。两种都是实用sql语言进行数据提取,在数据分析中你将提取出来与分析相关的数据这步就是数据获取。这里你需要具备基础的sql语言能力,要从海量的数据中找到你想要的部分。这个环节你也能对数据进行初步的清理,这里取决于数据库中的数据存储是否完整规范。
当你数据清理好也整理好后就可以开始进行数据分析了。
三、分析层
分析的工具有很多,平民版的分析工具有excel、非专业的专业分析工具有spss、专业资深的分析工作有sas/R/python。
分析的思路一般来说都是“由浅到深”,分为几个步骤:描述分析——锁定方向——建模分析——模型测试——迭代优化——模型加载——洞察结论。
描述分析是最基本的分析统计方法,在实际工作中也是应用最广的分析方法。分为两大部分:数据描述和指标统计。数据描述:用来对数据进行基本情况的刻画,包括:数据总数、时间跨度、时间粒度、空间范围、空间粒度、数据来源等。如果是建模,那么还要看数据的极值、分布、离散度等内容。 指标统计:用来作报告,分析实际情况的数据指标,可粗略分为四大类:变化、分布、对比、预测。说了太多了,就不展开了。
洞察结论这一步是数据报告的核心,也是最能看出数据分析师水平的部分。一个年轻的分析师和一个年迈的分析师拿到同样的图表,完全有可能解读出不同的内容。
举个例子:
年轻的分析师:2013年1月销售额同比上升60%,迎来开门红。2月销售额有所下降,3月大幅回升,4月持续增长。
年迈的分析师:2013年1月、2月销售额去除春节因素后,1月实际同比上升20%,2月实际同比上升14%,3月、4月销售额持续增长。
看到两者的区别了吗?2013年春节在2月,2012年则在1月,因此需要各去除一周的销售额,再进行比较。如果不考虑这一因素,那么后续得出的所有结论都是错的。挖掘数字变化背后的真正影响因素,才是洞察的目标。
四、输出层
都到这一步了,相信各位对数据报告也不再陌生了。这一步中,需要保证的是数据报告内容的完整性。一个完整的数据报告,应至少包含以下六块内容:报告背景、报告目的、数据来源、数量等基本情况、分页图表内容及本页结论、各部分小结及最终总结、下一步策略或对趋势的预测;
其中,背景和目的决定了你的报告逻辑(解决什么问题);数据基本情况告诉对方你用了什么样的数据,可信度如何;分页内容需要按照一定的逻辑来构建,目标仍然是解决报告目的中的问题;小结及总结必不可少;下一步策略或对趋势的预测能为你的报告加分。
注:文中数据图表皆通过简道云仪表盘制作。
转载:https://blog.csdn.net/BeWorkingMan/article/details/125853535