盘点：数据分析中最基本的分析方法

时间:2023-01-19 | 标签: | 作者:Q8 | 来源:网络

小提示：您能找到这篇{盘点：数据分析中最基本的分析方法}绝对不是偶然，我们能帮您找到潜在客户，解决您的困扰。如果您对本页介绍的盘点：数据分析中最基本的分析方法内容感兴趣，有相关需求意向欢迎拨打我们的服务热线，或留言咨询，我们将第一时间联系您！

编辑导语：在数据分析中，有各种各样的分析方法供我们使用。复杂的分析方法固然好用，但是日常工作中经常用到的还是基础的分析方法。本文作者为我们介绍了六种常见的分析方法，如果你能熟练的使用它们，相信能够解决许多的日常数据分析问题。

日常数据分析中，尤其是业务分析中，常用的分析方法论主要是几大类，本文会介绍我认为比较关键的六大类常用方法，熟练地混合交叉使用这六大类基本方法，80%的日常数据分析问题都能解决。

下面我会介绍这些方法有哪些，并且给出实例介绍如何使用这些方法。

一、多维分析

所谓多维分析就是细分分析，做多维分析首先要明确2个方向：维度和指标。

指标：指的是用来记录关键流程的，衡量目标的单位或方法，如DAU、留存率、转化率等。
维度：指的是观察指标的角度，如时间、来源渠道、地理位置、产品版本维度等。

多维分析，就是在多个维度拆解，观察对比维度细分下的指标。实现将一个综合指标细分，从而发现更多问题。

举个实际用途的例子，KPI拆解，制定明年的KPI目标：

第一步：指标拆解，商品营收=（新用户数+老用户数）商品订单转化率客单价；
第二步：对指标进行多维细分，新老用户可以再细分客群，比如孕妇群体、运动爱好者、学生、白领等；商品订单可以细分商品的类型、商品的价格、商品的供应商、商品的品牌影响力等；
第三步：根据历史业务发展情况，计算不同用户维度、不同商品维度下的商品营收；
第四步：求和不同用户维度、不同商品维度下的商品营收，即为商品总营收。

在越来越讲究精细化运营的今天，多维分析的作用越来越重要，管理层通常看的是综合指标，总值，但通常这些总值无法真正地发现问题。对于一线员工将总值拆解细分，才能发现问题，找到可落地的解决问题。

二、趋势分析

有对比才有分析，有对比数据才能产生意义，所以对比分析在实际数据分析中是非常重要的一种分析手段，最常用的是基于时间的对比分析。基于时间的对比分析，主要是指同一指标在不同时间周期的对比，主要分为同比、环比和定基比。

环比是指：与相邻的上一周期做对比，周期可以是时、日、周、月、季、年等。比如周环比，指的是本周与上一周的对比；
同比是指：两个周期同一个时间点的比较，目的是追踪周期性的变化；
定基比是指：和指定的时间基点对比。

举个数据例子：如2017年10月的月同比，指的是2017年10月和2016年10月做对比，而2017年10月的月环比，指的是2017年10月和上一周期2017年9月做对比。

三、转化分析法（漏斗分析）

转化分析也叫漏斗分析，主要是分析分析产品流程或关键节点的转化效果，常借助漏斗图展现转化效果。

漏斗图是一种外形类似漏斗的可视化图表，该方法可以直观追踪产品的整体流程，追踪业务的转化路径，追踪不同生命阶段下的用户群体表现。漏斗分析常用的场景主要有：

产品流程的关键路径转化追踪，比如电商常用的购买流程；
业务价值路径的转化流程追踪，比如常用的AARRR模型的价值转化追踪；
虚拟流程类指标追踪，比如按生命周期区分的不同生命周期阶段的用户流转形态追踪。

举个例子，针对AARRR模型转化场景：

AARRR是Acquisition、Activation、Retention、Revenue、Refer这五个单词的首字母缩写。它主要阐述的是用户从获取到激活，到留存，到产生营收，到口碑认可正向传播的一系列闭环效应。

我们可基于用户量计算出这些节点的转化率，从而判断哪些节点的转化率差，哪些节点还有优化的空间，再通过具体的运营手段来提升节点转化率。如下图中的活跃购买率仅33%，是否可以运营手段将其提升到40%呢？

四、公式拆解法

所谓公式拆解法，就是对目标变量用已知公式进行拆解，从而快速找到影响目标变量的因素。公式拆解法没有固定的标准，一个目标变量在不同的场景下或者说为解决不同问题，需要利用公式拆解的细致程度也不一样。

常见的公式拆解的场景有：

1. GMV计算

GMV = 下单用户量*客单价

=（新用户+留存用户+召回用户）*客单价

= （广告触达量 * 转化率 + 老用户*留存率 + 召回触达用户量 * 召回率）* （商品量*商品单价）

2. ROI计算

ROI = 收益/成本

=（销售单价*销售量）／（固定成本+可变成本）

（收益和成本也可以继续根据业务进行拆解）

3. DAU预估

A(n)：第n天的新增用户；R(n)：第n天的留存率

DAU(n) = A(n) + DAU(n-1) * R(1)

= A(n) + A(n-1) * R(1) + DAU(n-2) * R(2)

= A(n)+A(n-1)R(1)+A(n-2)R(2)+… …+A(1)R(n-1)

4. 净资产收益率ROE

ROE = 当前净利润／当期平均净权益

= 利润率 * 总资产周转率 *财务杠杆

= 净利润／销售收入 * 销售收入／总资产 * 总资产／权益

根据公式对目标变量拆解后，我们通常会对拆解后的变量做更精细的分析，并且提出可落地解决问题的解决手段。

如下图所示，这是电商／零食行业最常用的拆解解决问题的框架，为提升销售额，在实际解决问题中都要细化到广告拉新、用户分析、商品分析等层面。

五、综合评估法

综合评估法是将多个指标综合成一个指标评估的方法。这种方法是非常常见的，如我们日常中的蚂蚁信用分、微博热度、游戏战绩排名等都是基于综合评估法实现的。

综合评价法的特点表现为：

评价过程是通过一些特殊的方法，按指标的重要性对多指标加权，多个指标的评价是同时完成的，而非一个一个逐次完成的；
在多指标整合进行综合评价指标的过程中，会涉及权重的设定；
综合评价法生成的综合指标不再是单纯意义上的单个指标的意思，而是多个指标的综合反映。

因此，对于综合评估法，赋权是非常重要的环节。而赋权的方法可分为两类：主观评估法和客观评估法。客观评估法是指：变异系数、熵分析、主成分分析等；主观评估法是指：层次分析法、专家赋权等。

1. 变异系数法

变异系数等于样本标准差除以样本均值，是衡量样本观测值变异程度的变量。而且因为变异系数是除以了样本均值，所以他是忽略了量纲的影响。那具体如何用变异系数定权重呢，具体步骤可以看下面：

第一步：对于每一个指标计算变异系数cvcv_i=样本标准差/样本均值= /

第二步：计算各个指标最终的权重

基于以上的计算公式可以看出，对于变异系数法定义权重，如果一个指标可以明显区分不同的样本，那么就会有更高的权重；反之，如果样本在某个指标的表现上没有特别明显，即该指标区分样本的能力较弱，则应该给这个指标赋予比较小的权重。

2. 熵值法

熵的概念来源于热力学，后来被引入信息论，用以表示对不确定性的一种度量。信息熵一般用来反映信息量的大小，信息量越大，不确定性越小，熵就越小；反之，信息量越小，不确定性越大，则熵就越大。

信息熵的计算方式如下：

假设有随机变量X，对应的值分分别为x1, x2, …, xn对应的概率分别为pi，信息熵为：

具体基于信息熵计算权重的方法步骤如下：

第一步：计算指标的比重假设有n个样本，m个指标，xij为第i个样本第m个指标的值。因为不知道样本对应的具体指标的概率，可以用m指标下n样本对应的指标值占该指标总值的比率来表示。第xij指标的比重pij为：

第二步：计算第j项指标的熵值

第三步：计算各项指标的权重

第四步：计算各个样本的综合得分

计算出的综合得分是[0,1],可通过开根号再乘以100的方式，将其映射到[0，100]。

3. 层次分析法

层次分析法（AHP）是运筹学中的概念，是指将与决策总是有关的元素分解成目标、准则、方案等层次，在此基础之上进行定性和定量分析的决策方法。

如下所示，要计算总得分，可以将其拆解为质量、互动、消费、发布、附件这五个准则，对于这五个准则有再细分的方案。

那具体怎么定义权重，大体思路是：由专家分别在每一个准则的细分方案下，对细分方案两两之间评重要程度（如1-9，1是同等重要，9是一方极端重要）。

再基于重要程度，可通过层次分析法的计算公式计算出每个细分方案的权重；同理可对五个准则进行重要评估，从而计算出五个准则的权重。具体方法可百度，百度上有详细的计算公式。

六、结构化分析

所谓结构化分析，其实就是逻辑树和MECE的结合使用。

逻辑数是麦肯锡推佛山超市电子脉冲理疗仪方广的思考问题的工具，就是将目标问题像树一层一层拆解，最左边是“树根”（目标／问题的起点），朝右是将某已知问题的影响层当成已知问题的对数字营销的认识树枝，每多一个影响层，则添加一个树枝，直到列出已知问题的所有影响层为止。

且各逻辑树枝之间的关系需要“相互独立、完全穷尽”（MECE）。

结构化分析是非常好用的一种方法，它能将问题层层有序拆解，有助于思路清晰，同时可以将复杂问题由繁化简。下面以一个应用场景来举例说明：

比如要分析某App用户流失的原因，穷举用wiki传播户流失的影响因素，做出逻辑树。

虽说结构化分析非常好用，但是构建一个完美的框架（逻辑树）可不是一件容易事，一般构建结构框架有两种方法：自下而上和自上而下。

1. 自下而上

自下而上的意思是：先头脑风暴罗列可能的影响因素，再对罗列的影响因素归类分解形成框架。

下面以一个应用场景来举例说明，比如如何在2年内赚到100万元？

1）第一步：罗列要点

2）第二步：连线归类

一般是从时间、结构、重要性三个维度进行归类。

3）第三步：形成框架

4）第四步：检查是否有重复和遗漏

2. 自上而下

自上而下的意思是：已经有可套用解决的框架，将需要解决的问题按照框架拆解，最后形成针对目标问题的结构框架。现有的成熟的框架特别多，比如4P、4C、SWOT、PEST、5W2H等等。

3. 自上而下和自上而下对比

从上面的讲解很容易看出两种构建框架的区别，具体的对比整理如下，日常中可为了提高框架输出能力而有针对性的训练。

以上就是我要介绍的常用数据分析方法，掌握上述方法，我相信80%的数据分析问题都能得到合理的分析思路。但在实际场景中，很少仅用单一方法就能直接解决问题，大多数情况下都要综合上述方法中的多种方法才可。

比如电商场景下的如何提升销售额问题？就要用到公式法、转化分析法、多维分析法及结构分析法，经过这样一系列分解才能获得可落地化的解决方案（公式拆解法里贴的示例图就有比较详细的逻辑拆解过程）。

本文由 @须臾即永恒于，，

题图来自，基于 CC0 协议

上一篇：数据指标体系如何从构思到落地
下一篇：数据分析终极一问：自然增长率，到底怎么算才