导航:首页 > 研究方法 > 常见数据分析的方法有哪些

常见数据分析的方法有哪些

发布时间:2023-03-02 02:28:14

1. 16种常用的数据分析方法汇总

一、描述统计

描述性统计是指运用制表和分类,图形以及计筠概括性数据来描述数据的集中趋势、离散趋势、偏度、峰度。

1、缺失值填充:常用方法:剔除法、均值法、最小邻居法、比率回归法、决策树法。

2、正态性检验:很多统计方法都要求数值服从或近似服从正态分布,所以之前需要进行正态性检验。常用方法:非参数检验的K-量检验、P-P图、Q-Q图、W检验、动差法。

二、假设检验

1、参数检验

参数检验是在已知总体分布的条件下(一股要求总体服从正态分布)对一些主要的参数(如均值、百分数、方差、相关系数等)进行的检验 。

1)U验  使用条件:当样本含量n较大时,样本值符合正态分布

2)T检验 使用条件:当样本含量n较小时,样本值符合正态分布

A  单样本t检验:推断该样本来自的总体均数μ与已知的某一总体均数μ0 (常为理论值或标准值)有无差别;

B  配对样本t检验:当总体均数未知时,且两个样本可以配对,同对中的两者在可能会影响处理效果的各种条件方面扱为相似;

C 两独立样本t检验:无法找到在各方面极为相似的两样本作配对比较时使用。

2、非参数检验

非参数检验则不考虑总体分布是否已知,常常也不是针对总体参数,而是针对总体的某些一股性假设(如总体分布的位罝是否相同,总体分布是否正态)进行检验。

适用情况:顺序类型的数据资料,这类数据的分布形态一般是未知的。

A 虽然是连续数据,但总体分布形态未知或者非正态;

B 体分布虽然正态,数据也是连续类型,但样本容量极小,如10以下;

主要方法包括:卡方检验、秩和检验、二项检验、游程检验、K-量检验等。

三、信度分析

检査测量的可信度,例如调查问卷的真实性。

分类:

1、外在信度:不同时间测量时量表的一致性程度,常用方法重测信度

2、内在信度;每个量表是否测量到单一的概念,同时组成两表的内在体项一致性如何,常用方法分半信度。

四、列联表分析

用于分析离散变量或定型变量之间是否存在相关。

对于二维表,可进行卡方检验,对于三维表,可作Mentel-Hanszel分层分析。

列联表分析还包括配对计数资料的卡方检验、行列均为顺序变量的相关检验。

五、相关分析

研究现象之间是否存在某种依存关系,对具体有依存关系的现象探讨相关方向及相关程度。

1、单相关: 两个因素之间的相关关系叫单相关,即研究时只涉及一个自变量和一个因变量;

2、复相关 :三个或三个以上因素的相关关系叫复相关,即研究时涉及两个或两个以上的自变量和因变量相关;

3、偏相关:在某一现象与多种现象相关的场合,当假定其他变量不变时,其中两个变量之间的相关关系称为偏相关。

六、方差分析

使用条件:各样本须是相互独立的随机样本;各样本来自正态分布总体;各总体方差相等。

分类

1、单因素方差分析:一项试验只有一个影响因素,或者存在多个影响因素时,只分析一个因素与响应变量的关系

2、多因素有交互方差分析:一顼实验有多个影响因素,分析多个影响因素与响应变量的关系,同时考虑多个影响因素之间的关系

3、多因素无交互方差分析:分析多个影响因素与响应变量的关系,但是影响因素之间没有影响关系或忽略影响关系

4、协方差分祈:传统的方差分析存在明显的弊端,无法控制分析中存在的某些随机因素,使之影响了分祈结果的准确度。协方差分析主要是在排除了协变量的影响后再对修正后的主效应进行方差分析,是将线性回归与方差分析结合起来的一种分析方法,

七、回归分析

分类:

1、一元线性回归分析:只有一个自变量X与因变量Y有关,X与Y都必须是连续型变量,因变量y或其残差必须服从正态分布。

2、多元线性回归分析

使用条件:分析多个自变量与因变量Y的关系,X与Y都必须是连续型变量,因变量y或其残差必须服从正态分布 。

1)变呈筛选方式:选择最优回归方程的变里筛选法包括全横型法(CP法)、逐步回归法,向前引入法和向后剔除法

2)横型诊断方法:

A 残差检验: 观测值与估计值的差值要艰从正态分布

B 强影响点判断:寻找方式一般分为标准误差法、Mahalanobis距离法

C 共线性诊断:

诊断方式:容忍度、方差扩大因子法(又称膨胀系数VIF)、特征根判定法、条件指针CI、方差比例

处理方法:增加样本容量或选取另外的回归如主成分回归、岭回归等

3、Logistic回归分析

线性回归模型要求因变量是连续的正态分布变里,且自变量和因变量呈线性关系,而Logistic回归模型对因变量的分布没有要求,一般用于因变量是离散时的情况

分类:

Logistic回归模型有条件与非条件之分,条件Logistic回归模型和非条件Logistic回归模型的区别在于参数的估计是否用到了条件概率。

4、其他回归方法 非线性回归、有序回归、Probit回归、加权回归等

八、聚类分析

样本个体或指标变量按其具有的特性进行分类,寻找合理的度量事物相似性的统计量。

1、性质分类:

Q型聚类分析:对样本进行分类处理,又称样本聚类分祈 使用距离系数作为统计量衡量相似度,如欧式距离、极端距离、绝对距离等

R型聚类分析:对指标进行分类处理,又称指标聚类分析 使用相似系数作为统计量衡量相似度,相关系数、列联系数等

2、方法分类:

1)系统聚类法: 适用于小样本的样本聚类或指标聚类,一般用系统聚类法来聚类指标,又称分层聚类

2)逐步聚类法 :适用于大样本的样本聚类

3)其他聚类法 :两步聚类、K均值聚类等

九、判别分析

1、判别分析:根据已掌握的一批分类明确的样品建立判别函数,使产生错判的事例最少,进而对给定的一个新样品,判断它来自哪个总体

2、与聚类分析区别

1)聚类分析可以对样本逬行分类,也可以对指标进行分类;而判别分析只能对样本

2)聚类分析事先不知道事物的类别,也不知道分几类;而判别分析必须事先知道事物的类别,也知道分几类

3)聚类分析不需要分类的历史资料,而直接对样本进行分类;而判别分析需要分类历史资料去建立判别函数,然后才能对样本进行分类

3、进行分类 :

1)Fisher判别分析法 :

以距离为判别准则来分类,即样本与哪个类的距离最短就分到哪一类, 适用于两类判别;

以概率为判别准则来分类,即样本属于哪一类的概率最大就分到哪一类,适用于

适用于多类判别。

2)BAYES判别分析法 :

BAYES判别分析法比FISHER判别分析法更加完善和先进,它不仅能解决多类判别分析,而且分析时考虑了数据的分布状态,所以一般较多使用;

十、主成分分析

将彼此梠关的一组指标变适转化为彼此独立的一组新的指标变量,并用其中较少的几个新指标变量就能综合反应原多个指标变量中所包含的主要信息 。

十一、因子分析

一种旨在寻找隐藏在多变量数据中、无法直接观察到却影响或支配可测变量的潜在因子、并估计潜在因子对可测变量的影响程度以及潜在因子之间的相关性的一种多元统计分析方法

与主成分分析比较:

相同:都能够起到済理多个原始变量内在结构关系的作用

不同:主成分分析重在综合原始变适的信息.而因子分析重在解释原始变量间的关系,是比主成分分析更深入的一种多元统计方法

用途:

1)减少分析变量个数

2)通过对变量间相关关系探测,将原始变量进行分类

十二、时间序列分析

动态数据处理的统计方法,研究随机数据序列所遵从的统计规律,以用于解决实际问题;时间序列通常由4种要素组成:趋势、季节变动、循环波动和不规则波动。

主要方法:移动平均滤波与指数平滑法、ARIMA横型、量ARIMA横型、ARIMAX模型、向呈自回归横型、ARCH族模型

十三、生存分析

用来研究生存时间的分布规律以及生存时间和相关因索之间关系的一种统计分析方法

1、包含内容:

1)描述生存过程,即研究生存时间的分布规律

2)比较生存过程,即研究两组或多组生存时间的分布规律,并进行比较

3)分析危险因素,即研究危险因素对生存过程的影响

4)建立数学模型,即将生存时间与相关危险因素的依存关系用一个数学式子表示出来。

2、方法:

1)统计描述:包括求生存时间的分位数、中数生存期、平均数、生存函数的估计、判断生存时间的图示法,不对所分析的数据作出任何统计推断结论

2)非参数检验:检验分组变量各水平所对应的生存曲线是否一致,对生存时间的分布没有要求,并且检验危险因素对生存时间的影响。

A 乘积极限法(PL法)

B 寿命表法(LT法)

3)半参数横型回归分析:在特定的假设之下,建立生存时间随多个危险因素变化的回归方程,这种方法的代表是Cox比例风险回归分析法

4)参数模型回归分析:已知生存时间服从特定的参数横型时,拟合相应的参数模型,更准确地分析确定变量之间的变化规律

十四、典型相关分析

相关分析一般分析两个变里之间的关系,而典型相关分析是分析两组变里(如3个学术能力指标与5个在校成绩表现指标)之间相关性的一种统计分析方法。

典型相关分析的基本思想和主成分分析的基本思想相似,它将一组变量与另一组变量之间单变量的多重线性相关性研究转化为对少数几对综合变量之间的简单线性相关性的研究,并且这少数几对变量所包含的线性相关性的信息几乎覆盖了原变量组所包含的全部相应信息。

十五、R0C分析

R0C曲线是根据一系列不同的二分类方式(分界值或决定阈).以真阳性率(灵敏度)为纵坐标,假阳性率(1-特异度)为横坐标绘制的曲线

用途:

1、R0C曲线能很容易地査出任意界限值时的对疾病的识别能力

用途

2、选择最佳的诊断界限值。R0C曲线越靠近左上角,试验的准确性就越高;

3、两种或两种以上不同诊断试验对疾病识别能力的比较,一股用R0C曲线下面积反映诊断系统的准确性。

十六、其他分析方法

多重响应分析、距离分祈、项目分祈、对应分祈、决策树分析、神经网络、系统方程、蒙特卡洛模拟等。

2. 数据分析有哪些分析方法

数据分析方法有很多。
常见的有:1、描述统计。2、假设检验。3、信度分析。4、列联表分析。5、相关分析。6、方差分析。7、回归分析。8、聚类分析。9、判别分析等。
还包括多重响应分析、举例分析、项目分析、对应分析、决策树分析、顺境网络、系统方程、蒙特卡洛模拟等等。

3. 数据分析的方法有哪些

数据分析的方法有:对比分析法,分组分析法,预测分析法,漏斗分析法,AB测试分析法,象限分析法,公式拆解法,可行域分析法,二八分析法,假设性分析法。

1.对比分析法:对比分析法指通过指标的对比来反映事物数量上的变化,属于统计分析中常用的方法。常见的对比有横向对比和纵向对比。

横向对比指的是不同事物在固定时间上的对比,例如,不同等级的用户在同一时间购买商品的价格对比,不同商品在同一时间的销量、利润率等的对比。

数据分析方法是‬数据统计学‬当中‬应用‬非常‬广泛‬的方法‬,具体‬方法‬有很多种‬,具体采用的时候因人而异。

4. 数据分析的常用方法数据分析的常用方法有哪些

1、对比分析法:常用于对纵向的、横向的、最为突出的、计划与实际的等各种相关数据的。例如:今年与去年同期工资收入的增长情况、3月CPI环比增长情况等。
2、趋势分析法:常用于在一段时间周期内,通过分析数据运行的变化趋势(上升或下降),为未来的发展方向提供帮助。例如:用电量的季节性波动、股市的涨跌趋势等。
3、相关分析法:常用于分析两个或多个变量之间的性质以及相关程度。例如:气温与用电量的相关性、运动量大小与体重的相关性等。
4、回归分析法:常用于分析一个或多个自变量的变化对一个特定因变量的影响程度,从而确定其关系。例如:气温、用电设备、用电时长等因素对用电量数值大小的影响程度、工资收入的高低对生活消费支出大小的影响程度等。
5、描述性分析法:常用于对一组数据样本的各种特征进行分析,以便于描述样本的各种及其所代表的总体的特征。例如:本月日平均用电量、上海市工资收入中位数等。
6、结构分析法:常用于分析数据总体的内部特征、性质和变化规律等。例如:各部分用电量占总用电的比重、生活消费支出构成情况等。

5. 数据分析方法一般分为哪三种

1、漏斗分析
漏斗分析是指通过数据分析找到有问题的业务环节,并对其优化。
漏斗分析两大作用:其一,漏斗分析可以对各个业务阶段的用户、流量的变化进行监控,及时分析低转化率的环节,找出流失的关键,并不断优化。其二,漏斗分析可以根据不同的人群、渠道,进行差异化的分析,比如新渠道、新客户,分析出最佳的和最差的,这样能够提高操作的准确性和效率。

3、对比分析法
对比分析法即对比数据,分析差别,可以直观地看到某个方面的变化或差距,并能准确量化地表示这些变化或差距。对比分析既可以基于时间进行对比,也可以基于分类,如部门、地区、类别等进行对比。在工作中,我们会使用对比分析法比较多,比如,如上年的销量对比、目标与实际对比等。我们在对比的过程中要注意要找相似的对比对象。比如,佛山的人口与上海的人口对比就没有可比性,是毫无意义的。

6. 三种数据分析方法

首先,常见的数据分析方法有9种: 对比分析,多维度拆解分析,漏斗观察 ,分布分析,用户留存分析,用户画像,归因查找,路径挖掘,行为序列分析。

这里将重点展开分享前三种数据分析方法:  对比分析,多维度拆解分析,漏斗观察。

1、对比分析 

对比分析是 最基础最常见 的数据分析方法,能 直观的看出事物某阶段的变化,并且可以准确、量化地表达出这种变化/差距是多少 ,重点从“比什么”“怎么比”“跟谁比”三个维度进行分析。

(1)比什么 

比什么,分为绝对值(#)和比例值(%)的比较。

绝对值本身已是具备“价值”的数据,比如销售金额2000元,阅读数10000万,单看数字不易得知问题的严重程度;

比例值只有在具体环境中看比例才具备对比价值 ,比如活跃占比,注册转化率, 单看比例值容易受到极端值的影响。 

(2)怎么比 

怎么比,分为环比和同比。

常见的环比有日环比,月环比 ,是指 与当前时间范围相邻的上一个时间范围对比 ,主要用于对短期内具备连续性的数据进行分析,如指标设定;

常见的同比有周同比,年同比 ,是指 与当前时间范围上层时间范围的前一范围中同样位置进行数据对比分析 ,主要用于观察更长期的数据集,消除短期数据的干扰。

(3)和谁比 

和谁比,分为和自己比、和行业比。

和自己比 ,可以从不同的时间维度,不同的业务线,过往经验估计,跟自己比较;

和行业比 ,可以观察分析得出是自身因素,还是行业趋势,比如都跌的时候,能否比同行跌的少?都涨的时候,能都比同行涨的快? 

现在回到上面这条“飞猪公关数据”“放假消息公布以后,10点到12点,国内机票的预定量,比上周同时段增长超过50%;国际机票的增长更加惊人,超过了150%。” 

很显然, 

“50%,150%”都是比例值; 

“比上周同时段增长...”由于是#五一放假4天#消息导致的数据短期内连续上涨,所以选择的是周同比; 

“国内机票的预定…国际机票...”飞猪是在跟自己比,若有行业数据公布作为依据,可以判断飞猪是比同行涨的快/慢。 

2、多维度拆解 

多维度拆解,是最重要的一种思维方式, 一个单一指标是不具备分析价值的,我们需要从多个维度进行拆解分析才有意义,最终以获得更加全面的数据洞察。 

数据分析的本质是用不同的视角去拆分,观察同一数据指标。多维度拆解的本质多维度拆分指标/业务流程,来观察数据变动。 

多维度拆解的适用场景: 

(1) 分析单一指标的构成、比例时 ,比如分栏目的播放量、新老用户比例;

(2) 针对流程进行拆解 ,比如不同渠道的浏览、购买转化率,不同省份的活动参与漏斗;

(3) 还原行为发生时的场景 ,比如打赏主播的用户的等级、性别、关注频道,是否在WiFi或4G环境下。

现在回到第一个场景:“比如,某段时间公司做了一波网红大V推广,老板想看看推广效果,你需要来个复盘分析…” 

这时就需要用到多维度拆解分析方法,大致的分析思路这样这样: 

(1)从APP启动事件来分析 

按照 设备类型 查看,比如Android、iPhone…不同机型的启动情况;

按照 启动来源 来看,比如是从桌面、短信、PUSH…不同来源的启动情况;

按照 城市等级 观察,比如一线、二线、三线及以下…不同城市的启动情况;

按照 新老用户 细分,比如总体、新用户、老用户...不同用户群体的启动情况。

(2)从业务流程拆解 

比如对于简单的“注册——>下单——>支付”流程而言:

支付漏斗按照 渠道 查看,渠道可能分为网络、头条、微信公众号…

支付漏斗按照 城市 来看,城市可能分为一线、二线、三线及以下…

支付漏斗按照 设备 来看,设备可能分为Android、iPhone…

3、漏斗观察 

漏斗观察的分析方法我们常见且熟悉,它的运作原理是 通过一连串向后影响的用户行为来观察目标。 

适用于有明确的业务流程和业务目标的业务,不适用于没有明确的业务流程、跳转关系纷繁复杂的业务。 

通过漏斗观察核心业务流程的健康程度。 

盘点一下在建立漏斗时容易掉的坑: 

(1)首先漏斗观察需要有一定的时间窗口 ,具体需要根据业务实际情况,选择对应的时间窗口。 

按天观察 ,适用于对用户心智的影响只在短期内有效的情况,比如一些短期活动(当前有效,倒计时设置等); 

按周观察 ,适用于业务本身复杂,用户决策成本高,需要跨日才能完成的情况,比如投资理财,开户注资; 

按月观察 ,适用于用户决策周期更长的情况,比如装修买房。 

(2)其次漏斗观察是有严格顺序的 ,不可以用ABCDE(仅搜索途径的数据)的漏斗,看ACE(包含分类、搜索、推荐位三条途径的数据)的数据 。

(3)漏斗的计算单位可以基于用户,也可以基于时间。

观察用户,是关心整个业务流程的推动;

观察事件,是关心某一步具体的转化率,但无法获知事件流转的真实情况。

(4)结果指标的数据不符合预期时,需要自查是否只有一个漏斗能够触达最终目标 ,也就是检查下,是否出现第二个坑的情况。

四、案例分享——某款社交APP在国庆期间数据猛涨原因分析

场景是这样,现在有一款匿名社交APP,类似于探探,数据范围在 2018 年 9 月 1 日 - 10 月 14 日之间,其中在国庆期间数据猛涨,试分析其原因。

(1)首先定义“数据猛涨”

作为一款匿名社交产品,可以选择观察“注册成功”事件。

由于产生行为数据的时间较短,所以最后选择关注“注册用户数的日环比是否有比较大的增涨”,并按照“注册成功”事件的“触发用户数”进行查看:

(2)发现异常定位问题

从上面这张注册成功的触发用户数折线图可以看出,国庆期间的注册用户日环比存在较高的数据增长差,就是折线右侧出现的一段高峰。

由此判断,国庆期间由于某种原因造成了注册用户数的大幅增长,具体原因,待进一步拆解分析。

(3)多维度拆解分析

按照操作系统区分观察,可以发现Android的涨幅明显高于iOS,iOS稍有涨幅,但涨幅不明显。

这一步仍无法直接定位问题,需进一步拆解分析。

上图 按照注册方式观察 ,微信、微博、手机号这三种注册方式,在国庆期间均有涨幅且涨幅相似,可初步判断注册方式与此次数据异常无关。

上图 按照性别观察 ,男生和女生在国庆期间均有涨幅,男生略高于女生,但仍无法直接定位问题,需进一步拆解分析;

上图 按照年龄观察 ,不同年龄层的用户在国庆期间均有涨幅且涨幅相似,可初步判断年龄与此次数据异常无关。

问题来了!按照省份观察 ,上图明显看到有一根折现异常升高!

其实是海南省的日环比涨幅增高,除此之外,云南省的环比涨幅相较其他省份也明显升高。

综上观察分析基本可以判断,国庆期间数据猛涨,跟海南省、云南省的注册用户数大幅增长有关,具体原因待进一步拆解分析。

继续 按照城市观察 ,筛选条件设置为省份等于海南省,云南省,直观看到丽江市、大理市、三亚市、海口市国庆期间数据猛涨。

综合以上多维度分析发现,国庆期间数据猛涨,主要是由于 丽江市、大理市、三亚市、海口市 四个城市有明显涨幅。

而这四个城市都属于旅游城市,且数据增长时期伴随国庆假期。

于是猜测可能是,该款匿名社交产品在国庆期间,面向这四个热门旅游目的地,做了推广活动,关于数据猛涨真实的具体原因,还需要与市场、运营、或负责增长相关的同事沟通确认。

7. 数据分析的几种常用方法21-10-27

几种常见的数据分析分析方法:
1.周期性分析(基础分析)
What :主要是从日常杂乱的数据中,发现周期性出现的现象,而从避免或改善问题的发生。常见的两种周期:自然周期和生命周期。
需要注意的点:虽然周期性分析主要针对时间序列,但不全是,例如公众号的文章阅读走势不仅和日期(工作日或周末)相关,也和文章类型相关。
例如:销售中3,6,9,12月,由于绩效考核出现的峰值
            重点节假日对和交付的影响
            产品销售的季节性影响(例如北方下半年的采暖产品,入夏空调的销售旺季等)
How: 自然后期的时间维度,根据分析的需求,可从年(同环比,业绩达成、和行业趋势对比),月(淡旺季、销售进度、生产预测),周(一般较少),日(工作日,非工作日的差异分析),时(时间分布,工作时段,上下班高峰,晚上,主要和大众消费行为分析相关)进行展开
生命周期一种常见的分析就“商品生命周期”,商品销量随上市时间的变化,通过时间轴+指标走势组合出来的。这种分析对快消品或者产品迭代速度很快的商品(典型如手机)是比较重要的,可以用于监控产品的市场表现,对照市场活动可以量化活动效果以及产品线的经营情况,如持续跟进,则可针对性的提出产品上市的建议。

2.矩阵分析(重要分析方法)
矩阵分析是数据分析中非常重要的分析方法。主要解决分析领域的一个非常致命的核心问题:“到底指标是多少,才算好”。
平均数是一个非常常用的数据维度,但是单一维度,并不能充分评价好坏。例如考核销售,如果只考核业务销售业绩,那么业务人员一定会倾向卖利润低的引流产品。那种利润高,价格高,不容易卖的利润型产品就没人卖了,最后销售越多,公司的利润反而下降了。这个时候通过两个维度:销售规模和销售利润,构建交叉矩阵,就能将业务业绩进行更有效的区分。

举个简单的例子,一个销售团队,10名销售一个月内开发的客户数量,产生的总业绩用矩阵分析法进行分析(具体数据略):
第一步:先对客户数量、业绩求平均值
第二步:利用平均值,对每个销售人员的客户数量、业绩进行分类
第三步:区分出多客户+高业绩,少客户+高业绩,多客户+低业绩,少客户+低业绩四类

矩阵分析把关键业务目标拆分为两个维度,每个维度进行高低分类,进而可以对目标进行更加立体的描述。维度高低分类多采用 平均值作为参考 值。
注意:有两个场景,是不适合用矩阵分析法:
一:有极大/极小值影响了平均值的时候,一般出现极大/极小值的时候,可以用: 分层分析法 。
二:两个指标高度相关的时候,例如用户消费金额与消费频次,两个指标天生高度相关,此时数据分布会集中在某一个或两个区域,矩阵分析法的业务解读能力接近0,可采用 相关分析法

3.结构分析
What: 结构分析是将分析的目标,向下分解,主要用于发现问题。
例如销售分析,可以按照区域—省—市 一级级的分解,分解之后可以更好的看出影响销售业绩的影响因素在哪个位置。
 结构分析可以有多个维度,取决于我们需要分析的方向。例如还是销售分析,可以从产品构成进行拆解,也可用从业务形态拆解
How:如何进行结构分析?
第一步:定出要分析的关键指标(一般是业绩、用户量、DAU、利润等等)
第二步:了解关键指标的构成方式(比如业绩,由哪些用户、哪些商品、哪些渠道组成)
第三步:跟踪关键指标的走势,了解指标结构变化情况
第四步:在关键指标出现明显上升/下降的时候,找到变化最大的结构分类,分析问题
注意:结构分析的不足
结构分析法是一种:知其然,不知其所以然的方法。只适用于发现问题,不能解答问题

4.分层分析
What: 分层分析,是为了应对 平均值失效 的场景。典型的平均值失效例如平均工资,很多人都被“代表”。这个时候需要把收入群体分成几类,例如土豪,普通百姓,穷光蛋等,后面进行分析时就比较清楚了。业内也有一些不同的叫法,比如应用于商品的,叫ABC分类,应用于用户的,叫用户分层,应用于业务的,叫二八法则。本质都是一回事。
How:如何进行分层分析
1.明确分层对象和分层指标
    例如:想区分用户消费力,分层对象就是:用户,分层指标就是:消费金额
               想区分商品销售额,分层对象就是:商品,分层指标就是:销售金额
                想区分部销售额,分层对象就是:分部,分层指标就是:销售收入
2.查看数据,确认是否需要分层。分层是应对平均值失效的情况的,存在极值影响的情况,则适合分层。
3.设定分层的层级。最好的解决办法是老板拍板,其次可以用“二八原则”,以上述销售业绩分层为例,可以先从高到低排序,然后把累积业绩占80%的人选出来,作为“第1层级(优等)”,其他的归为“第2层级(次等)”。有时如果颗粒度不够,也可以用“二四六八十”法则”。
如何应用分层
分层的最大作用是帮我们看清楚:到底谁是主力 ,谁是吊车尾。从而指导业务,从人海战术向精兵简政思考。
根据分层的结果找出差距,进而提出(假设)差异背后可能的原因,通过其它方式进行
应用 :客户分析,目前系统中客户超5000个,为了更好的了解客户结构,可以通过分层分析的方法对这5000个客户进行分层,分层的方式通过年销售规模,可以按照累计规模排序,一般采用4-6个层级,每个层级可以给一个标签。例如王者客户,腰部客户,mini客户等。分层后,便可以针对性的进行分析,例如客户层级的销售占比,变动,各层级客户的销售构成,结合其它方法就可以有较全面的分析

5.漏斗分析(待补充)

6.指标拆解(待补充)

7.相关性分析(待补充)
What :两个(或多个)因素之间的关系。例如员工人数与销售额,市场推广与销售业绩,天气和销售表现等
            很多因素我们直观的感觉到之间有联系,相互影响,但具体的关系是什么,如何产品影响的,可以通相关性分析来量化。
例如,客户开拓中拜访客户的次数和客户成交是否有关系?
           拜访次数多,表明客户也感兴趣,所以成功几率大
           拜访这么多,客户还不成交,成功几率不大
            客户成交和拜访关系不太大,主要看你是否能打动他
How :两种联系:直接关系,间接关系
直接关系 :整体指标与部分指标的关系——结构分析,例如销售业绩与各中心的业绩
                  主指标与子指标的关系——拆解分析,例如总销售规模和客户数量与客户销售规模
                   前后步骤间的关系——漏斗分析:例如销售目标和项目覆盖率,储备率,签约等因素间的关系
        联系中,指标之间出现一致性的变化,基本是正常,如果出现相反的变动,则需要关注,这可能是问题所在
间接关系 :要素之间没有直接的联系,但存在逻辑上的连接。例如推广多了,知名度上市,进而销售额上升。
                  由于关系非显性,需要通过处理进行评价,常用的就是散点图和excel中的相关系数法
在明确相关性后,就可以通过改变其中一个变量来影响和控制另一个变量的发展。
注意:相关性分析也存在很大的局限。主要体现在相关性并不等同因果性。例如十年前你在院子里种了一颗树,你发现树每天的高度和中国近十年GDP的增速高度相关,然后这两者间并没有什么实质性的联系。此次相关性分析过程中一定注意要找到关联的逻辑自洽。

8.标签分析(待补充)

9.

8. 数据分析的6种常用方法

常见的6种数据分析的方法有: 直接判断法、对比分析法、结构分析法、平均分析法、漏斗分析法、因果分析法

无需经过任何的数据对比,根据经验直接进行判断。

这种方法对人的要求极高,要求个人对于数据和市场的理解都极其透彻,没有深度沉淀较长时间是做不到的,否则就成了武断。

把数据与过去N次进行对比,常见的对比类型有:竞争对手对比、时间同比与环比、类比对比、转化对比、特征和属性对比、前后变化对比的等等。

对比分析法在分析中使用频率是最高的,因为很多数据只有在对比中才能得出好坏、析出问题。

常见分析术语:

达成: 本月实际完成销售额与目标业绩的对比。达成是用于获取当前业绩的完成进度,评估业绩完成进度是否合理。业绩达成了,原因是什么?因为什么地方足够好?业绩不达成,原因又是什么?什么地方出现问题?

同比: 本月实际完成业绩与去年同月时期的对比。同比是用于看当前业绩和去年同期业绩相比有没有增长。这是做增长的运营者关注的重要指标。同比上升了,要看上升幅度有没有符合预期,同比下降了,要重点看下降的原因。

环比: 本月实际完成的业绩与上月实际完成业绩的对比。环比是用于看企业业绩前后变化,如试行新的运营策略一个月后与前一个月进行对比,看运营策略是否有效,但是这需要排除其他导致数据异常的原因。

差异: 自身完成业绩与竞争对手完成业绩的对比。差异是用于寻找企业与同行的产品不同之处,有时是为了避开直接竞争,有时候是为了学习同行优秀之处。

注: 对比分析法要注意控制变量,尽可能保持单一变量的对比,其他条件需要保持一致,这样的数据对比才有意义。

组内数据与总体数据之间进行对比。

常见如电商流量结构,自然搜索流量占总体的比例,付费流量占总体的比例,个性化推荐占总体的比例等等。

设置一个平均线,分析数据高于或者低于平均值的原因。

观察流程中每一步的转化和流失。常见如电商转化漏斗:展现——点击——访问——咨询——下单——支付等,每一步都设置数据埋点,观察用户行为数据,对跳失较高的步骤进行优化,提升产品功能、促销策略、服务体验等。

用枝状结构画出因果关系的图表,把影响因素一一列出,形成因果对应,有利于制定合理的方案。

9. 常用数据分析处理方法有哪些

常用的数据分析方法有:聚类分析、因子分析、相关分析、对应分析、回归分析、方差分析。

1、聚类分析:聚类分析指将物理或抽象对象的集合分组成为由类似的对象组成的多个类的分析过程。聚类是将数据分类到不同的类或者簇这样的一个过程,所以同一个簇中的对象有很大的相似性,而不同簇间的对象有很大的相异性。
2、因子分析:因子分析是指研究从变量群中提取共性因子的统计技术。因子分析就是从大量的数据中寻找内在的联系,减少决策的困难。因子分析的方法约有10多种,如重心法、影像分析法,最大似然解、最小平方法、阿尔发抽因法、拉奥典型抽因法等等。
3、相关分析:相关分析是研究现象之间是否存在某种依存关系,并对具体有依存关系的现象探讨其相关方向以及相关程度。相关关系是一种非确定性的关系。
4、对应分析:对应分析也称关联分析、R-Q型因子分析,通过分析由定性变量构成的交互汇总表来揭示变量间的联系。可以揭示同一变量的各个类别之间的差异,以及不同变量各个类别之间的对应关系。
5、回归分析:回归分析是确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法。运用十分广泛,回归分析按照涉及的自变量的多少,可分为一元回归分析和多元回归分析。
6、方差分析:又称“变异数分析”或“F检验”,方差分析是从观测变量的方差入手,研究诸多控制变量中哪些变量是对观测变量有显着影响的变量。

想要了解更多关于数据分析的相关信息,推荐选择十方融海。十方融海作为技术创新型企业,坚持源头核心技术创新,为用户提供听得懂、学得会、用得上的产品。该机构的解决方案和社会价值获得了主流媒体报道,与厦门大学、深圳大学、华南理工大学等高校达成校企合作,探索产教融合、成人教育新模式。用科技推动教育改革,让教育创造美好生活。

阅读全文

与常见数据分析的方法有哪些相关的资料

热点内容
短期投资入账价值计算方法 浏览:22
小米6屏幕重启解决方法 浏览:436
苹果7手机设置音乐铃声设置在哪里设置方法 浏览:720
铆钉的安装方法 浏览:754
染头发怎么染方法视频 浏览:840
脑袋瓜的食用方法 浏览:804
将苦味酊涂在手指上的治疗方法是 浏览:332
切线方法视频大全 浏览:555
软灯带安装方法图解 浏览:458
厨房的使用方法 浏览:526
潍坊青萝卜种植方法 浏览:559
生物分析方法的维护 浏览:195
挤领带方法视频 浏览:753
检验员检测方法 浏览:723
有哪些管理方法含有激励作用 浏览:558
分期买车计算方法 浏览:153
php魔术方法有哪些 浏览:272
轻薄面料制作方法视频 浏览:630
华帝水槽安装方法 浏览:787
足阳明胃经的锻炼方法 浏览:551