Ⅰ 16种常用的数据分析方法-列联分析
列联分析通常用来分析两个分类变量之间或者一个分类变量与顺序变量之间是否存在关联,关联的紧密程度如何。
对关联性问题的处理称为独立性检验(Test of Independence),通过交叉列联表和 c2 检验进行列联分析。
交叉列联表分为二维表与三维表两种,二维表交叉表可进行卡方检验,三维交叉表,可作Mentel-Hanszel分层分析。
列联表结构
2*2 列联表
r *c 列联表
案例
公司在4个不同的地区设有分公司,公司准备进行工资级别调整。采用抽样调查方式,从4个分公司共抽取420个样本 (人),了解职工对此调整的看法,交叉统计结果如下:
观察频数分布表&百分比分布表的分布
列联交叉表中的统计值有两种类型:频数与百分比,对于两种类型的分布表,观察其分布时,要注意:
一、频数分布表
1、观察边缘分布
行边缘分布:行观察值的合计数的分布
列边缘分布:列观察值的合计数的分布
2、观察条件分布与条件频数
变量 X 条件下变量 Y 的分布,或在变量 Y 条件下变量 X 的分布
每个具体的观察值称为条件频数
二、百分比分布
为在相同的基数上进行比较,可以计算相应的百分比,称为 百分比分布
1、观察行百分比:行的每一个观察频数除以相应的行合计数( fij / ri )
2、观察列百分比:列的每一个观察频数除以相应的列合计数( fij / cj )
3、观察总百分比:每一个观察值除以观察值的总个数( fij / n )
交叉列联表分析步骤
1.【分析】—【描述统计】—【交叉表】
【精确】
一般情况下,"精确检验"(Exact Tests)对话框的选项都默认为系统默认值,不作调整。
【统计量】
【单元格】
【格式】
2.结果分析:
卡方检验
a. 16 单元格(100.0%) 的期望计数少于 5。最小期望计数为 .56。
原假设:H0:职称、学历两者相互独立。
皮尔逊(Pearson)的Chi-Square 值为18.553,自由度为9,
p=.029<0.05,拒绝原假设,即在5%的显着性水平下不同文化程度对职称的影响存在着显着差异。
结论:文化程度越高,职称越高。
Ⅱ 如何使用spss进行交叉列联表分析
SPSS提供了多种适用于不同类型数据的相关系数表达,这些相关性检验的零假设都是:行和列变量之间相互独立,不存在显着的相关关系。根据SPSS检验后得出的相伴概率(Concomitant Significance)判断是否存在相关关系。如果相伴概率小于显着性水平0.05,那么拒绝零假设,行列变量之间彼此相关;如果相伴概率大于显着性水平0.05,那么接受原假设,行列变量之间彼此独立。
在交叉列联表分析中,SPSS所提供的相关关系的检验方法主要有以下3种:
(1)卡方(χ2)统计检验:常用于检验行列变量之间是否相关。计算公式为:
在该对话框中,用户可以指定列联表的输出排列顺序。对话框中各选项的具体意义如下:
在行序(Row Order)栏中有如下两个选项:
升序(Ascending):系统默认,以升序显示各变量值;
降序(Descending):以降序显示各变量值。
用户在该对话框中进行选择后,单击【继续】(Continue)按钮,即可返回"交叉表"主对话框。
在"交叉表"对话框中单击【确定】(OK)按钮,可在输出窗口中得到数据概述、交叉列联表、卡方检验表、交叉分组下频率分布柱形图、相对危险性估计等图表。
Ⅲ 如何使用spss进行交叉列联表分析
1、首先我们打开之前导入的spps文件。
Ⅳ 如何使用spss进行交叉列联表分析
在实际分析中,除了需要对单个变量的数据分布情况进行分析外,还需要掌握多个变量在不同取值情况下的数据分布情况,从而进一步深入分析变量之间的相互影响和关系,这种分析就称为交叉列联表分析。
当所观察的现象同时与两个因素有关时,如某种服装的销量受价格和居民收入的影响,某种产品的生产成本受原材料价格和产量的影响等,通过交叉列联表分析,可以较好地反映出这两个因素之间有无关联性及两个因素与所观察现象之间的相关关系。
因此,数据交叉列联表分析主要包括两个基本任务:一是根据收集的样本数据,产生二维或多维交叉列联表;二是在交叉列联表的基础上,对两个变量间是否存在相关性进行检验。要获得变量之间的相关性,仅仅靠描述性统计的数据是不够的,还需要借助一些表示变量间相关程度的统计量和一些非参数检验的方法。
常用的衡量变量间相关程度的统计量是简单相关系数,但在交叉列联表分析中,由于行列变量往往不是连续变量,不符合计算简单相关系数的前提条件。因此,需要根据变量的性质选择其他的相关系数,如Kendall等级相关系数、Eta值等。
SPSS提供了多种适用于不同类型数据的相关系数表达,这些相关性检验的零假设都是:行和列变量之间相互独立,不存在显着的相关关系。根据SPSS检验后得出的相伴概率(Concomitant Significance)判断是否存在相关关系。如果相伴概率小于显着性水平0.05,那么拒绝零假设,行列变量之间彼此相关;如果相伴概率大于显着性水平0.05,那么接受原假设,行列变量之间彼此独立。
Ⅳ 统计分析方法有哪些