A. spss分析方法-卡方检验
参数检验的前提是 关于总体分布的假设成立 ,但很多情况下我们无法获得有关总体分布的相关信息。
非参数检验正是一类基于这种考虑,在总体方差未知或知道甚少的情况下,利用样本数据对总体分布形态等进行推断的方法。
卡方检验是一种用于 判断样本是否来自于特定分布的总体 的 非参数检验 方法,其根据样本的频数来推断总体分布与理论分布是否有显着差异。
下面我们主要从下面四个方面来解说:
实际应用
理论思想
操作过程
分析结果
一、实际应用
例如抽取某学校的学生的数据,推断性别比例是否4:6;医学家在研究心脏病人猝死人数与日期的关系时发现:一周之中,星期一心脏病人猝死者较多,其他日子则基本相当。当天的比例近似为2.8:1:1:1:1:1:1。现收集到心脏病人死亡日期的样本数据,推断其总体分布是否与上述理论分布相吻合。
二、理论思想
卡方检验方法可以根据样本数据,推断总体分布与期望分布或某一理论分布是否存在显着差异,是一种吻合性检验,通常适于对有多项分类值的总体分布的分析。H0原假设是: 样本来自的总体分布与期望分布或某一理论分布无差异 。
三、操作过程
卡方检验的数据条件:
条件宽松、对样本数据要求较低、计算相对简单
卡方检验案例:
题目:随机抽取的100名山东省某地区新出生婴儿的性别情况。试用卡方检验方法研究该地区新出生婴儿的男女比例是否存在明显的差别。
一、数据输入
二、操作步骤
1.进入SPSS,打开相关数据文件,选择“分析”“|非参数检验”“|旧对话框”|“卡方”命令
2.选择进行卡方检验的变量。在“卡方检验”对话框的左侧列表框中,选择“性别”进入“检验变量列表”列表框。
3.设置期望范围和期望值。在“卡方检验”对话框内的“期望范围”选项组中,选中“从数据中获取”单选按钮,也就是根据数据本身的最大值和最小值来确定检验值范围;在“期望值”选项组中,选中“所有类别相等”单选按钮,因为本例中各类别的构成比相同。
4.设定卡方检验的计算方法。单击“卡方检验”对话框中的“精确”按钮,选中“仅渐进法”单选按钮,单击“继续”按钮返回“卡方检验”对话框。
选择相关统计量的输出和缺失值的处理方法。
5.单击“卡方检验”对话框中的“选项”按钮,在“统计”选项组中选中“描述”复选框,也就是输出变量的描述性统计量,包括平均值、标准差、最大值、最小值等;在“缺失值”选项组中选中“按检验排除个案”单选按钮,即排除掉含有缺失值的记录后再进行卡方检验。设置完毕后,单击“继续”按钮返回“卡方检验”对话框。
6.其余设置采用系统默认值即可。
7.单击“确定”按钮,等待输出结果。
四、结果分析
1. 描述性统计量表接受检验的样本共100个,样本平均值是1.49,标准差是0.502,最小值是1,最大值是2。
2. 卡方检验频数表参与检验的男性婴儿共51个,女性婴儿共49个,期望数都是50.0,残差分别是1.0和-1.0。
3. 卡方检验统计量表卡方值是0.040,自由度是1,渐近显着性水平为0.841,远大于0.05,检验结果接受原假设。
分析结论:
综上所述,通过卡方检验,该地区新出生婴儿的男女比例没有明显的差别。
(获取更多知识,前往前往我的wx ————公z号 (程式解说)
原文来自https://mp.weixin.qq.com/s/4HW9cWF96yG7GKre5OFNHQ
B. 卡方检验研究的方法
1、处理四格表数据时不考虑样本量和最小理论频数而直接采用卡方检验
处理四格表数据是卡方检验最为常见的用途之一,其目的在于分析“构成比”或者“率”上的差异是否具有统计学意义。对于四格表数据,使用卡方检验的条件为样本量大于 40,且最小理论频数应大于 5。对于某些小样本的、或者指标阳性率较低的研究,总样本量可能小于 40,最小理论频数也可能小于 5,此时应该采用 Fisher 确切概率法进行分析。
比如某研究需比较小细胞肺癌和非小细胞肺癌内某个基因的表达情况的差异是否有统计学意义,得出如下四格表:
该研究的样本量仅为 30 个,且最小理论频数为(12×9)/30=3.6,所以应该采用 Fisher 确切概率法进行分析。实际上,从理论上讲,若要分析四格表数据中的构成比或者率之间的差异是否有统计学意义,Fisher 确切概率法的结果是最可靠的。若是使用软件对数据进行分析,不论样本量和最小理论频数,均可采用 Fisher 确切概率法。
2、不考虑分析目的、设计类型而盲目套用卡方检验
有的四格表资料本身是配对的,且研究的目的主要是回答“一致性”或者“不一致性”的问题,此时就不应该用卡方检验对数据进行分析。比如:某研究者发明了一种新的 HIV 检测法,并且用该法和免疫印迹法(检测 HIV 感染的“金标准”)同时检测了 100 份血清,得到如下四格表数据:
该研究在设计上与表 1 中的研究最大的区别在于“配对”,即同一样本分别接受了新方法检测和免疫印迹法(金标准)的检测。研究者最关心的问题应该是“新方法和金标准之间的一致性”问题,若采用卡方检验进行分析,得出的结论是“免疫印迹法检测结果的频数分布在新方法阳性组和阴性组中是不同的”,这一结论显然并无多大专业价值。
对于此类研究,可以采用两种方法进行统计,一是采用 Mcnemar χ2 检验公式计算两种方法不一致的部分是否具有统计学意义;二是采用 Kappa 检验分析两种结果之间的一致性。
需要说明的是,此类研究中的一种方法必须是金标准,否则研究可能没有价值。以表 2 中的数据为例,若免疫印迹法并非检测 HIV 感染的金标准,两种方法的一致性即使好得一塌糊涂,也可能无济于事。
因为一个显而易见的问题是:这两种方法可能都是错误的检测方法。比如:采用金标准对 100 份血清进行检测后,其中 90 例为阳性,而不论是新方法还是免疫印迹法,均仅仅检测出了 55 个阳性样本,漏检率显然太高。
3、误用卡方检验处理等级资料
等级资料的表示方法与分类资料相似,因此受“定式思维”的影响,部分同行“习惯性”地采用卡方检验对等级资料进行处理,这也是医学期刊上最常见的滥(乱)用卡方检验的行为。卡方检验回答的问题仅仅是“构成比”或者“率”上的差异是否具有统计学意义,而不能回答效应指标的强度高低问题。比如某研究比较了两类人群胰腺癌分期的分布状况,如下表所示:
此类数据的一个显着特点是胰腺癌的分期(Ⅰ、Ⅱ、Ⅲ、Ⅳ期)是一个等级资料,研究者的研究目的是分析甲乙两群人胰腺癌的分期是否有差别,是一个强度“分期早晚”的问题,而不是“构成比”的差异。若用卡方检验处理此类数据,得出的结论就是“甲乙两类人群胰腺癌分期构成比上的差异是否具有统计学意义”,而无法明确“孰高孰低”的问题。
以上述表格为例,卡方检验结果显示有统计学意义,但问题在于:根据表中数据,人群甲以Ⅰ期和Ⅳ期为主,人群乙以Ⅱ期和Ⅲ期为主,让人完全无法判断两类人群的疾病分期“孰早孰晚”的问题。
处理此类数据的一般方法是将分期进行秩转换,然后以秩和检验进行统计分析,也可以直接采用 Riddit 分析进行统计。
4、对于多组资料反复使用卡方检验进行比较
又是研究者面对的数据可能有多行或者多列(R×C 资料),研究者需要逐一比较各组数据的差异是否有统计学意义。比如某研究者对不同血型的个体患乙型肝炎的情况进行了调查,得出如下数据:
这是一个率的比较问题,研究目的主要在于分析各个血型的人群 HBV 感染的发病率是否相同。处理此类数据,一般是直接采用卡方检验从整体上分析各组人群率(构成比)上的差异是否具有统计学意义;若具有统计学意义,则根据研究目的进一步觉得是否进行组间的比较。
以本研究为例,研究者可能还需要逐一比较各组 HBV 感染的发病率之间的差异是否具有统计学意义。处理此类数据时,最容易犯的一类错误就是将表格进行拆分成六个四格表反复采用卡方检验进行统计分析。实际上,这种错误的统计学方法类似于“反复使用 t 检验比较多组资料”,会增大Ⅰ类误差的概率。正确的做法应该是采用卡方分割法,通过改校正验水准的方式来进行两两比较。
需要说明的是,在整体比较之后是否需要进行两两比较,如何进行两两比较在很大程度上取决于专业需要,或者说研究目的,特别是分组因素的“属性”是否相同。比如某研究欲分析了基因 A 在类风湿性关节炎中的表达情况(基因表达情况以阳性和阴性进行描述),除了健康对照外,研究者还设立了疾病对照组,包括系统性红斑狼疮和干燥综合症。