1、描述统计。描述性统计是指运用制表和分类,图形以及计筠概括性数据来描述数据的集中趋势、离散趋势、偏度、峰度。
(1)缺失值填充:常用方法:剔除法、均值法、最小邻居法、比率回归法、决策树法。
(2)正态性检验:很多统计方法都要求数值服从或近似服从正态分布,所以之前需要进行正态性检验。常用方法:非参数检验的K-量检验、P-P图、Q-Q图、W检验、动差法。
2、假设检验
(1)参数检验。参数检验是在已知总体分布的条件下(一股要求总体服从正态分布)对一些主要的参数(如均值、百分数、方差、相关系数等)进行的检验 。U验 使用条件:当样本含量n较大时,样本值符合正态分布。T检验 使用条件:当样本含量n较小时,样本值符合正态分布。单样本t检验:推断该样本来自的总体均数μ与已知的某一总体均数μ0 (常为理论值或标准值)有无差别;配对样本t检验:当总体均数未知时,且两个样本可以配对,同对中的两者在可能会影响处理效果的各种条件方面扱为相似;两独立样本t检验:无法找到在各方面极为相似的两样本作配对比较时使用。
(2)非参数检验。非参数检验则不考虑总体分布是否已知,常常也不是针对总体参数,而是针对总体的某些一股性假设(如总体分布的位罝是否相同,总体分布是否正态)进行检验。适用情况:顺序类型的数据资料,这类数据的分布形态一般是未知的。虽然是连续数据,但总体分布形态未知或者非正态;体分布虽然正态,数据也是连续类型,但样本容量极小,如10以下;
主要方法包括:卡方检验、秩和检验、二项检验、游程检验、K-量检验等。
3、信度分析
检査测量的可信度,例如调查问卷的真实性。分类:
(1)外在信度:不同时间测量时量表的一致性程度,常用方法重测信度
(2)内在信度;每个量表是否测量到单一的概念,同时组成两表的内在体项一致性如何,常用方法分半信度。
4、列联表分析。用于分析离散变量或定型变量之间是否存在相关。
对于二维表,可进行卡方检验,对于三维表,可作Mentel-Hanszel分层分析。列联表分析还包括配对计数资料的卡方检验、行列均为顺序变量的相关检验。
5、相关分析
研究现象之间是否存在某种依存关系,对具体有依存关系的现象探讨相关方向及相关程度。
(1)单相关: 两个因素之间的相关关系叫单相关,即研究时只涉及一个自变量和一个因变量;
(2)复相关 :三个或三个以上因素的相关关系叫复相关,即研究时涉及两个或两个以上的自变量和因变量相关;
(3)偏相关:在某一现象与多种现象相关的场合,当假定其他变量不变时,其中两个变量之间的相关关系称为偏相关。
6、方差分析
使用条件:各样本须是相互独立的随机样本;各样本来自正态分布总体;各总体方差相等。
(1)单因素方差分析:一项试验只有一个影响因素,或者存在多个影响因素时,只分析一个因素与响应变量的关系
(2)多因素有交互方差分析:一顼实验有多个影响因素,分析多个影响因素与响应变量的关系,同时考虑多个影响因素之间的关系
(3)多因素无交互方差分析:分析多个影响因素与响应变量的关系,但是影响因素之间没有影响关系或忽略影响关系
(4)协方差分祈:传统的方差分析存在明显的弊端,无法控制分析中存在的某些随机因素,使之影响了分祈结果的准确度。协方差分析主要是在排除了协变量的影响后再对修正后的主效应进行方差分析,是将线性回归与方差分析结合起来的一种分析方法,
㈡ 统计学检验方法有哪些
统计学 各种应用条件、校正条件
应用检验方法必须符合其适用条件,不同设计的数据应选用不同检验方法。 一、第五章 参数估计 P74 总体均数的置信区间 1.正态近似法:
总体标准差σ已知,或σ未知但n>50时 2. t分布法
总体标准差σ未知,且n≤50时
二、第六章 计量资料两组均数t检验P93、P99 (一)t 检验的应用条件
适用于计量资料(单样本、两配对样本、两独立样本),并要求: 1. 样本来自正态分布的总体。W检验(n≤50时),H0:样本来自正态总体,P>0.05时尚不能认为两组资料的分布非正态;
2. 两独立样本均数比较时,两总体方差齐性。Levene检验,H0:方差相等。P>0.05时尚不能认为两组资料方差不齐。
(二)方差不齐或非正态时,两计量资料均数的比较方法 方法1. 仅方差不齐时,可采用近似t检验,即 t′检验。 方法2. 变量变换:对数变换、平方根变换、倒数变换等
方法3. 非参数检验:Wilcoxon符号秩检验(两相关样本P142);Wilcoxon秩和检验、Mann-Whiney-U检验(两独立样本 P145)等
三、第七章 计量资料多组均数的比较-方差分析 (一)方差分析流程 P109
1、多个样本均数比较。若P<0.05,均数不全相等,则进行第2步;
2、作多重比较:LSD-t检验、Dunnett-t检验(多个实验组与一个对照组比较)、SNK-q检验(多个均数间全面比较)
(二)方差分析的应用条件 P114
1、各样本相互独立,服从正态分布;W检验 2、各样本方差齐性。Levene检验
四、分类资料(计数资料)的比较-
㈢ 统计推断常用的方法有
(1)简单随机抽样:
简单随机抽样,是指抽样过程应独立进行并且总体中每个个体被抽到的机会均等。随机抽样不是随便抽取,随便抽取容易受到个人好恶的影响。为实现随机化,可采取抽签、掷随机数骰子或查随机数值表等办法。如从100件产品中随机抽取l0件组成样本,可以把这100件产品从l开始编号直到100号,然后用抓阄的办法任意抽出l0个编号,由这l0个编号代表的产品组成样本。此种抽样方法的优点是抽样误差小,缺点是手续繁杂。在实践中真正做到每个个体被抽到的机会相等是不容易的。
(2)周期系统抽样:
周期系统抽样,又叫等距抽样或机械抽样,即将总体按顺序编号,用抽签或查随机数值表的方法确定首件,进而按等距原则依次抽取样本。如从120个零件中取五个做样本,先按生产顺序给产品编号,用简单随机抽样法确定首件,然后按每隔24(由120÷5=24得)个号码抽取一个,共抽取五个组成样本。这种方法特别适用于流水线上取样,操作简便,实施起来不易出现差错。但抽样起点一经确定,整个样本就完全固定。对总体质量特性含有某种周期性变化,而当抽样间隔恰好与质量特性变化周期吻合时,就可能得到一个偏差很大的样本。
(3)分层抽样法:
分层抽样法,即从一个可以分成不同子总体的总体中,按规定比例从不同层中随机抽取个体的方法。当不同设备、不同环境生产同一种产品时,由于条件差别产品质量可能有较大差异,为了使所抽取的样本具有代表性,可以将不同条件下生产的产品组成组,使同一组内产品质量均匀,然后在各组内按比例随机抽取样品合成一个样本。这种抽样方法得到的样本代表性比较好,抽样误差较小,缺点是抽样手续较繁,常用于产品质量检验。
(4)整群抽样法:
这种方法是先将总体按一定方式分成多个群,然后随机地抽取若干群并由这些群中的所有个体组成样本。如按照生产过程将1000个零件分别装入20个箱中,每箱50个,然后随机抽取一箱,此箱中50个零件组成样本。这种抽样方法实施方便,但样本来自个别群体而不能均匀分布在总体中,因而代表性差,抽样误差较大。