导航:首页 > 方法技巧 > 如何选择统计分析的检验方法

如何选择统计分析的检验方法

发布时间:2022-12-11 21:20:40

什么是统计检验怎么选择统计检验方法

统计检验亦称“假设检验”。根据抽样结果,在一定可靠性程度上对一个或多个总体分布的原假设作出拒绝还是不拒绝(予以接受)结论的程序。决定常取决于样本统计量的数值与所假设的总体参数是否有显着差异。这时称差异显着性检验。检验的推理逻辑为具有概率性质的反证法。

选择

显着性水平和否定域

有了与问题相关的抽样分布,我们便可以把所有可能的结果分成两类:一类是不大可能的结果;另一类人们预料这些结果很可能发生。既然如此,如果我们在一次实际抽样中得到的结果恰好属于第一类,我们就有理由对概率分布的前提假设产生怀疑。

在统计检验中,这些不大可能的结果称为否定域。如果这类结果真的发生了,我们将否定假设;反之就不否定假设。概率分布的具体形式是由假设决定的,假设肯定不止一个。在统计检验中,通常把被检验的那个假设称为零假设(或称原假设,用符号H0表示),并用它和其他备择假设(用符号H1表示)相对比。

值得注意的是,假设只能被检验,从来不能加以证明。统计检验可以帮助我们否定一个假设,却不能帮助我们肯定一个假设。为了使检验更严格、更科学,还需要更多的东西。首先,我们必须确定冒犯第一类和第二类错误的风险的程度;其次,要确定否定域是否要包含抽样分布的两端。

第一类错误是,零假设H0实际上是正确的,却被否定了。第二类错误则是,H0实际上是错的,却没有被否定。第二类错误是,零假设H0实际上是错误的,却没有被否定。遗憾的是,不管我们如何选择否定域,都不可能完全避免第一类错误和第二类错误,也不可能同时把犯两类错误的危险压缩到最小。

对任何一个给定的检验而言,第一类错误的危险越小,第二类错误的概率就越大;反之亦然。一般来讲,不可能具体估计出第二类错误的概率值。第一类错误则不然,犯第一类错误的概率是否定域内各种结果的概率之和。

由于犯第一类错误的危险和犯第二类错误的危险呈相背趋向,所以统计检验时,我们必须事先在冒多大第一类错误的风险和多大第二类错误的风险之间作出权衡。被我们事先选定的可以犯第一类错误的概率,叫做检验的显着性水平(用α表示),它决定了否定域的大小。

如果抽样分布是连续的,否定域可以建立在想要建立的任何水平上,否定域的大小可以和显着性水平的要求一致起来(后面的正态检验就如此)。如果抽样分布是非连续的,就要用累计概率的方法找出一组构成否定域的结果。

即在已知概率分布表上,从两端可能性最小的概率开始向中心累计,直至概率之和略小于选定的显着性水平为止。在许多场合,我们能预测偏差的方向,或只对一个方向的偏差感兴趣。每当方向能被预测的时候,在同样显着性水平的条件下,单侧检验比双侧检验更合适。

因为否定域被集中到抽样分布更合适的一侧,可以得到一个比较大的尾端。这样做,可以在犯第一类错误的危险不变的情况下,减少了犯第二类错误的危险。

(1)如何选择统计分析的检验方法扩展阅读

选择统计检验程序的方法时需考虑以下条件:

1、看总体分布是否已知。如果已知,看是不是正态分布。如果已知样本分布为常态分布就可以选择参数检验法,如果总体分布未知就用非参数检验法。

2、在参数检验中,如果总体分布为正态,总体方差已知,两样本独立或相关都可以采用Z检验;如果总体方差未知,根据样本方差,采取不同的t检验。如果总体分布非正态,总体方差已知,根据样本独立或相关采取Z’检验;如果总体方差未知,根据独立和相关采取不同的Z‘检验。

3、根据题目考虑用单侧还是双侧检验。

4、在非参数检验中,按照两个样本相关和不相关、精度与容量等,可以采用符号检验、秩和检验等方法。

⑵ 统计方法如何选择

统计资料丰富且错综复杂,要想做到合理选用统计分析方法并非易事。对于同一个资料,若选择不同的统计分析方法处理,有时其结论是截然不同的。
正确选择统计方法的依据是:
①根据研究的目的,明确研究试验设计类型、研究因素与水平数;
②确定数据特征(是否正态分布等)和样本量大小;
③ 正确判断统计资料所对应的类型(计量、计数和等级资料),同时应根据统计方法的适宜条件进行正确的统计量值计算;
最后,还要根据专业知识与资料的实际情况,结合统计学原则,灵活地选择统计分析方法。

⑶ 统计学检验方法有哪些

统计学 各种应用条件、校正条件

应用检验方法必须符合其适用条件,不同设计的数据应选用不同检验方法。 一、第五章 参数估计 P74 总体均数的置信区间 1.正态近似法:
总体标准差σ已知,或σ未知但n>50时 2. t分布法
总体标准差σ未知,且n≤50时
二、第六章 计量资料两组均数t检验P93、P99 (一)t 检验的应用条件
适用于计量资料(单样本、两配对样本、两独立样本),并要求: 1. 样本来自正态分布的总体。W检验(n≤50时),H0:样本来自正态总体,P>0.05时尚不能认为两组资料的分布非正态;
2. 两独立样本均数比较时,两总体方差齐性。Levene检验,H0:方差相等。P>0.05时尚不能认为两组资料方差不齐。
(二)方差不齐或非正态时,两计量资料均数的比较方法 方法1. 仅方差不齐时,可采用近似t检验,即 t′检验。 方法2. 变量变换:对数变换、平方根变换、倒数变换等
方法3. 非参数检验:Wilcoxon符号秩检验(两相关样本P142);Wilcoxon秩和检验、Mann-Whiney-U检验(两独立样本 P145)等

三、第七章 计量资料多组均数的比较-方差分析 (一)方差分析流程 P109
1、多个样本均数比较。若P<0.05,均数不全相等,则进行第2步;
2、作多重比较:LSD-t检验、Dunnett-t检验(多个实验组与一个对照组比较)、SNK-q检验(多个均数间全面比较)
(二)方差分析的应用条件 P114
1、各样本相互独立,服从正态分布;W检验 2、各样本方差齐性。Levene检验
四、分类资料(计数资料)的比较-

⑷ 什么是统计检验怎么选择统计检验方法

统计检验的真核应该就是选取有代表性的样本,然后去节省人力、物力的前提下,去推断总体的一些性质、是否有差异的等。其余别的什么分布的,楼上回答的不错。其实重难点基础备考统计这部分写的很好。注意是正态分布,而不是Z分布。

⑸ SPSS软件进行数据分析时,如何选择检验方法

方法/步骤

1、首先,打开或者是新建一组数据,这里是打开一组案例分析中的数据进行分析。

⑹ 统计分析方法 有哪些统计分析方法

1、描述统计。描述性统计是指运用制表和分类,图形以及计筠概括性数据来描述数据的集中趋势、离散趋势、偏度、峰度。

(1)缺失值填充:常用方法:剔除法、均值法、最小邻居法、比率回归法、决策树法。

(2)正态性检验:很多统计方法都要求数值服从或近似服从正态分布,所以之前需要进行正态性检验。常用方法:非参数检验的K-量检验、P-P图、Q-Q图、W检验、动差法。

2、假设检验

(1)参数检验。参数检验是在已知总体分布的条件下(一股要求总体服从正态分布)对一些主要的参数(如均值、百分数、方差、相关系数等)进行的检验 。U验 使用条件:当样本含量n较大时,样本值符合正态分布。T检验 使用条件:当样本含量n较小时,样本值符合正态分布。单样本t检验:推断该样本来自的总体均数μ与已知的某一总体均数μ0 (常为理论值或标准值)有无差别;配对样本t检验:当总体均数未知时,且两个样本可以配对,同对中的两者在可能会影响处理效果的各种条件方面扱为相似;两独立样本t检验:无法找到在各方面极为相似的两样本作配对比较时使用。

(2)非参数检验。非参数检验则不考虑总体分布是否已知,常常也不是针对总体参数,而是针对总体的某些一股性假设(如总体分布的位罝是否相同,总体分布是否正态)进行检验。适用情况:顺序类型的数据资料,这类数据的分布形态一般是未知的。虽然是连续数据,但总体分布形态未知或者非正态;体分布虽然正态,数据也是连续类型,但样本容量极小,如10以下;

主要方法包括:卡方检验、秩和检验、二项检验、游程检验、K-量检验等。

3、信度分析

检査测量的可信度,例如调查问卷的真实性。分类:

(1)外在信度:不同时间测量时量表的一致性程度,常用方法重测信度

(2)内在信度;每个量表是否测量到单一的概念,同时组成两表的内在体项一致性如何,常用方法分半信度。

4、列联表分析。用于分析离散变量或定型变量之间是否存在相关。

对于二维表,可进行卡方检验,对于三维表,可作Mentel-Hanszel分层分析。列联表分析还包括配对计数资料的卡方检验、行列均为顺序变量的相关检验。

5、相关分析

研究现象之间是否存在某种依存关系,对具体有依存关系的现象探讨相关方向及相关程度。

(1)单相关: 两个因素之间的相关关系叫单相关,即研究时只涉及一个自变量和一个因变量;

(2)复相关 :三个或三个以上因素的相关关系叫复相关,即研究时涉及两个或两个以上的自变量和因变量相关;

(3)偏相关:在某一现象与多种现象相关的场合,当假定其他变量不变时,其中两个变量之间的相关关系称为偏相关。

6、方差分析

使用条件:各样本须是相互独立的随机样本;各样本来自正态分布总体;各总体方差相等。

(1)单因素方差分析:一项试验只有一个影响因素,或者存在多个影响因素时,只分析一个因素与响应变量的关系

(2)多因素有交互方差分析:一顼实验有多个影响因素,分析多个影响因素与响应变量的关系,同时考虑多个影响因素之间的关系

(3)多因素无交互方差分析:分析多个影响因素与响应变量的关系,但是影响因素之间没有影响关系或忽略影响关系

(4)协方差分祈:传统的方差分析存在明显的弊端,无法控制分析中存在的某些随机因素,使之影响了分祈结果的准确度。协方差分析主要是在排除了协变量的影响后再对修正后的主效应进行方差分析,是将线性回归与方差分析结合起来的一种分析方法,

⑺ 如何正确选择统计方法(to be continued)

资料类型设计方案实验分组检验条件

单变量资料差异比较的分析方法小结

11种形式的列联表

双变量(多变量)资料的关联性分析方法小结

二、计量资料分析常见的统计问题

2.1 忽视t检验的前提条件

文题:重症急性胰腺炎并发肝功能不全的临床研究。实验数据见表5。原文作者用t检验分析此资料。请问:这样做正确吗?

辨析:

1.对表5数据进行方差齐性检验,可发现两组患者的血清淀粉酶和肌酐指标不能满足方差齐性的要求,故不能采用t检验进行分析。

正确的做法:采用变量变换使数据服从正态分布且方差齐,然后进行t检验,否则,采用非参数检验。

2.给出确切的统计量和P值。

2.2 误用成组设计资料的t检验分析配对设计资料

辩析: 1.考虑到对数据进行变换是正确的。但是如果采用成组t检验,还需要两总体方差齐性。 但本研究是配对设计,如果采用成组t检验,会降低检验效率。应该采用配对t检验进行分析。注意配对t检验的条件:要对每对数据的差值(d)进行正态性检验。如果不满足,改用Wilcoxon符号秩检验。2.应给出确切的统计量和P值。

2.3 忽视方差分析的前提条件

文题:姜黄素抑制晶状体上皮细胞增殖的信号转导机制。

问题:作者取健康小牛眼晶状体的混合消化液消化后,收集细胞,进行传代培养,取第三代细胞进行实验。

实验分3组:空白对照组、模型组、姜黄素组,每组设6个样本。

请问:采用方差分析正确吗?

辨析:此实验分3组,应为单因素三水平设计定量资料,应首先进行“独立性”、“正态性”和“方差齐性”检验,如果满足方差分析的3个前提条件则用方差分析;如果不满足,则采用变量变换或秩和检验。如果P<0.05,则进行多组均数间的多重比较。

给出确切的统计量和P值。

2.4 误用t检验分析等级资料

文题:止痛如神汤保留灌肠治疗CNUP:双盲随机安慰剂对照试验

表4 两组临床主要症状和结肠镜肠粘膜病变评分

※:与对照组(G2)比较,P>0.05,组间差异无统计学意义;△:与治疗前比较,P<0.05,组内差异有统计学意义;▲:与对照组(G2)比较,P<0.05,组间差异有统计学意义。

辨析:

对于腹痛、腹泻、脓血便、下坠感、充血、水肿、粘膜糜烂、粘膜溃疡的单项评分组间比较,不宜用t检验。因为每项评分为1、2、3等不连续的赋值,数据资料不服从正态分布。应将数据整理成分组无序指标有序的等级资料,宜采用秩和检验。

分析“总评分”时,应对数据进行正态性和方差齐性检验后,决定选用t检验或秩和检验。

与对照组(G2)比较,P>0.05,组间差异无统计学意义,不必在备注中表示。

应写出确切的统计量和P值

2.5 误用t检验处理重复测量的两因素试验设计

文题:益气活血法预防老年患者髋部术后下肢深静脉血栓形成

统计学处理:采用SPSS10.0统计软件,两组间计量资料比较用t检验。

辨析:本研究设计类型为:两因素(处理和时间)重复测量设计资料。

在资料满足“独立性”、“正态性”和“方差齐性”的前提条件下,及进行球对称检验,应选用两因素设计的重复测量的方差分析,选用t检验分析该资料是不妥的。

文题:复方苦参注射液对恶性肿瘤患者伽玛刀放射治疗后T淋巴细胞亚群的影响。

设计:作者选取60例恶性肿瘤患者,随机分成2组。试验组在伽玛刀放射治疗的同时给予复方苦参注射液20ml加入生理盐水500ml,静脉滴注,1次/d,10d为1个疗程;对照组仅给予伽玛刀放射治疗。试验结果见表7。

请问:统计分析方法选用t检验正确吗?

辨析:

1.统计分析错误

      本试验中,每位受试者在试验前、后两个不同的时间点上被重复测量了同一个指标的数值,试验前与试验后的数据并不相互独立,这种试验设计类型属于具有重复测量的试验设计,时间是一个与重复测量有关的试验因素。原作者用t检验进行两两比较,则割裂了整体设计,不能准确地估计和控制误差,因而不能得到可靠的结论。

正确的做法:应将表7的形式改成重复测量试验设计的标准形式,采用与之对应的方差分析进行数据处理。

2.6 误用配对设计资料的t检验处理单因素k(k>3)水平设计的资料

原文题目:“莪术对大鼠在体子宫肌电活动的影响及其机制研究”,文章为观察莪术水煎剂对未孕大鼠子宫肌电活动的影响,40只大鼠被随机分成4组,对照组:按10ml/kg鼠重灌服生理盐水,莪术组:按10ml/kg鼠重分别灌服25% 、50% 、100%莪术水煎液分成3组。观察每个大鼠子宫肌电爆发波的峰面积、持续时间和个数。原作者应用配对设计定量资料的t检验进行统计处理,资料见表4。

表 莪术水煎剂对大鼠子宫肌电活动的影响(均数±标准差)

辨析:

没有交待将大鼠按体重等重要的非实验因素作为配伍条件进行随机区组。

本资料有四个剂量,属于单因素四水平设计的定量资料,不可以用成组设计或配对设计的t检验。

措施:如果满足正态性和方差齐性两个前提条件,应用单因素四水平设计定量资料的方差分析,在得出有统计学意义的结论后,还可进一步采用Dunnett t检验或LSD检验。

如果在专业上有必要对3项指标同时进行考察,还应选用该设计的定量资料的三元方差分析对资料进行处理。

三、计数资料分析方法的常见问题

3.1 计算相对数时分母太小

文题:疏肝利胆中药防治胆固醇结石形成的实验研究。实验数据见表4。请问:在表达资料方面有何不妥之处?

辨析:

计算相对数时,分母过小,相对数很不稳定,易失真,不但不能正确反映事实真相,还往往会造成错觉。

在表4中,各组样本例数都小于20,样本例数偏小,不宜计算率,直接给出例数就可以。

3.2 误用χ2 检验分析结果变量为有序变量的资料

某医生用A、B两药治疗某病各240例,其疗效分为四个等级:痊愈、显效、好转、无效,见表4。经R×C表χ2检验,χ2=53.33 ,P <0.01 ,认为两组疗效之间的差异有统计学意义。

辨析:

本资料属于单项有序的R×C表,临床疗效有等级之分,对于等级资料可采用Ridit分析或秩和检验。而不应用R×C的χ2检验,R×C表χ2 检验只能检验两组内部构成是否相同或频数的分布是否相同,不能检验疗效有无差别。不难看出,若对表4资料任意两列数字进行对换,可以清楚地发现,χ2值仍为53.33,不会有改变。

3.3 误用χ2检验回答相关性问题

表 不同年龄冠状动脉粥样硬化程度的分布

上述资料用χ2检验得:χ2 =163.01,P<0.005,结论为:可认为冠状动脉硬化的程度与年龄有关,结合本资料可见冠状动脉硬化等级有随年龄增高而增加的趋势。

问:处理此资料所用的统计分析方法以及所得出的结论有何不妥之处?

辨析1:

本资料为“双向有序且属性不同的二维列联表资料”,处理这种资料有3个目的,因此,就对应着3套不同的统计分析方法。

分析不同年龄组患者冠状动脉硬化等级之间有无差别:看作单向有序资料,选用秩和检验。

分析年龄与冠脉硬化等级间有无相关关系:选用等级相关。

分析两者间是否存在线性变化趋势则应用线性趋势检验。

作者欲考察“两个有序变量之间是否呈相关关系”,而χ2检验结果是P<0.05,说明冠状动脉硬化患者在不同年龄组的人数分布是不同的。

事实上,若将表中任何两行的频数互换或将任何两列的频数互换,所得的χ2检验的统计量数值是不会变化的,说明χ2检验用于处理有序变量形成的二维列联表资料是不合适的。

辨析2:

欲考察“两个有序变量之间是否呈相关关系”,应选用分析定性资料的相关分析方法,如:Spearman秩相关分析,Kendall秩相关分析或典型相关分析。

本例采用Spearman秩相关分析,得:rs=0.53215,P<0.0001。

结论为:表中两个有序变量之间呈正相关关系,即随着年龄的增加冠状动脉硬化等级也逐渐增大,两者之间的相关关系具有统计学意义。

3.4 多值有序变量的高维列联表资料

3.5 不满足连续性χ2检验条件时未做校正

3.6 十一种形式的列联表

3.7 误用χ2检验取代Fisher精确检验

3.8 对R×C表直接分割进行两两比较

四、统计分析方法表述问题

(1)在统计学方法中注明“采用SPSS软件进行统计学处理”。此表述正确吗?

辨析:

      从该表述中只能得知原作者采用了什么统计分析软件处理数据,没有交代清楚软件的版本和序列号;更未体现出文中资料所对应的实验设计类型和所采用的具体统计分析方法。

(2)在统计学方法中注明“计量资料采用方差分析”。请问:此表述正确吗?

辨析:

从该表述中只能得知作者处理定量资料用了方差分析,至于这些统计分析方法的选用是否正确,则不得而知。

通常情况下,比较各平均值之间的差别是否具有统计学意义,可能会用到的t检验有3种,方差分析有10种之多,他们之间的本质区别体现在定量资料所对应的“实验设计类型”上。

在表述统计学方法时,应将所用方法写完整,即在统计分析方法前冠以实验设计名称,如配对设计定量资料的t检验、成组(或单因素两水平)设计定量资料的t检验或两因素析因设计定量资料的方差分析。

(3)定性资料一律采用χ2检验,对吗?

辨析:

      事实上,定性资料通常可以编制成11种形式的列联表。在进行统计分析时,应针对不同形式的列联表、统计分析目的和资料实际具备的前提条件,选用相应的统计分析方法,不可随意盲目选用,更不应将χ2检验视为处理定性资料的万能工具。

(4)许多论文中,当统计数据经假设检验后,P值仅仅列出P >0.05或P<0.05 、P<0.01便称结果无显着差异,或结果非常显着。

假设检验结果正确的表达方法是:

      应写出描述性统计量,如样本均数、率、相关系数、回归系数、相对危险度、半数效量等,及其可信区间、检验统计量,如χ2、t、u、F 值等)、P值;然后根据P值大小作出统计学推断,并作出相应的医学专业结论。

举例:

SPSS实现多组率的两两比较

pearson卡方

SPSS对原始数据是频数表的,需进行加权处理(让软件横着看数据)后卡方检验。

条件:(1)pearson卡方要求总例数大于40;(2)0 个单元格 (0.0%) 的期望计数小于 5。最小期望计数为 15.25。

资料收集整理来自网络文库

阅读全文

与如何选择统计分析的检验方法相关的资料

热点内容
每个模块那么多方法如何记 浏览:4
巯基乙酸单甘油酯检测方法 浏览:145
尖锐疣治疗的方法 浏览:798
使用什么方法解决 浏览:800
搓澡神器使用方法 浏览:386
闭角青光眼后期治疗方法 浏览:722
清洗瓷砖方法有哪些 浏览:555
汽车漆面划痕有什么补救方法 浏览:759
快速洗纹身方法 浏览:977
女性夜尿多锻炼方法 浏览:442
福美钠的检测方法 浏览:465
红花生和红醋泡的食用方法 浏览:410
简述分析方法验证的效能指标 浏览:677
脑梗最好的治疗方法 浏览:557
贵州正宗酸汤的制作方法去哪里学 浏览:326
中药炮制清除杂质的方法有哪些 浏览:873
老君威更换电脑匹配方法 浏览:100
肺的早期腺癌怎么治疗方法 浏览:23
格力中央安装方法 浏览:469
编织镂空花的方法视频 浏览:55