导航:首页 > 方法技巧 > 如何确定假设试验的检验方法

如何确定假设试验的检验方法

发布时间:2022-07-16 18:43:21

如何确定假设检验的方法

什么是假设检验:假设检验(hypothesis
testing)是数理统计学中根据一定假设条件由样本推断总体的一种方法。具体作法是:根据问题的需要对所研究的总体作某种假设,记作h0;选取合适的统计量,这个统计量的选取要使得在假设h0成立时,其分布为已知;由实测的样本,计算出统计量的值,并根据预先给定的显着性水平进行检验,作出拒绝或接受假设h0的判断。常用的假设检验方法有u—检验法、t检验法、χ2检验法(卡方检验)、f—检验法,秩和检验等。
假设检验的基本步骤如下:
1、提出检验假设又称无效假设,符号是h0;备择假设的符号是h1。
h0:样本与总体或样本与样本间的差异是由抽样误差引起的;
h1:样本与总体或样本与样本间存在本质差异;
预先设定的检验水准为0.05;当检验假设为真,但被错误地拒绝的概率,记作α,通常取α=0.05或α=0.01。
2、选定统计方法,由样本观察值按相应的公式计算出统计量的大小,如x2值、t值等。根据资料的类型和特点,可分别选用z检验,t检验,秩和检验和卡方检验等。
3、根据统计量的大小及其分布确定检验假设成立的可能性p的大小并判断结果。若p>α,结论为按α所取水准不显着,不拒绝h0,即认为差别很可能是由于抽样误差造成的,在统计上不成立;如果p≤α,结论为按所取α水准显着,拒绝h0,接受h1,则认为此差别不大可能仅由抽样误差所致,很可能是实验因素不同造成的,故在统计上成立。p值的大小一般可通过查阅相应的界值表得到。
教学中的做法:
1.根据实际情况提出原假设和备择假设;
2.根据假设的特征,选择合适的检验统计量;
3.根据样本观察值,计算检验统计量的观察值(obs);
4.选择许容显着性水平,并根据相应的统计量的统计分布表查出相应的临界值(ctrit);
5.根据检验统计量观察值的位置决定原假设取舍。

❷ 简述假设检验的步骤

一、假设检验的基本思想与步骤
如何被统计学家费舍尔提出:奶茶先加茶和先加奶的口味是不同的。于是科学家有一个原假设:该女士不具备区分奶茶与茶奶的能力。假设检验的基本思想就是小概率事件不会发生,当小概率事件发生时,我们更倾向认为原假设是错误。引入问题:某牛奶生产商在其一份研究报告中声称“中国人的平均身高不高于160 厘米,因而必须喝牛奶”假设所有国人的平均身高服从正态分布N(μ,),如何检验牛奶商关于身高的声称是否成立?
(一) 估计与假设检验的区别
上面不是一个参数估计的问题,必须采用假设检验的方法。假设检验(hypothesis testing)与参数估计(estimation)的思想是不同的。参数估计是指利用抽样数据对总体参数进行直接估计,并得出总体参数的具体估计值;而假设检验则分为假设与检验两步,先形成一个对总体参数的假设,然后再利用抽样数据判断这个假设是否成立。
上题中,参数估计是通过抽样调查部分中国人身高,计算出样本均值,并以此估计全国人的平均身高μ;而假设检验则是先形成一个命题如:“中国人的平均身高μ不高于160 厘米”,然后通过抽样数据判断该命题是否成立。
(二) 假设检验的基本思想
基本思想是“小概率事件不会发生”。假设抽样了一万人发现平均身高是180,,基本可以判断前述是错误的命题。然而如果发现均值是161时那么结论就没那么显然了,就必须利用到概率分布与显着性相关的信息。
(三) 假设检验的步骤
(1) 建立需检验的假设
(2) 选择合适的检验统计量,并确定其服从的概率分布
(3) 选择判断假设是否成立的显着性水平
(4) 给出决策准则(decision rule),即拒绝域的形式
(5) 收集数据,并计算检验统计量
(6) 做出判断
(7) 根据判断进行投资决策
二、假设检验的相关概念
(一)原假设(Null Hypothesis)与备择假设(Alternative Hypothesis)
假设检验的第一步就是建立假设。通常将被检验的假设称为原假设(null hypothesis),记为;当被拒绝时而接受的假设称为备择假设,记为或.原假设与备择假设通常成对出现。身高问题中原假设与备择假设可以用如下方式表示:

假设检验一般有两种结果:第一种是原假设“不正确”,称为拒绝(reject)原假设;第二种是原假设“正确”,称为无法拒绝(can not reject)原假设。
在建立原假设与备择假设时,有几个细节要注意:
(1) 当原假设“正确”时,一般称“无法拒绝原假设”而不是“接受原假设”,这是因为此时原假设并不是数学意义上的恒成立,而只是统计意义上的成立。
(2) 如果假设涉及不等式时,习惯将等号放在原假设
(3) 在构建原假设备择假设时,习惯将想要得到的结论放在备择假设
(二)检验统计量(Test Statistic)及其分布
在抽样样本检验原假设通常是通过一个统计量来完成的,这个统计量称为检验统计量(test statistic)。检验统计量通常服从某个概率分布,于是可以通过计算检验统计量是否超过某一关键值来判断是否拒绝原假设。在本书中,检验统计量通常以公式的形式出现:

(11.1)

如身高问题中,检验统计量就可以通过样本均值来构建。由中心极限定理,服从正态分布N(μ,/n),按照(11.1)标准化后就服从标准正态分布。
(三)显着性水平(Significance Level)与关键值(Critical Value)
有了检验统计量后,结合显着性水平就可以计算出关键值(Critical Value)及其拒绝域(rejection region)。关键值是判断是否拒绝原假设的临界值。拒绝域是由原假设被拒绝的样本观测值所组成的区域。
在例题中,假设显着性水平为5%,的标准化后服从标准正态分布,那么检验统计量的关键值就是1.65?
根据正态分布95%置信区间对应的标准差不是1.96倍标准差吗?为啥是1.65而不是1.96,是正数而不是负数?需要涉及单尾检验与双尾检验。
(四) 双尾检验(Two-Tailed Test)与单尾检验(One-Tailed Test)
假设检验通常有三种基本形式:

其中,θ表示总体参数,θ0表示当成立时总体参数的取值。
第一种形式称为双尾检验,第二种与第三种形式称为单尾检验。无论是单尾还是双尾检验所采用的检验统计量都是相同的,差别主要体现在拒绝域上。因此,区分单尾检验与双尾检验对确定关键值(critical value)以及拒绝域(rejection region)至关重要。
(五) p值(p-value)
除了比较检验统计量与关键值,另一种判断是否拒绝原假设的方法就是p值(p-value)。p值指拒绝原假设的最小显着水平。根据p值定义,在给定显着水平α的情况下,如果p<=α,则拒绝原假设;如果p>α,则无法拒绝原假设。
例如,我们要进行显着性水平为5%的双尾检验,已知p值=2.14%,这就意味着,左侧对应的尾部面积为1.07%,即统计量绝对值大于,应该要拒绝原假设。当然,也可以利用p值进行判断,p值=2.14%<5%,因此应该要拒绝原假设。画个图:

(六) 第一类错误(Type I Error)与第二类错误(Type II Error)
虽然假设检验的基本思想是“小概率事件不会发生”,但在真实世界中小概率事件是有可能发生的。因而,我们在判断假设检验是否成立时就有可能犯错误。检验时可能犯的错误可归为两类:一是当原假设H0真实成立时,我们却拒绝了原假设,称为第一类错误,也称为“拒真概率”;二是当原假设H0不成立时,我们却接受了原假设,称为第二类错误,也称为“受伪概率”。
假设检验的两种错误:

决策

真实情形

H0正确

H0错误

没有拒绝H0

正确决策

第二类错误
(犯错概率=β)

拒绝H0接受Ha

第一类错误
(犯错概率=α)

正确决策
(概率power of test:1-β)

上表有几个关于概率的标识:通常我们将犯第一类错误的概率记为α,这里的α实际上就是假设检验中的显着性水平;犯第二类错误的概率记为β。此外,当原假设正确时接受原假设,当错误时拒绝原假设都表明决策者做出了正确的抉择没有犯错,特别的,我们将决策者不犯第二类错误的概率称为统计检验力(power of test),记为1-β
(七) 统计显着(Statistical significance)与经济显着(Economic Significance)
在利用假设检验进行金融分析时注意区别两者,许多投资策略在假设检验上能够获得正收益,然而在扣除交易费用、税收并考虑风险后就无法经济显着获得正收益。

❸ 如何验证假设

统计学中假设检验的基本步骤:1.建立假设,确定检验水准α假设有零假设(H0)和备择假设(H1)两个,零假设又叫作无效假设或检验假设.H0和H1的关系是互相对立的,如果拒绝H0,就要接受H1,根据备择假设不同,假设检验有单、双侧检验两种.检验水准用α表示,通常取0.05或0.10,检验水准说明了该检验犯第一类错误的概率.
2.根据研究目的和设计类型选择适合的检验方法这里的检验方法,是指参数检验方法,有u检验、t检验和方差分析三种,对应于不同的检验公式.对双样本资料,要注意区分成组设计和配对设计的资料类型.如果资料里有"配成对子"字样,或者是对同一对象用两种方法来处理,一般就可以判定是配对设计资料.
3.确定P值并作出统计结论u检验得到的是u统计量或称u值,t检验得到的是t统计量或称t值.方差分析得到的是F统计量或称F值.将求得的统计量绝对值与界值相比,可以确定P值.

❹ 检验假设的方法

常用的假设检验的方法有以下四种: (1)Z检验。Z检验常用于总体正态分布、方差已知或独立大样本的平均数的显着性和差异的显着性检验,非正态分布的皮尔森积差相关系数和二列相关系数的显着性检验以及两个相关系数分别由两组被试得到的相关系数差异性检验等情况。 (2)t检验。t检验常用于总体正态分布、总体方差未知或独立小样本的平均数的显着性检验,平均数差异显着性检验,相关系数由同一组被试取得的相关系数差异显着性检验,非正态分布的皮尔森相关系数的显着性检验等情况。

❺ 假设检验的思想和步骤

假设检验的基本思想是小概率反证法思想。基本依据是“小概率原理”. 所谓小概率原理就是:概率很小的随机事件在一次试验中一般不会发生. 根据这一原理,我们从H0 出发,在一定的显着性水平α下,从总体中抽取一个子样进行检验,在H0 成立的条件下,若发现“相应统计量(即随机变量) 取到此子样代入统计量后的值”是一个小概率事件,亦即小概率事件在一次试验中发生了,这与“小概率原理”矛盾,所以,此时就拒绝H0 并接受H1 ;反之,就只有被迫接受H0 .

假设检验的一般步骤
1) 根据实际问题提出原假设H0与备选假设H1,即说明需要检验的假设的具体内容;
2) 选择适当的检验统计量,并在原假设H0成立的条件下确定该统计量的分布及原H0的拒绝域的形式;
3) 按问题的具体要求,选取适当的显着性水平α,并根据统计量的分布查表,确定对应于α的临界值,求出H0的拒绝域;

我真无聊,竟然来回答数学问题 o(╯□╰)o

❻ 统计学中假设检验的基本步骤有哪些

1、提出检验假设又称无效假设,符号是H0;备择假设的符号是H1。

H0:样本与总体或样本与样本间的差异是由抽样误差引起的;

H1:样本与总体或样本与样本间存在本质差异;

预先设定的检验水准为0.05;当检验假设为真,但被错误地拒绝的概率,记作α,通常取α=0.05或α=0.01。

2、选定统计方法,由样本观察值按相应的公式计算出统计量的大小,如X2值、t值等。根据资料的类型和特点,可分别选用Z检验,T检验,秩和检验和卡方检验等。

3、根据统计量的大小及其分布确定检验假设成立的可能性P的大小并判断结果。若P>α,结论为按α所取水准不显着,不拒绝H0,即认为差别很可能是由于抽样误差造成的,在统计上不成立;

如果P≤α,结论为按所取α水准显着,拒绝H0,接受H1,则认为此差别不大可能仅由抽样误差所致,很可能是实验因素不同造成的,故在统计上成立。P值的大小一般可通过查阅相应的界值表得到。

(6)如何确定假设试验的检验方法扩展阅读

注意事项


要进行统计假设的检验, 必须利用各种不同的判据, 即利用规则来选择。假设的采用与拒绝, 通常在判据的前件中应有某个数量指标(称为统计判据)。

根据判据方式, 假设分为参数假设和非参数假设。按照参数统计结论, 通常应提出被研究特征在总体中分布的具体形式, 因为在这种情况下, 统计学通常是以分布参数(平均值、方差、回归系数)的利用为依据的。非参数判据的优点是能把判据用于只靠名义级或次序级完成的特征度量上。

否定零假设的判据值总体能构成否定域。如果某一点能将否定域与接受零假设的区域划分开来, 这一点就称为临界点。



❼ 假设检验的是基本思想是什么步骤是什么

假设检验的基本思想是小概率反证法思想基本步骤
1、提出检验假设(又称无效假设,符号是H0))和备择假设(符号是H1)。
H0:样本与总体或样本与样本间的差异是由抽样误差引起的;
H1:样本与总体或样本与样本间存在本质差异;
预先设定的检验水准为0.05;当检验假设为真,但被错误地拒绝的概率,记作α,通常取α=0.05或α=0.01。
2、选定统计方法,由样本观察值按相应的公式计算出统计量的大小,如X2值、t值等。根据资料的类型和特点,可分别选用Z检验,T检验,秩和检验和卡方检验等。
3、根据统计量的大小及其分布确定检验假设成立的可能性P的大小并判断结果。若P>α,结论为按α所取水准不显着,不拒绝H0,即认为差别很可能是由于抽样误差造成的,在统计上不成立;如果P≤α,结论为按所取α水准显着,拒绝H0,接受H1,则认为此差别不大可能仅由抽样误差所致,很可能是实验因素不同造成的,故在统计上成立。P值的大小一般可通过查阅相应的界值表得到。

❽ 统计学的假设检验方法

统计学假设检验主要有T检验、Z检验两种方法,具体内容是:
1、T检验,亦称student t检验(Student's t test),主要用于样本含量较小(例如n<30),总体标准差σ未知的正态分布资料。
2、z检验(U检验),是一般用于大样本(即样本容量大于30)平均值差异性检验的方法。它是用标准正态分布的理论来推断差异发生的概率,从而比较两个平均数的差异是否显着。
除以上两种主要方法外,还有F检验和卡方检验。

❾ 假设检验

(一)假设检验的基本思想

统计假设检验就是为了推断某个问题,事先做出一种假设。然后用一个实测样本数据计算出某一个适合的、已知其分布的统计量,并通过查表得出其相应的临界值。再用实测样本数据计算出来的关于统计量与其临界值进行比较,从而得出肯定(接受)原假设或否定(拒绝)原假设的结论,达到统计推断之目的,下面举例说明。

[例8-4]在某测区的海西期第二阶段中粗粒黑云母花岗岩(

)中进行γ测量,测得300个数据,经计算平均照射量率

=35γ,标准差s=8γ。又在同一测区的海西期第三阶段细粒黑云母花岗岩(

)中测得80个数据,其平均照射量率

=37γ,标准差S=8.2γ,问这两种花岗岩的放射性γ照射量率有无显着性差异?能否把这两种花岗岩在统计上看成同一总体?

解:假定这批γ照射量率数据都服从正态分布。此例中,300个数据是很大的样本,可以把它看成总体,故可用300个数据的平均数与标准差当作总体的均值与标准差,即μ=35γ,σ=8γ,80个观测数据仍看成是样本。由于样本标准差s=8.2γ与总体标准差相差甚小。因此,只需检验样本平均数

=37γ与总体平均值μ=35γ是否有显着性差异。若差异显着,则认为这种花岗岩不是同一个总体,若差异不显着,就认为两种花岗岩属于同一总体。所以,又称这种统计假设检验为显着性检验。具体步骤如下:

(1)假设H0

与μ无显着性差异,即两种花岗岩属于同一个总体。于是样本平均值

放射性勘探技术

其中:μ=35(γ),σ=8(γ),

=0.89(γ)。

(2)构造一个统计量u

先将样本平均数标准化,即

放射性勘探技术

式(8-21)中的统计量u服从标准正态分布,即u~N(0,1)。

(3)确定临界值

给定信度α=0.05,则由附录一查出F(u)=1-α/2=0.975所对应的uα=1.96,故有

P{-1.96<u<1.96}=1-α=0.95

放射性勘探技术

放射性勘探技术

其中33.26γ与36.74γ是临界值,而区间(33.26,36.74)是肯定域。区间以外为否定域。这就是说,样本平均数

x落在区间(33.26,36.74)内,即肯定域内,此时称发生了概率为95%的大概率事件,可肯定原假设;若样本平均数落在该区间以外,即否定域内,此时称发生了概率为5%的小概率事件,可否定原假设。

(4)计算实测样本平均数

由于实测样本平均数

=37γ>36.74γ,落在区间以外,即否定域内,故否定原假设H0,认为样本平均数

x与总体均值μ差异显着。因此两种

在γ照射量率上有显着性差异,不属于同一总体。若要进行底数统计,则应分别进行统计。

(二)差异的显着性与信度(显着性水平)

上例的统计推断性结论是在信度(显着性水平)α=0.05的条件下做出的。如果将信度α定得小一些,那么做出的统计性结论就有可能改变。比如α=0.01,由附录一可查出F(u)=1-α/2=0.995所对应的u临界值uα=2.58,故有

放射性勘探技术

放射性勘探技术

在这种情况下,临界值为32.7γ与37.3γ,故区间(32.7,37.3)为肯定域。而实测样本

=37<37.3,应肯定原假设H0:认为样本平均数

与总体均值μ无显着性差异。因此把两种花岗岩(

)看成是同一总体,若要进行底数统计,这两种岩性不必分开。

显而易见,信度α如何选择,直接影响到差异是否显着的结论。可见,任何差异是否显着的推断都是在一定的信度(显着性水平)α下做出的。α定得越大,肯定域就小,但推断的可靠性差(即置信概率小)。反之,α定得愈小,肯定域就愈大,推断的可靠性强(置信概率大)。放射性物探工作中所要进行的统计假设检验,一般将信度α定为0.05或0.01较为恰当,此时置信概率分别为95%与99%。

(三)统计假设检验的分类

统计假设检验可分为两大类,即参数性方法与非参数性方法,就是假定总体的分布型式已知(经常假定为正态分布),只要对参数进行检验即可。非参数性方法,则不管总体的分布如何,都能应用。

参数性方法又可分为大样本与小样本推断两种。一般当n>30~50时,可称为大样本,凡属大样本一律可按正态分布处理。

(四)分布型式的检验

放射性物探工作中经常要统计各种底数。进行底数统计之前,就要对观测数据进行分布型式的检验,以确定观测数据服从何种概率分布,并采用相应的底数与标准差的计算方法。当然根据频率分布直方图的形状也大致可以看出其分布型式,但这是不严格的,需要进行检验。检验的方法很多,下面介绍几种方法:

1.偏度、峰度检验法

这是一种检验概率分布是否属于正态分布的参数性方法,要求有大样本(n>100)。此种检验方法中要用的两个统计量CS(偏度)与CE(峰度),其计算公式已在本项目学习任务一中给出。

当总体服从正态分布时,若样本为大样本(n>100),则统计量CS、CE近似服从正态分布,即CS~N(0,6/n),CE~N(0,24/n)。

现以本项目学习任务一某花岗岩体的228个γ测量数据为例,说明如何用偏度系数和峰度系数法检验分布型式的方法。

[例8-5]用偏度系数和峰度系数法检验表8-1中某地区γ普查数据是否服从正态分布,给定信度α=0.05。

(1)假设H0

该地区γ照射量率数据服从正态分布。又因样本容量n=228,为大样本,故

CS~N(0,6/228),CE~N(0,24/228)

将这两个参数标准化,有

放射性勘探技术

经过标准化变换以后,公式(8-22)和公式(8-23)都服从标准正态分布N(0,1)。

(2)计算标准化后的概率区间

在α=0.05下,查得F(u)=1-α/2=0.975所对应的uα=1.96,故有

放射性勘探技术

P{-0.32<CS<0.32}=0.95

故CS的临界值为-0.32和0.32,即区间(-0.32,0.32)为肯定域,其外为否定域。

同样对于CE,有

放射性勘探技术

P{-0.64<CE<0.64}

故CE的临界值为-0.64和0.64,即区间(-0.64,0.64)为肯定域,其外为否定域。

(3)计算样本的CS和CE

根据实测数据可用列表法求取偏度系数CS和峰度系数CE,见表8-5。

表8-5 某地区放射性测量γ射线照射量率(γ)偏度系数和峰度系数计算表

续表

根据表8-5计算CS和CE,步骤如下:

放射性勘探技术

三阶中心矩(M3)和四阶中心矩M4计算如下:

放射性勘探技术

于是

放射性勘探技术

(4)比较

将由实测样本计算的CS和CE与其临界值进行比较,可见样本的CS=0.0903和CE=-0.5921都落在肯定域内,故肯定原假设,认为该地区的γ射线照射量率符合正态分布。

2.正态概率格纸检验法

显然上述检验方法比较麻烦,计算工作量较大,而且要求是大样本。在本项目学习任务二曾指出,在正态概率格纸上做出的正态分布的累积概率曲线为一条直线。因此便可根据画在正态概率格纸上的实测样本数据的诸(xi,Fi)点是否基本在一条直线上,来检验该批数据是否符合正态分布。其中xi为实测样本分组数据的组上限,Fi为其累积频率。这种检验方法称为正态概率格纸检验法。

下面仍然以某地区花岗岩228个γ照射量率数据为例,说明其检验方法。

[例8-6]使用表8-1的数据,用正态概率纸法检验某地区γ普查数据是否符合正态分布。

解:以表8-1中的累积频率为纵坐标,将数据分组值(组上限)为横坐标,在正态概率格纸上打点,即A(21.5,1.32)、B(25.5,7.46)、C(29.5,20.64)、D(33.5,41.23)、E(37.5,64.64)、F(41.5,82.64)、G(45.5,94.74)、H(49.5,98.25);然后用直尺画一条直线,尽可能将各点联结起来,如图8-9所示,其做法与用累积频率展直线法求正常值的做法相同。

由图8-9可见,这些点基本落在一条直线上,因此该批数据服从正态分布,这与用偏度、峰度检验法得出的结论相同。由图8-9还可见到,有些点与直线有些偏差,这是允许的,但是偏差不能太大。偏差太大,则不一定属于正态分布。一般说来,中间的点(即靠近累积频率为50%横线附近的点)偏差不能太大,两端的点偏差可以适当大一点。究竟偏离多远可认为是允许的,需绘制一定信度α下的临界曲线,见图5-5所示,以此作为衡量的标准。临界值曲线的画法请参阅有关书籍。

3.χ2检验法

χ2检验不但可以检验正态分布,还可以检验泊松分布、二项分布、负二项分布、指数分布等的分布型式。

(1)理论原理

这是在总体x为未知时,根据它的n个观测值x1,x2,…,xn来检验关于总体分布的假设

H0:总体x的分布函数为F(x)(8-24)

的一种方法。

注意,若总体分布为离散型,则假设式(8-24)相当于

H0:总体x的分布律为P{x=ti}=pi(i=1,2,…)(8-25)

若总体分布函数为连续型,则假设式(8-24)相当于

H0:总体x的概率密度为f(x)(8-26)

式(8-24)~式(8-26)是χ2检验的理论模型表达式。

在用下述χ2检验法检验假设H0时,要求在假设H0下F(x)的分布型式及其参数都是已知的。但实际上参数往往是未知的,这时,需要先用极大似然法估计参数,然后做检验。

χ2检验法的基本思想是:把随机实验结果的全体S分为k个互不相容事件A1,A2,…,Ak(A1∪A2∪…∪Ak=S,AiAj=ϕ,i≠j;i,j=1,2,…,k)。于是,在假设H0下,我们可以计算理论频率pi=P(Ai)(i=1,2,…,k)。显然,在n次试验中,事件Ai出现的频率

/n与pi有差异。一般来说,若H0为真,则这种差异并不显着;若H0为假,这种差异就显着。基于这种想法,皮尔逊(pearson)使用统计量

放射性勘探技术

作为检验理论(即假设H0)与实际符合的尺度。并证明了如下的定理:若n充分大(n≥50),则不论总体属于什么分布,统计量式(8-27)总是近似地服从自由度为k-r-1的χ2分布。其中,r是被估计参数的个数。

于是,若在假设H0下算得皮尔逊统计量的值,即式(8-27),有

放射性勘探技术

则在显着性水平α下拒绝H0;若式(8-28)中不等号反向,就接受H0

χ2检验的具体步骤是:

把实轴分为k个互不相容的区间[αii+1](i=1,2,…,k),其中αii+1可分别取-∞,+∞。区间的划分方法视具体情况而定。

其次,计算概率

pi=F(αi+1)-F(αi)=P{αi<x≤αi+1}(8-29)

此处,F(x)由式(8-29)确定。然后算出pi与样本容量n的乘积npi称为理论频数。

同时,计算样本观察值x1,x2,…,xn在区间(αii+1]中的个数

(i=1,2,…,k),称为实际频数。

然后,将

和pi的值代入式(8-27),算出χ2的值。于是对于给定的显着性水平α,按式(8-28)做出拒绝还是接受H0的判断。

χ2检验法是在n无限增大时推导出来的,所以在使用时必须注意n要足够大,以及npi不太小这两个条件。根据经验,要求样本容量n不小于50,当n刚刚大于50附近时,npi最好在5以上,在n大于100时npi最好取10以上,否则应当适当的合并区间(或Ai),使npi满足这个要求。特别是在边部小概率事件下要进行适当地并组,这样可以有效的压低边部“干扰”,突出数据中部的“有用信号”。

下面通过实例来说明检验的过程。

(2)应用实例

[例8-7]试用χ2检验的办法检验某地区闪长岩钍含量是否服从对数正态分布(取α=0.05)。原始数据单位为10-6,取常用对数以后的统计结果见表8-6。

表8-6 某地区闪长岩钍含量对数值统计表

解:为方便起见,根据表8-6所整理的结果来做检验。因参数都是未知的,故应用极大似然估计法估计μ、

得,

放射性勘探技术

注意:这里的

表示μ的估计值,所以它与

是相等的。

估计

时,如果是手算,则利用公式(8-7),得

放射性勘探技术

注意,公式中的n=110,为样品容量;k为分组数,表示并组后的组数。这里对第1~3和13~15组进行了并组,故k=11。对于分组时两头的小组实行并组是为了有效地减小偶然误差。

所以,我们要检验的假设为

H0:x~N(0.7509,0.24842)

为便于计算npi,应先做变换u=(x-0.7509)/0.2484。化x为标准正态变量u,与正态分布概率纸检验法一样,查出各个u之下的累积频率,算出区间频率、频数,这些都是理论值。如表8-7所示。

表8-7 某区闪长岩钍含量对数正态分布χ2检验表

标准正态分布表中查出的是累积频率F(u);每一个区间频率为该区间累积频率与上一个区间累计频率之差;n=110,为样品容量,而非分组组数,故npi表示理论频数;

为实际频数;最后是皮尔逊统计量。

由于并组后组数k=11,估计了两个参数(

,

),于是r=2;故自由度k-r-1=8,查χ2分布表(见附录二),得

放射性勘探技术

故在水平α=0.05下接受H0,认为该地区岩石钍含量符合对数正态分布,并且钍含量对数

=0.7509,对数均方差^σ=0.2484;对应的Th含量是5.64×10-6,Th含量均方差为1.77×10-6

通过上例可见,用χ2检验法(或其他检验方法)得到的结果往往较概率纸精确。特别是,有的检验法(如χ2检验法)能控制犯第一类错误的概率α,这是概率纸所做不到的。但概率纸使用方便,无须太多的计算,因此,概率纸常用来初步估计总体的分布类型及参数的一次近似之用。然后用χ2检验法(或距离计算法、偏度系数和峰度系数检验法等)进一步做精确的检验。

(五)平均数的对比(U检验和t检验)

由本项目学习任务二正态分布的介绍,可知正态分布有两个重要参数,一个是均值μ,另一个是标准差σ。当μ与σ确定后,正态分布N(μ,σ)就完全确定了;且在一般情况下,标准差σ比较稳定。要检验两个正态分布是否相同,或者说,两个正态分布的样本是否属于同一总体,只要对均值μ做检验,这就是平均数对比的实质。放射性物探工作中要经常遇到某些元素的含量,放射性γ照射量率等的对比问题,仪器的“三性”检查工作中也要碰到类似的问题。

设从两个正态总体N(μ1,

)、N(μ2,

)中分别抽取容量为n1及n2的两个样本,其平均数分别记为

。当总体方差σ2未知时,由于要用样本方差s2去估计总体方差σ2,故做检验时,大样本与小样本是不相同的。因此,有大样本的平均数对比U检验,小样本的平均数对比t检验之分。

1.大样本平均数的对比——U检验

当两个样本为大样本,即n1>30,n2>30时,由本任务可知,两样本的平均数

,服从于N

与N

的正态分布。而其差值

则服从于N

的正态分布。前已假定方差比较稳定,因而有

,于是

服从N

的正态分布。

U检验的步骤如下:

(1)假设H0

μ12,于是

放射性勘探技术

进行标准化变换,令

放射性勘探技术

那么新变量U服从标准正态分布,即U~N(0,1),U就是检验中要用的统计量,可查F(u)表(见附录一),故称为U检验。

(2)确定临界值

若选定信度α=0.05,则从F(u)反查u值表中根据F(u)=1-

=0.975查出u的临界值uα=1.96。于是U位于区间(-1.96,1.96)的概率为95%,即P(-1.96<u<1.96)=0.95。也就是说在α=0.05的条件下U的肯定域为区间(-1.96,1.96)。可见|U|>1.96为其否定域。

(3)比较

计算实测样本的U值,与临界值uα进行比较。若|U|>uα,则否定原假设;若|U|<uα,就肯定原假设。

为了计算实测样本的U值,必须知道总体的标准差σ。若σ已知,则无论大、小样本都可用U检验进行假设检验。若σ未知,则要用两样本标准差s1、s2的加权平均值来估计总体标准差σ,即用

放射性勘探技术

代替σ,于是

放射性勘探技术

式(8-31)就是计算的U值,下面举例说明。

[例8-8]在某一斑状黑云母花岗岩地段进行放射性γ照射量率测量。测得169个数据(n1),平均照射量率

=31.7γ,标准差s1=2.5γ。后又在其相邻地段测得γ照射量率数据99个(n2),平均照射量率

=28.8γ,标准差s2=2.6γ。那么这两地段可否看成同一总体或同一岩性?

解:经过分布型式检验,两样本γ照射量率数据均服从正态分布,两样本标准差又近似相等,且都是大样本。显然可用U检验对两地段的平均数进行对比。将数据代入公式(8-31),可算出实测样本U值,即

放射性勘探技术

取信度α=0.05,查附录一,得U的临界值uα=1.96。而实测样本U=9.034>uα=1.96,故否定原假设H0,认为斑状黑云母花岗岩地段与其相邻地段不是同一总体,或者说,不是属于同一岩性。后经地质调查证实岩性为细粒二云母花岗岩,这两种花岗岩的结构不同,成分不同,侵入时代也不相同。

2.小样本平均数的对比——t检验

当两个样本中,只要有一个为小样本时,即n1与n2中有一个小于30,用样本方差s2去估计总体方差时,要用无偏估计量,即

放射性勘探技术

在这种情况下得不出新变量u服从标准正态分布的结论。因此也就不能用上述U检验的方法进行检验。用两个样本方差

来估计总体σ2时必须用公式

放射性勘探技术

来代替σ,这时要构造一个新的统计量t。t不像两个大样本的情况下要服从标准正态分布,而服从自由度f=n1+n2-2的t分布,或称学生(Student)分布。

当给定了信度α,如α=0.05,且自由度f=n1+n2-2为已知时,可在t分布临界值tα表中(见附录三)查出临界值tα。其否定域为|t|≥tα

[例8-9]在同一地点、相同条件下用两台γ能谱仪进行测量。第一台仪器测量10次,测得铀含量(10-6)x1分别为3.5、3.2、3.0、3.1、3.2、3.3、3.3、3.2、3.1、3.2,平均铀含量

=3.21×10-6,标准差s1=0.137×10-6;第二台仪器测量12次,测得铀含量(10-6)x2分别为3.1、3.5、3.3、3.2、3.4、3.4、3.5、3.6、3.1、3.4、3.5、3.3,平均铀含量

=3.358×10-6,标准差s2=0.162×10-6。问两台仪器测量结果是否一致?

解:因为

,这实际上是平均数对比问题。

1)假设H0,两台仪器读数的均值相等,即

μ12

2)计算实测样本统计量t:

放射性勘探技术

3)比较:

若取信度α=0.05,查t分布表(见附录三),其自由度f=n1+n2-2=20时,查得t的临界值tα/2=2.08。因为|t|=2.285>tα/2=2.08,所以否定原假设H01≠μ2,认为两台仪器读数的平均值差异显着,故两台仪器的一致性不好。

(六)方差对比——F检验

在平均数对比中,检验两个总体均值是否相同(无论大样本或小样本)之前,都应先假定被检验的两个总体服从正态分布,且方差相等。如果不能肯定方差基本相等则需先进行方差检验。只有当方差无显着性差异后,方可进行平均数的对比;否则,就不必进行平均数对比了,因为方差差异显着,已可认为两者不是同一总体了。

假设从两个正态总体N(μ1,

)、N(μ2,

)中,各抽取大小分别为n1、n2的样本。求出两样本之方差:

放射性勘探技术

通过对比两样本方差

来推断两个总体

间有无显着性差异。为此要构造一个“方差比”的统计量F,即

放射性勘探技术

统计量F服从第一自由度f1=n1-1、第二自由度f2=n2-1的F分布。当给定信度α后。且第一自由度f1与第二自由度f2为已知时,可从F分布临界值表中(见附录四)查出临界值Fα。本来当信度为α时,F检验的否定域为左右两边各取面积为α/2的两部分(图8-10)。但为了制表省略起见,F分布临界值表中,往往只给出F>l的右边临界值。因此,当给定了信度α,并已知第一自由度f1与第二自由度f2的情况下,查附录四时实际得出的是Fα/2值,这样在计算样本方差比F值时,就要使得F永远大于1。为此总是把两方差

中较大的一个放在分子上。若根据样本计算出的F<临界值Fα/2,则为肯定域;若F>Fα/2,就是否定域。

图8-10 F分布概率密度曲线图

[例8-10]用例8-9中两台仪器在同一地点观测的数据为准,用F检验的办法检验这两台能谱仪的方差有无显着差异。已知α=0.10。

解:设

分别表示第一台仪器和第二台仪器读数的总体方差。

1)假设H0

2)计算方差比:

第一台仪器10次测量和第二台仪器12次测量的均方差分别是s1=0.137×10-6和s2=0.162×10-6,直接代入公式(8-33)中,得

放射性勘探技术

3)确定临界值Fα

已知α=0.10,第一自由度f1=10-1=9,第二自由度f2=12-1=11,查附录四,得Fα/2=F(0.05)=2.27。

4)比较:

由于两个样本的方差比F=1.398<Fα=2.27,落在肯定域内,故肯定原假设H0

,即两台仪器读数的总体方差无显着差异。于是可进一步对两台仪器读数的平均值进行检验,以确定两台仪器的一致性是否符合要求。

阅读全文

与如何确定假设试验的检验方法相关的资料

热点内容
电脑主板排线的切割技巧和方法 浏览:950
窗户上的白腻子粉怎么弄干净物理方法 浏览:289
老人补骨脂的最佳方法 浏览:148
运动是减肥的最佳方法吗 浏览:461
财商教育数量分析方法 浏览:945
二头最佳锻炼方法 浏览:914
如何做甜点和做蛋糕最简单的方法 浏览:692
膝盖有积液用什么方法能快速消肿 浏览:347
英语如何用好的方法呈现形容词 浏览:394
原酒怎么储藏方法 浏览:486
行业研究报告分析方法 浏览:677
可口可乐解决负面影响的方法 浏览:614
膝关节检测方法养生堂 浏览:372
饿了么引流有哪些方法 浏览:382
扣安全带方法图片 浏览:637
冰箱的冰快速溶解的方法 浏览:55
红茶的制作方法发源地是哪里 浏览:605
正确的科学发声方法是哪里用力 浏览:401
高效沟通技巧和方法图片 浏览:293
初五接财神正确方法动图 浏览:722