❶ 如何確定假設檢驗的方法
什麼是假設檢驗:假設檢驗(hypothesis
testing)是數理統計學中根據一定假設條件由樣本推斷總體的一種方法。具體作法是:根據問題的需要對所研究的總體作某種假設,記作h0;選取合適的統計量,這個統計量的選取要使得在假設h0成立時,其分布為已知;由實測的樣本,計算出統計量的值,並根據預先給定的顯著性水平進行檢驗,作出拒絕或接受假設h0的判斷。常用的假設檢驗方法有u—檢驗法、t檢驗法、χ2檢驗法(卡方檢驗)、f—檢驗法,秩和檢驗等。
假設檢驗的基本步驟如下:
1、提出檢驗假設又稱無效假設,符號是h0;備擇假設的符號是h1。
h0:樣本與總體或樣本與樣本間的差異是由抽樣誤差引起的;
h1:樣本與總體或樣本與樣本間存在本質差異;
預先設定的檢驗水準為0.05;當檢驗假設為真,但被錯誤地拒絕的概率,記作α,通常取α=0.05或α=0.01。
2、選定統計方法,由樣本觀察值按相應的公式計算出統計量的大小,如x2值、t值等。根據資料的類型和特點,可分別選用z檢驗,t檢驗,秩和檢驗和卡方檢驗等。
3、根據統計量的大小及其分布確定檢驗假設成立的可能性p的大小並判斷結果。若p>α,結論為按α所取水準不顯著,不拒絕h0,即認為差別很可能是由於抽樣誤差造成的,在統計上不成立;如果p≤α,結論為按所取α水準顯著,拒絕h0,接受h1,則認為此差別不大可能僅由抽樣誤差所致,很可能是實驗因素不同造成的,故在統計上成立。p值的大小一般可通過查閱相應的界值表得到。
教學中的做法:
1.根據實際情況提出原假設和備擇假設;
2.根據假設的特徵,選擇合適的檢驗統計量;
3.根據樣本觀察值,計算檢驗統計量的觀察值(obs);
4.選擇許容顯著性水平,並根據相應的統計量的統計分布表查出相應的臨界值(ctrit);
5.根據檢驗統計量觀察值的位置決定原假設取捨。
❷ 簡述假設檢驗的步驟
一、假設檢驗的基本思想與步驟
如何被統計學家費舍爾提出:奶茶先加茶和先加奶的口味是不同的。於是科學家有一個原假設:該女士不具備區分奶茶與茶奶的能力。假設檢驗的基本思想就是小概率事件不會發生,當小概率事件發生時,我們更傾向認為原假設是錯誤。引入問題:某牛奶生產商在其一份研究報告中聲稱「中國人的平均身高不高於160 厘米,因而必須喝牛奶」假設所有國人的平均身高服從正態分布N(μ,),如何檢驗牛奶商關於身高的聲稱是否成立?
(一) 估計與假設檢驗的區別
上面不是一個參數估計的問題,必須採用假設檢驗的方法。假設檢驗(hypothesis testing)與參數估計(estimation)的思想是不同的。參數估計是指利用抽樣數據對總體參數進行直接估計,並得出總體參數的具體估計值;而假設檢驗則分為假設與檢驗兩步,先形成一個對總體參數的假設,然後再利用抽樣數據判斷這個假設是否成立。
上題中,參數估計是通過抽樣調查部分中國人身高,計算出樣本均值,並以此估計全國人的平均身高μ;而假設檢驗則是先形成一個命題如:「中國人的平均身高μ不高於160 厘米」,然後通過抽樣數據判斷該命題是否成立。
(二) 假設檢驗的基本思想
基本思想是「小概率事件不會發生」。假設抽樣了一萬人發現平均身高是180,,基本可以判斷前述是錯誤的命題。然而如果發現均值是161時那麼結論就沒那麼顯然了,就必須利用到概率分布與顯著性相關的信息。
(三) 假設檢驗的步驟
(1) 建立需檢驗的假設
(2) 選擇合適的檢驗統計量,並確定其服從的概率分布
(3) 選擇判斷假設是否成立的顯著性水平
(4) 給出決策准則(decision rule),即拒絕域的形式
(5) 收集數據,並計算檢驗統計量
(6) 做出判斷
(7) 根據判斷進行投資決策
二、假設檢驗的相關概念
(一)原假設(Null Hypothesis)與備擇假設(Alternative Hypothesis)
假設檢驗的第一步就是建立假設。通常將被檢驗的假設稱為原假設(null hypothesis),記為;當被拒絕時而接受的假設稱為備擇假設,記為或.原假設與備擇假設通常成對出現。身高問題中原假設與備擇假設可以用如下方式表示:
假設檢驗一般有兩種結果:第一種是原假設「不正確」,稱為拒絕(reject)原假設;第二種是原假設「正確」,稱為無法拒絕(can not reject)原假設。
在建立原假設與備擇假設時,有幾個細節要注意:
(1) 當原假設「正確」時,一般稱「無法拒絕原假設」而不是「接受原假設」,這是因為此時原假設並不是數學意義上的恆成立,而只是統計意義上的成立。
(2) 如果假設涉及不等式時,習慣將等號放在原假設
(3) 在構建原假設備擇假設時,習慣將想要得到的結論放在備擇假設
(二)檢驗統計量(Test Statistic)及其分布
在抽樣樣本檢驗原假設通常是通過一個統計量來完成的,這個統計量稱為檢驗統計量(test statistic)。檢驗統計量通常服從某個概率分布,於是可以通過計算檢驗統計量是否超過某一關鍵值來判斷是否拒絕原假設。在本書中,檢驗統計量通常以公式的形式出現:
(11.1)
如身高問題中,檢驗統計量就可以通過樣本均值來構建。由中心極限定理,服從正態分布N(μ,/n),按照(11.1)標准化後就服從標准正態分布。
(三)顯著性水平(Significance Level)與關鍵值(Critical Value)
有了檢驗統計量後,結合顯著性水平就可以計算出關鍵值(Critical Value)及其拒絕域(rejection region)。關鍵值是判斷是否拒絕原假設的臨界值。拒絕域是由原假設被拒絕的樣本觀測值所組成的區域。
在例題中,假設顯著性水平為5%,的標准化後服從標准正態分布,那麼檢驗統計量的關鍵值就是1.65?
根據正態分布95%置信區間對應的標准差不是1.96倍標准差嗎?為啥是1.65而不是1.96,是正數而不是負數?需要涉及單尾檢驗與雙尾檢驗。
(四) 雙尾檢驗(Two-Tailed Test)與單尾檢驗(One-Tailed Test)
假設檢驗通常有三種基本形式:
其中,θ表示總體參數,θ0表示當成立時總體參數的取值。
第一種形式稱為雙尾檢驗,第二種與第三種形式稱為單尾檢驗。無論是單尾還是雙尾檢驗所採用的檢驗統計量都是相同的,差別主要體現在拒絕域上。因此,區分單尾檢驗與雙尾檢驗對確定關鍵值(critical value)以及拒絕域(rejection region)至關重要。
(五) p值(p-value)
除了比較檢驗統計量與關鍵值,另一種判斷是否拒絕原假設的方法就是p值(p-value)。p值指拒絕原假設的最小顯著水平。根據p值定義,在給定顯著水平α的情況下,如果p<=α,則拒絕原假設;如果p>α,則無法拒絕原假設。
例如,我們要進行顯著性水平為5%的雙尾檢驗,已知p值=2.14%,這就意味著,左側對應的尾部面積為1.07%,即統計量絕對值大於,應該要拒絕原假設。當然,也可以利用p值進行判斷,p值=2.14%<5%,因此應該要拒絕原假設。畫個圖:
(六) 第一類錯誤(Type I Error)與第二類錯誤(Type II Error)
雖然假設檢驗的基本思想是「小概率事件不會發生」,但在真實世界中小概率事件是有可能發生的。因而,我們在判斷假設檢驗是否成立時就有可能犯錯誤。檢驗時可能犯的錯誤可歸為兩類:一是當原假設H0真實成立時,我們卻拒絕了原假設,稱為第一類錯誤,也稱為「拒真概率」;二是當原假設H0不成立時,我們卻接受了原假設,稱為第二類錯誤,也稱為「受偽概率」。
假設檢驗的兩種錯誤:
決策
真實情形
H0正確
H0錯誤
沒有拒絕H0
正確決策
第二類錯誤
(犯錯概率=β)
拒絕H0接受Ha
第一類錯誤
(犯錯概率=α)
正確決策
(概率power of test:1-β)
上表有幾個關於概率的標識:通常我們將犯第一類錯誤的概率記為α,這里的α實際上就是假設檢驗中的顯著性水平;犯第二類錯誤的概率記為β。此外,當原假設正確時接受原假設,當錯誤時拒絕原假設都表明決策者做出了正確的抉擇沒有犯錯,特別的,我們將決策者不犯第二類錯誤的概率稱為統計檢驗力(power of test),記為1-β
(七) 統計顯著(Statistical significance)與經濟顯著(Economic Significance)
在利用假設檢驗進行金融分析時注意區別兩者,許多投資策略在假設檢驗上能夠獲得正收益,然而在扣除交易費用、稅收並考慮風險後就無法經濟顯著獲得正收益。
❸ 如何驗證假設
統計學中假設檢驗的基本步驟:1.建立假設,確定檢驗水準α假設有零假設(H0)和備擇假設(H1)兩個,零假設又叫作無效假設或檢驗假設.H0和H1的關系是互相對立的,如果拒絕H0,就要接受H1,根據備擇假設不同,假設檢驗有單、雙側檢驗兩種.檢驗水準用α表示,通常取0.05或0.10,檢驗水準說明了該檢驗犯第一類錯誤的概率.
2.根據研究目的和設計類型選擇適合的檢驗方法這里的檢驗方法,是指參數檢驗方法,有u檢驗、t檢驗和方差分析三種,對應於不同的檢驗公式.對雙樣本資料,要注意區分成組設計和配對設計的資料類型.如果資料里有"配成對子"字樣,或者是對同一對象用兩種方法來處理,一般就可以判定是配對設計資料.
3.確定P值並作出統計結論u檢驗得到的是u統計量或稱u值,t檢驗得到的是t統計量或稱t值.方差分析得到的是F統計量或稱F值.將求得的統計量絕對值與界值相比,可以確定P值.
❹ 檢驗假設的方法
常用的假設檢驗的方法有以下四種: (1)Z檢驗。Z檢驗常用於總體正態分布、方差已知或獨立大樣本的平均數的顯著性和差異的顯著性檢驗,非正態分布的皮爾森積差相關系數和二列相關系數的顯著性檢驗以及兩個相關系數分別由兩組被試得到的相關系數差異性檢驗等情況。 (2)t檢驗。t檢驗常用於總體正態分布、總體方差未知或獨立小樣本的平均數的顯著性檢驗,平均數差異顯著性檢驗,相關系數由同一組被試取得的相關系數差異顯著性檢驗,非正態分布的皮爾森相關系數的顯著性檢驗等情況。
❺ 假設檢驗的思想和步驟
假設檢驗的基本思想是小概率反證法思想。基本依據是「小概率原理」. 所謂小概率原理就是:概率很小的隨機事件在一次試驗中一般不會發生. 根據這一原理,我們從H0 出發,在一定的顯著性水平α下,從總體中抽取一個子樣進行檢驗,在H0 成立的條件下,若發現「相應統計量(即隨機變數) 取到此子樣代入統計量後的值」是一個小概率事件,亦即小概率事件在一次試驗中發生了,這與「小概率原理」矛盾,所以,此時就拒絕H0 並接受H1 ;反之,就只有被迫接受H0 .
假設檢驗的一般步驟
1) 根據實際問題提出原假設H0與備選假設H1,即說明需要檢驗的假設的具體內容;
2) 選擇適當的檢驗統計量,並在原假設H0成立的條件下確定該統計量的分布及原H0的拒絕域的形式;
3) 按問題的具體要求,選取適當的顯著性水平α,並根據統計量的分布查表,確定對應於α的臨界值,求出H0的拒絕域;
我真無聊,竟然來回答數學問題 o(╯□╰)o
❻ 統計學中假設檢驗的基本步驟有哪些
1、提出檢驗假設又稱無效假設,符號是H0;備擇假設的符號是H1。
H0:樣本與總體或樣本與樣本間的差異是由抽樣誤差引起的;
H1:樣本與總體或樣本與樣本間存在本質差異;
預先設定的檢驗水準為0.05;當檢驗假設為真,但被錯誤地拒絕的概率,記作α,通常取α=0.05或α=0.01。
2、選定統計方法,由樣本觀察值按相應的公式計算出統計量的大小,如X2值、t值等。根據資料的類型和特點,可分別選用Z檢驗,T檢驗,秩和檢驗和卡方檢驗等。
3、根據統計量的大小及其分布確定檢驗假設成立的可能性P的大小並判斷結果。若P>α,結論為按α所取水準不顯著,不拒絕H0,即認為差別很可能是由於抽樣誤差造成的,在統計上不成立;
如果P≤α,結論為按所取α水準顯著,拒絕H0,接受H1,則認為此差別不大可能僅由抽樣誤差所致,很可能是實驗因素不同造成的,故在統計上成立。P值的大小一般可通過查閱相應的界值表得到。
(6)如何確定假設試驗的檢驗方法擴展閱讀
注意事項
要進行統計假設的檢驗, 必須利用各種不同的判據, 即利用規則來選擇。假設的採用與拒絕, 通常在判據的前件中應有某個數量指標(稱為統計判據)。
根據判據方式, 假設分為參數假設和非參數假設。按照參數統計結論, 通常應提出被研究特徵在總體中分布的具體形式, 因為在這種情況下, 統計學通常是以分布參數(平均值、方差、回歸系數)的利用為依據的。非參數判據的優點是能把判據用於只靠名義級或次序級完成的特徵度量上。
否定零假設的判據值總體能構成否定域。如果某一點能將否定域與接受零假設的區域劃分開來, 這一點就稱為臨界點。
❼ 假設檢驗的是基本思想是什麼步驟是什麼
假設檢驗的基本思想是小概率反證法思想基本步驟
1、提出檢驗假設(又稱無效假設,符號是H0))和備擇假設(符號是H1)。
H0:樣本與總體或樣本與樣本間的差異是由抽樣誤差引起的;
H1:樣本與總體或樣本與樣本間存在本質差異;
預先設定的檢驗水準為0.05;當檢驗假設為真,但被錯誤地拒絕的概率,記作α,通常取α=0.05或α=0.01。
2、選定統計方法,由樣本觀察值按相應的公式計算出統計量的大小,如X2值、t值等。根據資料的類型和特點,可分別選用Z檢驗,T檢驗,秩和檢驗和卡方檢驗等。
3、根據統計量的大小及其分布確定檢驗假設成立的可能性P的大小並判斷結果。若P>α,結論為按α所取水準不顯著,不拒絕H0,即認為差別很可能是由於抽樣誤差造成的,在統計上不成立;如果P≤α,結論為按所取α水準顯著,拒絕H0,接受H1,則認為此差別不大可能僅由抽樣誤差所致,很可能是實驗因素不同造成的,故在統計上成立。P值的大小一般可通過查閱相應的界值表得到。
❽ 統計學的假設檢驗方法
統計學假設檢驗主要有T檢驗、Z檢驗兩種方法,具體內容是:
1、T檢驗,亦稱student t檢驗(Student's t test),主要用於樣本含量較小(例如n<30),總體標准差σ未知的正態分布資料。
2、z檢驗(U檢驗),是一般用於大樣本(即樣本容量大於30)平均值差異性檢驗的方法。它是用標准正態分布的理論來推斷差異發生的概率,從而比較兩個平均數的差異是否顯著。
除以上兩種主要方法外,還有F檢驗和卡方檢驗。
❾ 假設檢驗
(一)假設檢驗的基本思想
統計假設檢驗就是為了推斷某個問題,事先做出一種假設。然後用一個實測樣本數據計算出某一個適合的、已知其分布的統計量,並通過查表得出其相應的臨界值。再用實測樣本數據計算出來的關於統計量與其臨界值進行比較,從而得出肯定(接受)原假設或否定(拒絕)原假設的結論,達到統計推斷之目的,下面舉例說明。
[例8-4]在某測區的海西期第二階段中粗粒黑雲母花崗岩(
解:假定這批γ照射量率數據都服從正態分布。此例中,300個數據是很大的樣本,可以把它看成總體,故可用300個數據的平均數與標准差當作總體的均值與標准差,即μ=35γ,σ=8γ,80個觀測數據仍看成是樣本。由於樣本標准差s=8.2γ與總體標准差相差甚小。因此,只需檢驗樣本平均數
(1)假設H0
放射性勘探技術
其中:μ=35(γ),σ=8(γ),
(2)構造一個統計量u
先將樣本平均數標准化,即
放射性勘探技術
式(8-21)中的統計量u服從標准正態分布,即u~N(0,1)。
(3)確定臨界值
給定信度α=0.05,則由附錄一查出F(u)=1-α/2=0.975所對應的uα=1.96,故有
P{-1.96<u<1.96}=1-α=0.95
即
放射性勘探技術
或
放射性勘探技術
其中33.26γ與36.74γ是臨界值,而區間(33.26,36.74)是肯定域。區間以外為否定域。這就是說,樣本平均數
(4)計算實測樣本平均數
由於實測樣本平均數
(二)差異的顯著性與信度(顯著性水平)
上例的統計推斷性結論是在信度(顯著性水平)α=0.05的條件下做出的。如果將信度α定得小一些,那麼做出的統計性結論就有可能改變。比如α=0.01,由附錄一可查出F(u)=1-α/2=0.995所對應的u臨界值uα=2.58,故有
放射性勘探技術
或
放射性勘探技術
在這種情況下,臨界值為32.7γ與37.3γ,故區間(32.7,37.3)為肯定域。而實測樣本
顯而易見,信度α如何選擇,直接影響到差異是否顯著的結論。可見,任何差異是否顯著的推斷都是在一定的信度(顯著性水平)α下做出的。α定得越大,肯定域就小,但推斷的可靠性差(即置信概率小)。反之,α定得愈小,肯定域就愈大,推斷的可靠性強(置信概率大)。放射性物探工作中所要進行的統計假設檢驗,一般將信度α定為0.05或0.01較為恰當,此時置信概率分別為95%與99%。
(三)統計假設檢驗的分類
統計假設檢驗可分為兩大類,即參數性方法與非參數性方法,就是假定總體的分布型式已知(經常假定為正態分布),只要對參數進行檢驗即可。非參數性方法,則不管總體的分布如何,都能應用。
參數性方法又可分為大樣本與小樣本推斷兩種。一般當n>30~50時,可稱為大樣本,凡屬大樣本一律可按正態分布處理。
(四)分布型式的檢驗
放射性物探工作中經常要統計各種底數。進行底數統計之前,就要對觀測數據進行分布型式的檢驗,以確定觀測數據服從何種概率分布,並採用相應的底數與標准差的計算方法。當然根據頻率分布直方圖的形狀也大致可以看出其分布型式,但這是不嚴格的,需要進行檢驗。檢驗的方法很多,下面介紹幾種方法:
1.偏度、峰度檢驗法
這是一種檢驗概率分布是否屬於正態分布的參數性方法,要求有大樣本(n>100)。此種檢驗方法中要用的兩個統計量CS(偏度)與CE(峰度),其計算公式已在本項目學習任務一中給出。
當總體服從正態分布時,若樣本為大樣本(n>100),則統計量CS、CE近似服從正態分布,即CS~N(0,6/n),CE~N(0,24/n)。
現以本項目學習任務一某花崗岩體的228個γ測量數據為例,說明如何用偏度系數和峰度系數法檢驗分布型式的方法。
[例8-5]用偏度系數和峰度系數法檢驗表8-1中某地區γ普查數據是否服從正態分布,給定信度α=0.05。
(1)假設H0
該地區γ照射量率數據服從正態分布。又因樣本容量n=228,為大樣本,故
CS~N(0,6/228),CE~N(0,24/228)
將這兩個參數標准化,有
放射性勘探技術
經過標准化變換以後,公式(8-22)和公式(8-23)都服從標准正態分布N(0,1)。
(2)計算標准化後的概率區間
在α=0.05下,查得F(u)=1-α/2=0.975所對應的uα=1.96,故有
放射性勘探技術
即
P{-0.32<CS<0.32}=0.95
故CS的臨界值為-0.32和0.32,即區間(-0.32,0.32)為肯定域,其外為否定域。
同樣對於CE,有
放射性勘探技術
即
P{-0.64<CE<0.64}
故CE的臨界值為-0.64和0.64,即區間(-0.64,0.64)為肯定域,其外為否定域。
(3)計算樣本的CS和CE
根據實測數據可用列表法求取偏度系數CS和峰度系數CE,見表8-5。
表8-5 某地區放射性測量γ射線照射量率(γ)偏度系數和峰度系數計算表
續表
根據表8-5計算CS和CE,步驟如下:
放射性勘探技術
三階中心矩(M3)和四階中心矩M4計算如下:
放射性勘探技術
於是
放射性勘探技術
(4)比較
將由實測樣本計算的CS和CE與其臨界值進行比較,可見樣本的CS=0.0903和CE=-0.5921都落在肯定域內,故肯定原假設,認為該地區的γ射線照射量率符合正態分布。
2.正態概率格紙檢驗法
顯然上述檢驗方法比較麻煩,計算工作量較大,而且要求是大樣本。在本項目學習任務二曾指出,在正態概率格紙上做出的正態分布的累積概率曲線為一條直線。因此便可根據畫在正態概率格紙上的實測樣本數據的諸(xi,Fi)點是否基本在一條直線上,來檢驗該批數據是否符合正態分布。其中xi為實測樣本分組數據的組上限,Fi為其累積頻率。這種檢驗方法稱為正態概率格紙檢驗法。
下面仍然以某地區花崗岩228個γ照射量率數據為例,說明其檢驗方法。
[例8-6]使用表8-1的數據,用正態概率紙法檢驗某地區γ普查數據是否符合正態分布。
解:以表8-1中的累積頻率為縱坐標,將數據分組值(組上限)為橫坐標,在正態概率格紙上打點,即A(21.5,1.32)、B(25.5,7.46)、C(29.5,20.64)、D(33.5,41.23)、E(37.5,64.64)、F(41.5,82.64)、G(45.5,94.74)、H(49.5,98.25);然後用直尺畫一條直線,盡可能將各點聯結起來,如圖8-9所示,其做法與用累積頻率展直線法求正常值的做法相同。
由圖8-9可見,這些點基本落在一條直線上,因此該批數據服從正態分布,這與用偏度、峰度檢驗法得出的結論相同。由圖8-9還可見到,有些點與直線有些偏差,這是允許的,但是偏差不能太大。偏差太大,則不一定屬於正態分布。一般說來,中間的點(即靠近累積頻率為50%橫線附近的點)偏差不能太大,兩端的點偏差可以適當大一點。究竟偏離多遠可認為是允許的,需繪制一定信度α下的臨界曲線,見圖5-5所示,以此作為衡量的標准。臨界值曲線的畫法請參閱有關書籍。
3.χ2檢驗法
χ2檢驗不但可以檢驗正態分布,還可以檢驗泊松分布、二項分布、負二項分布、指數分布等的分布型式。
(1)理論原理
這是在總體x為未知時,根據它的n個觀測值x1,x2,…,xn來檢驗關於總體分布的假設
H0:總體x的分布函數為F(x)(8-24)
的一種方法。
注意,若總體分布為離散型,則假設式(8-24)相當於
H0:總體x的分布律為P{x=ti}=pi(i=1,2,…)(8-25)
若總體分布函數為連續型,則假設式(8-24)相當於
H0:總體x的概率密度為f(x)(8-26)
式(8-24)~式(8-26)是χ2檢驗的理論模型表達式。
在用下述χ2檢驗法檢驗假設H0時,要求在假設H0下F(x)的分布型式及其參數都是已知的。但實際上參數往往是未知的,這時,需要先用極大似然法估計參數,然後做檢驗。
χ2檢驗法的基本思想是:把隨機實驗結果的全體S分為k個互不相容事件A1,A2,…,Ak(A1∪A2∪…∪Ak=S,AiAj=ϕ,i≠j;i,j=1,2,…,k)。於是,在假設H0下,我們可以計算理論頻率pi=P(Ai)(i=1,2,…,k)。顯然,在n次試驗中,事件Ai出現的頻率
放射性勘探技術
作為檢驗理論(即假設H0)與實際符合的尺度。並證明了如下的定理:若n充分大(n≥50),則不論總體屬於什麼分布,統計量式(8-27)總是近似地服從自由度為k-r-1的χ2分布。其中,r是被估計參數的個數。
於是,若在假設H0下算得皮爾遜統計量的值,即式(8-27),有
放射性勘探技術
則在顯著性水平α下拒絕H0;若式(8-28)中不等號反向,就接受H0。
χ2檢驗的具體步驟是:
把實軸分為k個互不相容的區間[αi,αi+1](i=1,2,…,k),其中αi,αi+1可分別取-∞,+∞。區間的劃分方法視具體情況而定。
其次,計算概率
pi=F(αi+1)-F(αi)=P{αi<x≤αi+1}(8-29)
此處,F(x)由式(8-29)確定。然後算出pi與樣本容量n的乘積npi稱為理論頻數。
同時,計算樣本觀察值x1,x2,…,xn在區間(αi,αi+1]中的個數
然後,將
χ2檢驗法是在n無限增大時推導出來的,所以在使用時必須注意n要足夠大,以及npi不太小這兩個條件。根據經驗,要求樣本容量n不小於50,當n剛剛大於50附近時,npi最好在5以上,在n大於100時npi最好取10以上,否則應當適當的合並區間(或Ai),使npi滿足這個要求。特別是在邊部小概率事件下要進行適當地並組,這樣可以有效的壓低邊部「干擾」,突出數據中部的「有用信號」。
下面通過實例來說明檢驗的過程。
(2)應用實例
[例8-7]試用χ2檢驗的辦法檢驗某地區閃長岩釷含量是否服從對數正態分布(取α=0.05)。原始數據單位為10-6,取常用對數以後的統計結果見表8-6。
表8-6 某地區閃長岩釷含量對數值統計表
解:為方便起見,根據表8-6所整理的結果來做檢驗。因參數都是未知的,故應用極大似然估計法估計μ、
放射性勘探技術
注意:這里的
估計
放射性勘探技術
注意,公式中的n=110,為樣品容量;k為分組數,表示並組後的組數。這里對第1~3和13~15組進行了並組,故k=11。對於分組時兩頭的小組實行並組是為了有效地減小偶然誤差。
所以,我們要檢驗的假設為
H0:x~N(0.7509,0.24842)
為便於計算npi,應先做變換u=(x-0.7509)/0.2484。化x為標准正態變數u,與正態分布概率紙檢驗法一樣,查出各個u之下的累積頻率,算出區間頻率、頻數,這些都是理論值。如表8-7所示。
表8-7 某區閃長岩釷含量對數正態分布χ2檢驗表
標准正態分布表中查出的是累積頻率F(u);每一個區間頻率為該區間累積頻率與上一個區間累計頻率之差;n=110,為樣品容量,而非分組組數,故npi表示理論頻數;
由於並組後組數k=11,估計了兩個參數(
放射性勘探技術
故在水平α=0.05下接受H0,認為該地區岩石釷含量符合對數正態分布,並且釷含量對數
通過上例可見,用χ2檢驗法(或其他檢驗方法)得到的結果往往較概率紙精確。特別是,有的檢驗法(如χ2檢驗法)能控制犯第一類錯誤的概率α,這是概率紙所做不到的。但概率紙使用方便,無須太多的計算,因此,概率紙常用來初步估計總體的分布類型及參數的一次近似之用。然後用χ2檢驗法(或距離計演算法、偏度系數和峰度系數檢驗法等)進一步做精確的檢驗。
(五)平均數的對比(U檢驗和t檢驗)
由本項目學習任務二正態分布的介紹,可知正態分布有兩個重要參數,一個是均值μ,另一個是標准差σ。當μ與σ確定後,正態分布N(μ,σ)就完全確定了;且在一般情況下,標准差σ比較穩定。要檢驗兩個正態分布是否相同,或者說,兩個正態分布的樣本是否屬於同一總體,只要對均值μ做檢驗,這就是平均數對比的實質。放射性物探工作中要經常遇到某些元素的含量,放射性γ照射量率等的對比問題,儀器的「三性」檢查工作中也要碰到類似的問題。
設從兩個正態總體N(μ1,
1.大樣本平均數的對比——U檢驗
當兩個樣本為大樣本,即n1>30,n2>30時,由本任務可知,兩樣本的平均數
U檢驗的步驟如下:
(1)假設H0
μ1=μ2,於是
放射性勘探技術
將
放射性勘探技術
那麼新變數U服從標准正態分布,即U~N(0,1),U就是檢驗中要用的統計量,可查F(u)表(見附錄一),故稱為U檢驗。
(2)確定臨界值
若選定信度α=0.05,則從F(u)反查u值表中根據F(u)=1-
(3)比較
計算實測樣本的U值,與臨界值uα進行比較。若|U|>uα,則否定原假設;若|U|<uα,就肯定原假設。
為了計算實測樣本的U值,必須知道總體的標准差σ。若σ已知,則無論大、小樣本都可用U檢驗進行假設檢驗。若σ未知,則要用兩樣本標准差s1、s2的加權平均值來估計總體標准差σ,即用
放射性勘探技術
代替σ,於是
放射性勘探技術
式(8-31)就是計算的U值,下面舉例說明。
[例8-8]在某一斑狀黑雲母花崗岩地段進行放射性γ照射量率測量。測得169個數據(n1),平均照射量率
解:經過分布型式檢驗,兩樣本γ照射量率數據均服從正態分布,兩樣本標准差又近似相等,且都是大樣本。顯然可用U檢驗對兩地段的平均數進行對比。將數據代入公式(8-31),可算出實測樣本U值,即
放射性勘探技術
取信度α=0.05,查附錄一,得U的臨界值uα=1.96。而實測樣本U=9.034>uα=1.96,故否定原假設H0,認為斑狀黑雲母花崗岩地段與其相鄰地段不是同一總體,或者說,不是屬於同一岩性。後經地質調查證實岩性為細粒二雲母花崗岩,這兩種花崗岩的結構不同,成分不同,侵入時代也不相同。
2.小樣本平均數的對比——t檢驗
當兩個樣本中,只要有一個為小樣本時,即n1與n2中有一個小於30,用樣本方差s2去估計總體方差時,要用無偏估計量,即
放射性勘探技術
在這種情況下得不出新變數u服從標准正態分布的結論。因此也就不能用上述U檢驗的方法進行檢驗。用兩個樣本方差
放射性勘探技術
來代替σ,這時要構造一個新的統計量t。t不像兩個大樣本的情況下要服從標准正態分布,而服從自由度f=n1+n2-2的t分布,或稱學生(Student)分布。
當給定了信度α,如α=0.05,且自由度f=n1+n2-2為已知時,可在t分布臨界值tα表中(見附錄三)查出臨界值tα。其否定域為|t|≥tα。
[例8-9]在同一地點、相同條件下用兩台γ能譜儀進行測量。第一台儀器測量10次,測得鈾含量(10-6)x1分別為3.5、3.2、3.0、3.1、3.2、3.3、3.3、3.2、3.1、3.2,平均鈾含量
解:因為
1)假設H0,兩台儀器讀數的均值相等,即
μ1=μ2
2)計算實測樣本統計量t:
放射性勘探技術
3)比較:
若取信度α=0.05,查t分布表(見附錄三),其自由度f=n1+n2-2=20時,查得t的臨界值tα/2=2.08。因為|t|=2.285>tα/2=2.08,所以否定原假設H0,μ1≠μ2,認為兩台儀器讀數的平均值差異顯著,故兩台儀器的一致性不好。
(六)方差對比——F檢驗
在平均數對比中,檢驗兩個總體均值是否相同(無論大樣本或小樣本)之前,都應先假定被檢驗的兩個總體服從正態分布,且方差相等。如果不能肯定方差基本相等則需先進行方差檢驗。只有當方差無顯著性差異後,方可進行平均數的對比;否則,就不必進行平均數對比了,因為方差差異顯著,已可認為兩者不是同一總體了。
假設從兩個正態總體N(μ1,
放射性勘探技術
通過對比兩樣本方差
放射性勘探技術
統計量F服從第一自由度f1=n1-1、第二自由度f2=n2-1的F分布。當給定信度α後。且第一自由度f1與第二自由度f2為已知時,可從F分布臨界值表中(見附錄四)查出臨界值Fα。本來當信度為α時,F檢驗的否定域為左右兩邊各取面積為α/2的兩部分(圖8-10)。但為了製表省略起見,F分布臨界值表中,往往只給出F>l的右邊臨界值。因此,當給定了信度α,並已知第一自由度f1與第二自由度f2的情況下,查附錄四時實際得出的是Fα/2值,這樣在計算樣本方差比F值時,就要使得F永遠大於1。為此總是把兩方差
圖8-10 F分布概率密度曲線圖
[例8-10]用例8-9中兩台儀器在同一地點觀測的數據為准,用F檢驗的辦法檢驗這兩台能譜儀的方差有無顯著差異。已知α=0.10。
解:設
1)假設H0:
2)計算方差比:
第一台儀器10次測量和第二台儀器12次測量的均方差分別是s1=0.137×10-6和s2=0.162×10-6,直接代入公式(8-33)中,得
放射性勘探技術
3)確定臨界值Fα:
已知α=0.10,第一自由度f1=10-1=9,第二自由度f2=12-1=11,查附錄四,得Fα/2=F(0.05)=2.27。
4)比較:
由於兩個樣本的方差比F=1.398<Fα=2.27,落在肯定域內,故肯定原假設H0: