『壹』 如何檢驗一個樣本的正態分布情況
判斷正態分布的方法如下:
一、正態性檢驗:偏度和峰度。
1、偏度(Skewness):描述數據分布不對稱的方向及其程度。
當偏度≈0時,可認為分布是對稱的,服從正態分布;
當偏度>0時,分布為右偏,即拖尾在右邊,峰尖在左邊,也稱為正偏態;
當偏度<0時,分布為左偏,即拖尾在左邊,峰尖在右邊,也稱為負偏態;
2、峰度(Kurtosis):描述數據分布形態的陡緩程頌李度。
當峰度≈0時,可認為分布的峰態合適,服從正態分布(不胖不瘦);
當峰度>0時,分布的峰態陡峭(高尖);
當峰度<0時,分布的峰態平緩(矮胖);
3、SPSS操作方法。
4、結果解讀。
二、正態性檢驗:圖形判斷。
1、直方圖:表示連續性變數的頻數分布野顫遲,可以用來考察是否服從正態分布
選擇「圖形」下拉菜單中的「舊對話框」,選擇「舊對話框」中的「直方圖」;
把變數「x2」放入變數框中,勾選「顯洞塵示正態曲線」;
2、P-P圖和Q-Q圖。
(1)P-P圖反映了變數的實際累積概率與理論累積概率的符合程度,Q-Q圖反映了變數的實際分布與理論分布的符合程度,兩者意義相似,都可以用來考察數據資料是否服從某種分布類型。若數據服從正態分布,則數據點應與理論直線(即對角線)基本重合。
(2)SPSS操作:
選擇「分析」下來菜單中的「描述統計」,及「描述統計」下的「P-P圖」;
選擇變數,及勾選正態分布;生成如下圖形。
三、正態性檢驗:非參數檢驗方法。
『貳』 判斷正態性的幾種方法總結
數據服從正態分布是很多分析方法的前提條件,在進碧豎叢行方差分析、回歸分析等分析前,首先要對數據的正態性進行分析,確保方法選擇正確。如果不滿足正態性特質,則需要考慮使用其他方法或對數據進行處理。
檢測數據正態性的方法有很多種,以下為幾種常見方法:圖示法、統計檢驗法、描述法等。
正態分布圖可直觀地展示數據分布情況,並結合正態曲線判斷數據是否符合正態分布。
分析時,選擇【正態圖】分析方法,拖拽分析項到右側分析框內,點擊「開始正態圖分析」即可得到結果。悔櫻
若數據基本符合正態分布,則會呈現出中間高、兩側低、左右基本對稱的「鍾形」分布曲線。
若數據為定類數據或數據量較少,一般很難呈現出標準的正態分布纖閉,此時建議只要圖形呈現出「鍾形」也可接受數據服從正態分布。
若數據分布完全偏離正態,則說明數據不符合正態分布。
P-P圖和Q-Q圖,都是通過散點與正態分布的預測直線法重合程度以說明數據是否服從正態分布。
P-P圖是將實際數據累積比例作為X軸,將對應正態分布累積比例作為Y軸,作散點圖,反映實際累積概率與理論累積概率的符合程度。
Q-Q圖將實際數據作為X軸,將對應正態分布分位數作為Y軸,作散點圖,反映變數的實際分布與理論分布的符合程度。
如數據服從正態分布,則散點分布應近似呈現為一條對角直線。反之則說明數據非正態。P-P圖和Q-Q圖的功能一致,使用時沒有區別。
利用統計圖分析正態性,往往是依靠分析者的主觀判斷進行。因而容易產生結果偏差。因此需要結合其他方法,對數據的正態性指標進行統計描述。
正態性檢驗分析定量數據是否具有正態分布特質。
操作步驟:選擇【正態性檢驗】分析方法,拖拽分析項到右側分析框內,點擊「開始正態性檢驗」即可得到結果。
如果樣本量大於50,則應該使用Kolmogorov-Smirnov檢驗結果,反之則使用Shapro-Wilk檢驗的結果。
上圖中,樣本量為300,因而選擇K-S檢驗。P值=0.149>0.05,說明數據服從正態分布。
描述法即通過描述數據偏度和峰度系數檢驗數據的正態性。
偏度和峰度可通過描述性分析得到,也可在正態性檢驗中直接查看。
理論上講,標准正態分布偏度和峰度均為0,但現實中數據無法滿足標准正態分布,因而如果峰度絕對值小於10並且偏度絕對值小於3,則說明數據雖然不是絕對正態,但基本可接受為正態分布。
檢驗數據正態性的方法有很多,其中統計檢驗法對於數據的要求最為嚴格,而實際數據由於樣本不足等原因,即使數據總體正態但統計檢驗出來也顯示非正態,實用性上不如圖示法直觀,接受程度高,因此一般情況下使用圖示法相對較多。
當正態圖和正態性檢驗結果出現矛盾,如正態圖顯示數據分布對稱而正態性檢驗結果P<0.05,此時建議不要追求絕對的正態,如數據基本滿足正態性即可接受服從正態分布。
另外,正態性檢驗要求嚴格通常無法滿足,如果峰度絕對值小於10並且偏度絕對值小於3,則說明數據雖然不是絕對正態,但基本可接受為正態分布。
若想將非正態性數據轉化為正態性數據,可將數據取對數、開根號等處理,以接近正態性。
更多干貨內容歡迎登陸 SPSSAU官網 閱讀
『叄』 符合正態分布用什麼檢驗方法
符合正態分布檢驗的方法如下:
正態分布簡介:
正態分布又名高斯分布,是一個在數學、物理及工程等領域都非常重要的概率分布,在統計學的許多方面有著重大的影響力。若隨機變數服從一個位置參數、尺度參數為的概率分布,記為:則其概率密度函數為正態分布的數學期望值或期望值等於位置參數,決定了分布的位置;其期差的開平方或標准差等於尺度參數,決定了分布的幅度。
正態分布的概率密度函數曲線呈鍾形,因此人們又經稱之為鍾形曲線。我們通常所說的標准正態分布是位置參數,尺度參數的正態分布。