A. spss分析方法-相關分析(轉載)
相關性分析是指對兩個或多個具備相關性的變數元素進行分析,從而衡量兩個變數因素的相關密切程度。相關性的元素之間需要存在一定的聯系或者概率才可以進行相關性分析。
[if !supportLineBreakNewLine]
[endif]
相關分析是不考慮變數之間的因果關系而只研究分析變數之間的相關關系的一種統計分析方法,包括簡單相關分析、偏相關分析、距離分析等。
下面我們主要從下面四個方面來解說:
[if !supportLineBreakNewLine]
[endif]
實際應用
理論思想
操作過程
分析結果
[if !supportLineBreakNewLine]
[endif]
一、實際應用
[if !supportLineBreakNewLine]
[endif]
相關性不等於因果性,也不是簡單的個性化,相關性所涵蓋的范圍和領域幾乎覆蓋了我們所見到的方方面面,相關性在不同的學科裡面的定義也有很大的差異。
1、簡單相關分析
[if !supportLineBreakNewLine]
[endif]
生活中常需要我們對 兩個變數間的相關關系 進行分析,即通過計算兩個變數之間的相關系數,是否顯著相關作出判斷。
2、偏相關分析相關分析通過計算兩個變數之間的相關系數分析變數間線性相關的程度。在多元相關分析中,由於受到其他變數的影響,兩變數相關系數只是從表面上反映了兩個變數的性質,往往不能真實地反映變數間的線性相關程度,此時就需要用到偏相關分析,這時候就 需要把其他變數控制住,然後輸出控制其他變數影響後的相關系數,得以從中剔除其他變數的線性影響 。3、距離分析偏相關分析通過控制一些被認為次要的變數的影響得到兩個變數間的實際相關系數,但實際問題中,變數可能會多到無法一一關心的地步,每個變數都攜帶了一定的信息,但彼此又有所重疊,此時 最直接的方法就是將所有變數按照一定的標准進行分類,即進行聚類分析。
[if !supportLineBreakNewLine]
[endif]
[if !supportLineBreakNewLine]
[endif]
二、理論思想
相關分析研究現象之間是否存在某種依存關系,並對具體有依存關系的現象探討其相關方向及相關程度,是研究隨機變數之間相關關系的一種統計方法。
現象與現象之間的依存關系,從數量聯繫上看,可以分為兩種不同的類型,即函數關系和相關關系。
[if !supportLineBreakNewLine]
[endif]
函數關系是從數量上反映現象間嚴格的依存關系,即當一個或幾個變數取一定的值時,另一個變數有確定值與之相對應。相關關系是現象間不嚴格的依存關系,即各變數之間不存在確定性的關系。
[if !supportLineBreakNewLine]
[endif]
在相關關系中,當一個或幾個相互聯系的變數取一定數值時,與之相對應的另一變數值也相應發生變化,但其關系值不是固定的,往往按照某種規律在一定的范圍內變化。
[if !supportLineBreakNewLine]
[endif]
回歸方程的確定系數在一定程度上反映了兩個變數之間關系的密切程度,並且確定系數的平方根就是相關系數。但確定系數一般是在擬合回歸方程之後計算的,如果兩個變數間的相關程度不高,擬合回歸方程便沒有意義, 因此相關分析往往在回歸分析前進行。
[if !supportLineBreakNewLine]
[endif]
對不同類型的變數,相關系數的計算公式也不同。在相關分析中,常用的相關系數主要有皮爾遜簡單相關系數、斯皮爾曼等級相關系數、肯德爾等級相關系數和偏相關系數。
[if !supportLineBreakNewLine]
[endif]
皮爾遜簡單相關系數適用於等間隔測度,而斯皮爾曼等級相關系數和肯德爾等級相關系數都是非參測度。 一般用ρ和r分別表示總體相關系數和樣本相關系數。
(1)皮爾遜簡單相關系數簡單相關系數r有如下性質:①-1≤r≤1,r絕對值越大,表明兩個變數之間的相關程度越強。②0<r≤1,表明兩個變數之間存在正相關。若r=1,則表明變數間存在著完全正相關的關系。③-1≤r<0,表明兩個變數之間存在負相關。r=-1表明變數間存在著完全負相關的關系。④r=0,表明兩個變數之間無線性相關。應該注意的是,簡單相關系數所反映的並不是任何一種確定關系,而僅僅是線性關系。另外,相關系數所反映的線性關系並不一定是因果關系。(2)斯皮爾曼等級相關系數
等級相關用來考察兩個變數中至少有一個為定序變數時的相關系數,例如,學歷與收入之間的關系。(3)肯德爾等級相關系數
肯德爾等級相關系數利用變數等級計算一致對數目U和非一致對數目V,採用非參數檢驗的方法度量定序變數之間的線性相關關系 若p值小於顯著性水平,則拒絕原假設,即認為兩個變數之間的相關關系顯著;否則,接受原假設,即認為變數之間不存在顯著相關性。
[if !supportLineBreakNewLine]
[endif]
三、操作過程
相關分析的數據條件:
條件寬松
偏相關分析案例:
題目:隨機抽取的山東省某學校的12名學生的IQ值、語文成績和數學成績。因為語文成績和數學成績都受IQ的影響,所以試用偏相關分析研究學生語文成績和數學成績的相關關系。
一、數據輸入
[if !vml]
[endif]
二、操作步驟 1、進入SPSS,打開相關數據文件,選擇「分析」|「相關」|「偏相關」命令2、選擇進行偏相關分析的變數和控制變數。在「偏相關性」對話框的左側列表框中,同時選中「語文成績」和「數學成績」進入「變數」列表框,然後選中IQ進入「控制」列表框。
[if !vml]
[endif]
3、設置顯著性檢驗的類型。在「顯著性檢驗」選項組中選中「雙尾」單選按鈕。
[if !supportLineBreakNewLine]
[endif]
4、選擇是否標記顯著性相關性,也就是是否在輸出結果中把有統計學意義的結果用「*」表示出來。這里我們選中「標記顯著性相關性」復選框。
[if !vml]
[endif]
5、選擇相關統計量的輸出和缺失值的處理方法。單擊「偏相關性」對話框中的「選項」按鈕。選中」統計」選項組中的「平均值和標准差」和「零階相關性」兩個復選框在「缺失值」選項組中選中「成對排除個案」單選按鈕。也就是說,如果我們在分析時遇到缺失值的情況就將缺失值排除在數據分析之外。設置完畢後,單擊「繼續」按鈕返回「偏相關性」對話框。
[if !supportLineBreakNewLine]
[endif]
[if !vml]
[endif]
6、其餘設置採用系統默認值即可。單擊「確定」按鈕,等待輸出結果。
[if !supportLineBreakNewLine]
[endif]
四、結果分析
1、描述性統計量表參與偏相關分析的兩個變數的樣本數都是12,語文成績的平均值是77.50,標准差是19.019,數學成績的平均值是76.17,標准差是22.811,IQ的平均值是98.33,標准差是22.960。[if !vml]
[endif]
2、偏相關分析結果表不控制IQ時語文成績和數學成績的相關系數為0.991,顯著性水平為0.000,小於0.01,控制IQ後語文成績和數學成績的相關系數為0.893,顯著性水平也為0.000,所以語文成績和數學成績的相關關系為正向且相關性很強。[if !vml]
[endif]
分析結論: 綜上所述,通過控制IQ,語文成績和數學成績的相關系數為0.893, 顯著性水平也為0.000遠遠小於0.01,拒絕原假設,語文成績和數學成績的相關關系為正向且相關性很強。
(獲取更多知識,前往gz號程式解說)
原文來自:https://mp.weixin.qq.com/s/g8ttH9LDunqKYTuFs_k7nw
B. 如何用spss做相關性分析要求詳細步驟!
1、在spss的主界面上輸入數據以後,通過分析那裡點擊非參數檢驗中的相關樣本。
C. 如何用spss做相關性分析
打開SPSS軟體;點擊「開始」按鈕,雙擊「SPSS 」軟體。開始做數據分析:
在工具欄處,點擊:
「分析」----」相關」----「雙變數」,如下圖所示,則開始進行變數的選擇
如圖,需要先確定要分析的變數,首先將兩個變數放入「變數」框中。
此時,需要注意,要分析哪幾個變數就只能選擇那幾個變數,而不能將所有的變數選入;
當然,如果分析的是多有的變數,也可以同時將所有的變數選入
然後,選擇在「相關系數」框中選擇「Pearson」。
因為,這里的兩個變數為連續性的變數,因此採用pearson 相關分析;
若為兩個分類變數,或者一個分類變數一個連續性的變數,則可以用Spearman 相關分析
選擇好變數之後,如果需要對數據進行一定的描述,或者查看,可以打開右上角的按鈕,即選擇「選項」,如下圖所示
大部分分析需要對原始數據進行統計描述,即如果需要進行描述性分析,可以選擇均值和標准差,如上圖所示的.mean (均值)和 sd (標准差),分別對數據的大小和離散程度作出一定的描述,並點擊「確定按鈕」
如果需要對數據進行模擬分析,則可以選擇右上角的「bootsTrap」模擬分析,打開後如下圖所示。
其中樣本數為需要模擬的總共的次數,可以自己定義;後面的種子數,是開始模擬隨機數字的起始種子數,同樣可以自行定義。其中的置信區間為CI, 即結果的可信區間
單擊確定後,再output窗口中可以看到:結果如下所示。
結果給出兩個分析,一個是描述性分析,為以下的第二個圖,和pearson 相關分析結果為第一個圖。
一般結果,應該先描述第二個圖的表格含義,
其中mean表示均值,為兩個連續性變數的均數;第二個值為Std. Deviation 表示標准差,即原始數據的標准差
第一個圖為pearson correlations表格為相關系數表
其中pearson correlation 為相關系數
sig 為P 值(<0.05為有顯著性意義)
N 為樣本量
D. SPSS常用的相關性分析方法解析(轉載)
相關性分析旨在分析兩組數據之間是否相互影響,彼此是否獨立的變動。SPSS內部提供了多種分析數據相關性的方法:卡方檢驗(Chi-SquareTest),Pearson相關系數計算,Spearman相關系數計算和Kendall的tau-b(K)相關系數計算。這四種分析方法適用於不同的數據類型,下面向大家介紹常用的SPSS相關性分析方法。
1.卡方檢驗(Chi-SquareTest)
卡方檢驗(Chi-SquareTest)是由Pearson提出的一種統計方法,在一定的置信水平和自由度下,通過比較卡方統計量和卡方分布函數概率值,判斷實際概率與期望概率是否吻合,進而分析兩個分類變數的相關性。
卡方檢驗(Chi-SquareTest)適用於不服從正態分布的數據,兩組變數是無序的。使用SPSS進行卡方檢驗的操作方法,大家可以登錄SPSS中文網站進行學習,這里僅作原理性的介紹。如圖1是某種葯物單獨使用和葯物與放療同時使用時,治療是否有效的卡方檢驗結果。
圖1某地某種疾病發病人數統計
個案處理摘要顯示了有效數據和無效數據的數量。VAR00001*VAR00002交叉表顯示各變數對應的頻數,VAR00001列1代表單獨使用葯物,2代表葯物與放療同時使用,VAR00002行1代表有療效的人數,2代表無療效的人數。
行列變數為各為二組,自由度為(2-1)×(2-1)=1,Pearsonχ2值為22.475,顯著性數值為0.000小於0.05,有顯著性差異,不能接受無關假設,即單獨使用葯物與葯物放療同時進行有顯著性差異。
2.Pearson相關系數計算
Pearson相關系數用於評估兩組數據是否符合線性關系,不能用於符合曲線關系的數據,線性相關越強,Pearson相關系數就越接近1(線性遞增)或-1(線性遞減)。圖2為一組數據的線性相關性檢驗,可以看出,Peason相關系數0.984,表明兩者有較強的線性相關性,一般認為<0.3無相關性,0.3~0.7弱相關性,>0.7較強的相關性。
圖2Pearson檢驗結果
3.Spearman相關系數計算
Spearman相關系數適用於不滿足線性關系,且不滿足正態分布的數據,如圖3所示,實際這是兩組隨機產生的數據,用Spearman相關系數計算時,結果為0.257,<0.3無相關性,與Pearson相關系數類似,<0.3不相關,0.3~0.7為弱相關,>0.7為強相關。
圖3Spearman相關系數計算
4.Kendall的tau-b(K)相關系數計算
進行Kendall的tau-b(K)相關分析,需要滿足下列3個條件:
1.兩個變數是有序分類變數;
2.兩個變數相對應的研究對象是一定的。
例如調查工資與學歷之間的關系,兩個變數學歷和收入都是等級變數,符合條件1;兩個變數均對應同一研究對象:一個區域內的所有工作的成年人。符合條件2。收入等級分別為1高收入,2中收入,3低收入,學歷等級分別為1高學歷,2中等學歷,3低學歷。結果分析如圖4所示。相關系數為0.480,有弱的相關性。
圖4Kendalltau-b系數計算
對於不同種類的數據,應採用不同的統計方法進行相關性分析,SPSS內置了豐富的統計計算功能,可以充分滿足不同統計數據的使用需求。
E. 相關性分析spss步驟
spss如何進行相關性分析,相關性分析首先要看兩變數的情況,符合正態分布,樣本量大於30-50,線性關系,而且是連續變數,可以用Pearson分布。
工具/原料:戴爾靈越5000、win10、SPSS24
1、樣本數據能用Pearson相關就用這個,這個最准確,開始時,首先分布樣本正態性,用k-s檢驗。
F. 如何用spss做相關性分析
你好,step1:建立數據文件 file——new——data;
定義變數 選中左下角菜單Variable view,輸入變數名T,其他選項不變,令起一行,輸入變數
名G其他選項不變,切換到data view(在左下角),將數據復制進去。
Step2:進行數據分析:在spss最上面菜單裡面選中Analyze——correlate——bivariate(雙變數)
左邊包含G,T的框為源變數框,後面的空白框為分析變數框,我們現在需要分析G和T的關系,因此將源變數框中的G和T選進分析變數框待分析。
(1)correlation coefficients(相關系數)包括三個選項:
Pearson:皮爾遜相關,計算連續變數或是等間距測度的變數間的相關分析;
Kendall:肯德爾相關,計算等級變數間的秩相關;
Spearman:斯皮爾曼相關,計算斯皮爾曼秩相關。
註:Pearson可用來分析①分布不明,非等間距測度的連續變數
Kendall可用來分析①分布不明,非等間距測度的連續變數,②完全等級的離散變數,③數據資料不服從雙變數正態分布或總體分布型未知。第②種情況只能用Kendall分析
Spearman可用來分析數據資料不服從雙變數正態分布或總體分布型未知
(2)Test of significance選項
Two-tailed:雙尾檢驗,如果事先不知道相關方向(正相關還是負相關)則可以選擇此項;
One-tailed:單尾檢驗,如果事先知道相關方向可以選擇此項。
(3)Flag significant correlations:表明顯著水平,如果選擇此項,輸出結果中在相關系數值右上方使用*標示顯著性水平為5%,用**標示其顯著性水平為1%
首先使用pearson,two-tailed(下圖),點擊右側options
statistics為統計量,包括均值和標准差 叉積離方差和協方差
missing values 選擇默認
點擊continue——ok
輸出結果(下圖)
相關系數為0.975,顯著性p=0.000<0.01,有統計學意義
選用Kendall 肯德爾,結果如下:
選用spearman 斯皮爾曼,結果如下:
畫散點圖:選中Graphs——Scatter/dot-----Simple scatter------define
G. 如何用spss做相關性分析
偏相關 從菜單中選擇: 分析 相關 偏相關... 選擇兩個或更多要為之計算偏相關的數值變數。 E 選擇一個或多個數值控制變數。 還可以使用以下選項: 顯著性檢驗。您可以選擇雙尾概率或單尾概率。如果預先已知關聯的方向,請選 擇單尾。否則,請選擇雙尾。 顯示實際顯著性水平。預設情況下,將顯示每個相關系數的概率和自由度。如果 取消選擇此項,則使用單個星號標識顯著性水平為0.05 的系數,使用兩個星號 標識顯著性水平為0.01 的系數,而不顯示自由度。此設置同時影響偏相關矩陣 和零階相關矩陣。 偏相關:選項 「偏相關性: 選項」對話框 統計量。可以選擇以下方式中的一個或兩個都選: 均值和標准差。為每個變數顯示。還顯示具有非缺失值的個案數。 零階相關系數。顯示所有變數(包括控制變數)之間簡單相關的矩陣。 缺失值。您可以選擇以下選項之一: 按列表排除個案。將從所有計算中排除其任何變數(包括控制變數)具有缺失值 的個案。 按對排除個案。對於偏相關所基於的零階相關的計算,不使用其一對變數或其中一個 變數具有缺失值的個案。按對刪除可以充分使用數據。但是,個案數可能隨系數的 不同而不同。如果按對刪除有效,則某個特定的偏相關系數的自由度是基於在任何 零階相關計算中使用的最小個案數。