㈠ 統計數據類型與對應的相關性分析方法
統計數據類型與對應的相關性分析方法
在統計學中,統計數據主要可分為四種類型,分別是定類數據,定序數據,定距數據,定比變數。
1.定類數據(Nominal):名義級數據,數據的最低級,表示個體在屬性上的特徵或類別上的不同變數,僅僅是一種標志,沒有序次關系。例如, 」性別「,」男「編碼為1,」女「編碼為2。定類變數之間的相關系數,只能以變數值的次數來計算,常用λ系數法;2.定序數據(Ordinal):數據的中間級,用數字表示個體在某個有序狀態中所處的位置,不能做四則運算。例如,「受教育程度」,文盲半文盲=1,小學=2,初中=3,高中=4,大學=5,碩士研究生=6,博士及其以上=7。定序變數的相關性測量常用Gamma系數法和Spearman系數法;3.定距數據(Interval):具有間距特徵的變數,有單位,沒有絕對零點,可以做加減運算,不能做乘除運算。例如,溫度。定距變數的相關性測量常用Pearson系數法;4.定比變數(Ratio):數據的最高級,既有測量單位,也有絕對零點,例如職工人數,身高。一般來說,數據的等級越高,應用范圍越廣泛,等級越低,應用范圍越受限。不同測度級別的數據,應用范圍不同。等級高的數據,可以兼有等級低的數據的功能,而等級低的數據,不能兼有等級高的數據的功能。
㈡ 二、定類與定序變數分析
一、定類數據統計 指標
1. 頻 數:落在各類別中的數據個數
2. 比 例:某一類別數據佔全部數據的比值
3. 百分比:將對比的基數作為100而計算的比值
4. 比 率:不同類別數值的比值
實現
5、列聯表:二個定類變數進行交叉統計
例子:用python實現會員等級與性別的列聯表交叉統計分析
實現:利用pd.crosstab()
二、定序數據統計 指標
一、分組
三種分組
方法
實現
㈢ spss中定類變數對定序變數怎麼進行相關分析
一般定類數據和定序數據間的相關用二列相關或者列聯相關,二列相關用於二分數據,列聯相關不限於二分數據。二列相關可以直接用積差相關的操作來完成,其實一般的各種相關作為積差相關的特列,其實公式和積差相關的是等價的,也就是無論是定序還是二分變數與連續變數的相關,都可以用積差相關的操作做,結果一樣的。
列聯相關的公式:
如果是定類數據之間,可以用phi系數、四格相關等
席皮爾曼相關系數為0.389**,代表這個相關系數是0.389,**代表該系數在0.01水平顯著(*是0.05水平,***是0.001水平),sig是具體的顯著性水平。
㈣ 請教關於定序變數定類變數的回歸分析問題
1# cecilia_xjm 1. 考察自變數對是否就業的影響,可以採用logistic回歸分析。
2. 你的收入是有序的分類變數,如果是多分類的話,建議你把收入合並成兩分類的,用logistic回歸分析來篩選影響收入水平的可能影響因素。如果是實際的收入金額的話,可以嘗試一下多重線性回歸。
logistic回歸分析在spss中可以很容易的實現。在analyze——regression裡面,具體的操作,可以參考一下相關的工具書。