❶ 對於動態時序模型,序列相關性檢驗可以使用哪幾種方法
廣義最小二乘法,廣義分差法。
廣義最小二乘法是一種常見的消除異方差的方法,廣義差分法是一種新的微分方程數值解法。它兼有差分法的簡單性和有限元法的高精度性,還具有保持質量守恆等良好性質。
❷ 相關性分析有哪幾種方法
在做數據分析時,為了提煉觀點,相關性分析是必不可少,而且尤為重要的一個環節。但是,對於不同類型的數據,相關性分析的方法都各不相同。本文,主要按照不同的數據類型,來對各種相關性分析方法進行梳理總結。
相關性分析是指對兩個或多個具備相關性的變數元素進行分析,相關性不等於因果性。
一、離散與離散變數之間的相關性
1、卡方檢驗
卡方檢驗是一種用途很廣的計數資料的假設檢驗方法。它屬於非參數檢驗的范疇,主要是比較兩個及兩個以上樣本率( 構成比)以及兩個分類變數的關聯性分析。其根本思想就是在於比較理論頻數和實際頻數的吻合程度或擬合優度問題。
它在分類資料統計推斷中的應用,包括:兩個率或兩個構成比比較的卡方檢驗;多個率或多個構成比比較的卡方檢驗以及分類資料的相關分析等。
(1)假設,多個變數之間不相關
(2)根據假設計算得出每種情況的理論值,根據理論值與實際值的差別,計算得到卡方值 及 自由度
df=(C-1)(R-1)
(3)查卡方表,求p值
卡方值越大,P值越小,變數相關的可能性越大,當P<=0.05,否定原假設,認為變數相關。
2、信息增益 和 信息增益率
在介紹信息增益之前,先來介紹兩個基礎概念,信息熵和條件熵。
信息熵,就是一個隨機變數的不確定性程度。
條件熵,就是在一個條件下,隨機變數的不確定性。
(1)信息增益:熵 - 條件熵
在一個條件下,信息不確定性減少的程度。
Gain(Y,X)=H(Y)-H(Y|X)
信息增益越大,表示引入條件X之後,不純度減少得越多。信息增益越大,則兩個變數之間的相關性越大。
(2)信息增益率
假設,某個變數存在大量的不同值,例如ID,引入ID後,每個子節點的不純度都為0,則信息增益減少程度達到最大。所以,當不同變數的取值數量差別很大時,引入取值多的變數,信息增益更大。因此,使用信息增益率,考慮到分支個數的影響。
Gain_ratio=(H(Y)-H(Y|X))/H(Y|X)
二、連續與連續變數之間的相關性
1、協方差
協方差,表達了兩個隨機變數的協同變化關系。如果兩個變數不相關,則協方差為0。
Cov(X,Y)=E{[X-E(X)],[Y-E(Y)]}
當 cov(X, Y)>0時,表明 X與Y 正相關;
當 cov(X, Y)<0時,表明X與Y負相關;
當 cov(X, Y)=0時,表明X與Y不相關。
協方差只能對兩組數據進行相關性分析,當有兩組以上數據時就需要使用協方差矩陣。
協方差通過數字衡量變數間的相關性,正值表示正相關,負值表示負相關。但無法對相關的密切程度進行度量。當我們面對多個變數時,無法通過協方差來說明那兩組數據的相關性最高。要衡量和對比相關性的密切程度,就需要使用下一個方法:相關系數。
2、線性相關系數
也叫Pearson相關系數, 主要衡量兩個變數線性相關的程度。
r=cov(X,Y)/(D(X)D(Y))
相關系數是用協方差除以兩個隨機變數的標准差。相關系數的大小在-1和1之間變化。再也不會出現因為計量單位變化,而數值暴漲的情況了。
線性相關系數必須建立在因變數與自變數是線性的關系基礎上,否則線性相關系數是無意義的。
三、連續與離散變數之間的相關性
1、連續變數離散化
將連續變數離散化,然後,使用離散與離散變數相關性分析的方法來分析相關性。
2、箱形圖
使用畫箱形圖的方法,看離散變數取不同值,連續變數的均值與方差及取值分布情況。
如果,離散變數取不同值,對應的連續變數的箱形圖差別不大,則說明,離散變數取不同值對連續變數的影響不大,相關性不高;反之,相關性高。
❸ 怎樣用DW檢驗診斷序列的相關性
一、圖示法 圖示法是一種很直觀的檢驗方法,它是通過對殘差散點圖的分析來判斷隨機誤差項的序列相關性。把給定的回歸模型直接用普通最小二乘法估計參數,求出殘差項,並把作為隨機誤差項的估計值,畫出的散點圖。由於把殘差項作為隨機誤差項的估計值,隨機誤差項的性質也應能在殘差中反映出來。(一)按時間順序繪制殘差圖 如果殘差,,隨著時間的變化而呈現有規律的變動,則存在相關性,進而可以推斷隨機誤差項之間存在序列相關性。如果隨著時間的變化,並不頻繁地改變符號,而是取幾個正值後又連續地取幾個負值(或者,與之相反,幾個連續的負值後面緊跟著幾個正值),則表明隨機誤差項存在正的序列相關,(見圖6-1);如果隨著時間的變化,不斷地改變符號(見圖6-2),那麼隨機誤差項之間存在負的序列相關。 圖6-2 負序列相關(二)繪制,的散點圖 計算和,以為縱軸,為橫軸,繪制(,),的散點圖。如果大部分點落在第Ⅰ,Ⅲ象限,表明隨機誤差項存在正的序列相關(見圖6-3);如果大部分點落在第Ⅱ,Ⅳ象限,表明隨機誤差項存在負的序列相關(見圖6-4)。 圖6-3 正序列相關 圖6-4 負序列相關二、杜賓——瓦特森(D-W)檢驗 1、適用條件杜賓——瓦特森檢驗,簡稱D—W檢驗,是J.Durbin(杜賓)和G.S.Watson(瓦特森)於1951年提出的一種適用於小樣本的檢驗序列相關性的方法。D-W檢驗是目前檢驗序列相關性最為常用的方法,但它只適用於檢驗隨機誤差項具有一階自回歸形式的序列相關問題。在使用該方法時前,必須注意該方法的適用條件。回歸模型含有截距項,即截距項不為零;解釋變數是非隨機的;隨機誤差項為一階自相關,即;回歸模型中不應含有滯後內生變數作為解釋變數,即不應出現下列形式: 其中,為的滯後一期變數;無缺失數據。當上述條件得到滿足時,我們可以利用D-W方法檢驗序列相關問題。2、具體過程(1)提出假設,即不存在序列相關,,即存在序列相關性(2)定義D-W檢驗統計量為了檢驗上述假設,構造D-W檢驗統計量首先要求出回歸估計式的殘差,定義D-W統計量為: (6-11)其中,。由(6-11)式有 (6-12)由於與只有一次觀測之差,故可認為近似相等,則由(6-12)式得 (6-13)隨機誤差序列的自相關系數定義為: (6-14)在實際應用中,隨機誤差序列的真實值是未知的,需要用估計值代替,得到自相關系數的估計值為: (6-15)在認為與近似相等的假定下,則(6-15)式可化簡為: (6-16)所以,(6-13)式可以寫成 (6-17)(3)檢驗序列相關性因為自相關系數的值介於-1和1之間,所以:,而且有值與的對應關系如表6-1所示。表6-1 值與的對應關系表值DW值隨機誤差項的序列相關性-1(-1,0) 0(0,1)1 4(2,4) 2(0,2)0 完全負序列相關 負序列相關 無序列相關 正序列相關 完全正序列相關從表6-1中,我們可以知道當值顯著地接近於0或者4時,則存在序列相關性;而接近於2時,則不存在序列相關性。這樣只要知道統計量的概率分布,在給定的顯著性水平下,根據臨界值的位置就可以對原假設進行檢驗。但是統計量的概率分布很難確定,作為一種變通的處理方法,杜賓和瓦特森在5%和1%的顯著水平下,找到了上限臨界值和下限臨界值,並編制了D-W檢驗的上、下限表。這兩個上下限只與樣本的大小和解釋變數的個數有關,而與解釋變數的取值無關。具體的判別規則為:(1) ,拒絕,表明隨機誤差項之間存在正的序列相關;(2) ,拒絕,表明隨機誤差項之間存在正的序列相關;(3) ,接受,即認為隨機誤差項之間不存在序列相關性;(4) 或,不能判定是否存在序列相關性。上述四條判別規則可用圖6-5表示: 3.D-W檢驗特點D-W檢驗法的優點在於其計算簡單、應用方便,目前已成為最常用的序列相關性檢驗的方法。EViews軟體在輸出回歸分析結果中直接給出了DW值,並且人們也習慣將DW值作為常規的檢驗統計量,連同值等一起在報告回歸分析的計算結果時表明。但D-W檢驗也存在很大的局限性,在應用時應予以重視。D-W檢驗不適應隨機誤差項具有高階序列相關的檢驗; D-W檢驗有兩個無法判別的區域,一旦DW值落入這兩個區域,必須調整樣本容量或採取其他的檢驗方法;這一方法不適用於對聯立方程模型中各單一方程隨機誤差項序列相關性的檢驗;D-W檢驗不適用於模型中含有滯後的被解釋變數的情況。三、回歸檢驗法 1、定義回歸檢驗法適用於任一隨機變數序列相關性的檢驗,並能提供序列相關的具體形式及相關系數的估計值。2、應用步驟分三步進行:第一步,依據模型變數的樣本觀測數據,應用普通最小二乘法求出模型的樣本估計式,並計算出隨機誤差項的估計值;第二步,建立與、的相互關系模型,由於它們相互關系的形式和類型是未知的,需要用多種函數形式進行試驗,常用的函數形式主要有: 第三步,對於不同形式的與、的相互關系模型,用普通最小二乘法進行參數估計,得出回歸估計式,再對估計式進行統計檢驗。如果檢驗的結果是每一種估計式都不顯著的,就表明與、是不相關的,隨機誤差項之間不存在序列相關性。如果通過檢驗發現某一個估計式是顯著的(若有多個估計式顯著就選擇最為顯著的),就表明與、是相關的,隨機誤差項之間存在序列相關性,相關的形式就是統計檢驗顯著的回歸估計式,相關系數就是該估計式的參數估計值。回歸檢驗法需要用多種形式的回歸模型對與、的相關性進行試驗分析,工作量大、計算復雜,顯得極為繁瑣。線性回歸模型中隨機誤差項序列相關性的檢驗,在計量經濟學的研究中是一個很重要的問題。但目前應用的檢驗方法都存在一些缺限和局限,還不能對這一問題進行完全有效的檢驗,更為完善的檢驗方法有待於進一步研究。有關於高階序列相關性的檢驗,可以參考其它相關教科書。第三節 序列相關的處理 如果檢驗發現隨機誤差項之間存在序列相關性,應當首先分析序列相關產生的原因,引起序列相關的原因不同,修正序列相關的方法也不同。如果是回歸模型變數選用不當,則應對模型中包含的解釋變數進行調整,去掉無關的以及非重要的變數,引入重要的變數;如果是模型的形式選擇不當,則應重新確定正確的模型形式;如果以上兩種方法都不能消除序列相關性,則需要採用其他數學方法進行處理以消除序列相關性,然後再對模型中的未知參數進行估計。一、差分法 差分法將原模型變換為差分模型,用增量數據代替原來的樣本數據。差分法分為一階差分法和廣義差分法。(一)一階差分法 假設原模型為: (6-18)一階差分法變換後的模型為: (6-19)其中, 如果,原模型存在完全一階正相關,即 ,其中不存在序列相關性,那麼差分模型滿足應用普通最小二乘法的基本假設。用普通最小二乘法估計差分模型得到的參數估計值,即為原模型參數的無偏、有效估計值。(二)廣義差分法 一階差分法僅適用於隨機誤差項的自相關系數等於1的情形。但在一般情況下,完全一階正相關的情況並不多見,在這種情況下,隨機誤差項的序列相關性就要用廣義差分法進行修正。對於模型(6-18)如果隨機誤差項存在一階自相關,即,其中,為隨機誤差項的自相關系數,且有,不存在序列相關性。將(6-18)式滯後一期,並左右兩邊同乘,可得 (6-20)將(6-18)式減去(6-20)式,得 (6-21)在為已知的情況下,我們可以對(6-21)式進行如下變換 (6-22)將變換後的新變數代入(6-21)式,便可得到一個新的模型表示式: (6-23) 我們把上述變換過程稱為廣義差分變換,把通過廣義差分變換得到的模型稱為廣義差分模型。我們應該注意到這一變換過程所構建的新變數,,由於差分變換要損失一個觀測值,樣本個數由個減少到個。為了避免損失自由度,可以將第一個觀測值作如下變換:,通過對原模型進行廣義差分變換,我們可以得到廣義差分模型,廣義差分模型中的隨機誤差項滿足線性回歸的經典假設,對廣義差分模型進行OLS估計,得到的參數估計值仍然是最佳估計量。二、杜賓兩步法 進行廣義差分變換的前提是已知的值。但是隨機誤差項的自相關系數,的值不可觀測,使得的值也是未知的。所以利用廣義差分法處理序列相關性時,首先需要估計出的值。這可以用杜賓(Durbin)兩步估計法。我們以一元線性回歸模型為例,對於模型 (6-24)如果隨機誤差項存在階自回歸形式的序列相關,即 (6-25)當、、時,便可利用杜賓兩步法對的相關系數進行估計。第一步,對(6-24)式進行差分變換,可得 (6-26)整理(6-26)式,可得 (6-27)第二步:應用普通最小二乘法對包含被解釋變數及解釋變數的滯後變數在內的模型(6-27)式進行估計,求出隨機誤差項的自相關系數,,…, 的估計值,,…, 。再將,,…, 代入(6-26)式,可得 (6-28)(6-28)式的隨機誤差項具有零均值、方差齊性、不存在序列相關性的特點。在,,…, 已知的情況下,可以用普通最小乘法對(6-28)式進行估計,求出參數、的估計值、。此方法也適用於多元線性回歸模型。杜賓兩步法不但求出了自相關系數的估計值,而且也得出了模型參數的估計值。三、迭代法 迭代估計法或科克倫-奧克特(Cochrane-Orcutt)估計法,是用逐步逼近的辦法求的估計值。仍以(6-24)式為例,假設隨機誤差項存在一階自回歸形式的序列相關,即,,其中滿足零均值、方差齊性、無序列相關性。迭代估計的具體步驟為:第一步,利用OLS法估計模型,計算殘差出;第二步,根據上一步計算出的殘差計算的估計值: 第三步,利用上一步求得的值對(6-24)式進行廣義差分變換: 並得到廣義差分模型:;第四步,再利用OLS法估計,計算出殘差,根據殘差計算的第二次逼近值: 第五步,重復執行第三、四步,直到的前後兩次估計值比較接近,即估計誤差小於事先給定的精度:。此時,以 作為的估計值,並用廣義差分法進行變換,得到回歸系數
❹ 相關性用什麼檢驗方法
一.線性相關分析:研究兩個變數間線性關系的程度
用相關系數r來描述,關於r的解讀:
(1)正相關:如果x,y變化的方向一致,如身高與體重的關系,r>0;一般地,
·|r|>0.95 存在顯著性相關;
·|r|≥0.8 高度相關;
·0.5≤|r|<0.8 中度相關;
·0.3≤|r|<0.5 低度相關;
·|r|<0.3 關系極弱,認為不相關
(2)負相關:如果x,y變化的方向相反,如吸煙與肺功能的關系,r<0;
(3)無線性相關:r=0。
如果變數Y與X間是函數關系,則r=1或r=-1;如果變數Y與X間是統計關系,則-1<r<1。
(4)r的計算有三種:
①Pearson相關系數:對定距連續變數的數據進行計算。
②Spearman和Kendall相關系數:對分類變數的數據或變數值的分布明顯非正態或分布不明時,計算時先對離散數據進行排序或對定距變數值排(求)秩。
實際上,對任何類型的變數,都可以使用相應的指標進行相關分析。也就是,有各種參數,對適合它們的變數進行分析。
❺ 相關系數檢驗方法有哪些
相關系數的檢驗主要有兩種方法:一種是對假設 「相關系數ρ=0」 的t檢驗,另一種是對假設 「相關系數ρ≠0」的z檢驗。
關於t檢驗:檢驗r是否顯著,即檢驗r是否不等於零。
關於z檢驗:假設相關系數等於ρ,經過一系列步驟,計算出該假設在顯著性水平α下為真的置信區間(通俗的講,就是計算得到一個范圍(rlow,rhi),如果要檢驗的相關系數落在這個范圍內(rlow<r<rhi),那麼原來的假設(相關系數=ρ)有(1-α)的把握成立)。
(5)常用的序列相關性檢驗的方法有擴展閱讀
相關表和 相關圖可反映兩個變數之間的相互關系及其相關方向,但無法確切地表明兩個變數之間 相關的程度。於是,著名統計學家 卡爾·皮爾遜設計了 統計指標——相關系數(Correlation coefficient)。
相關系數是用以反映變數之間相關關系密切程度的統計指標。相關系數是按積差方法計算,同樣以兩變數與各自 平均值的 離差為基礎,通過兩個離差相乘來反映兩變數之間相關程度;著重研究線性的單相關系數。
需要說明的是,皮爾遜相關系數並不是唯一的相關系數,但是最常見的相關系數,以下解釋都是針對皮爾遜相關系數。
❻ 解決序列相關性的問題主要有哪幾種方法
1廣義最小二乘法2廣義分差法3隨機誤差項相關系數的估計4應用軟體中的的廣義分差法*******************************您好,答案已經給出,請您瀏覽一遍有什麼不懂的地方歡迎回復我!如果滿意請及時點擊【採納回答】按鈕或者客戶端的朋友在右上角評價點【滿意】您的採納,是我答題的動力也同時給您帶來知識和財富值***************************************************❼ 高階序列相關的檢驗法有哪些
你好,高階序列相關的檢驗法有哪些?高階序列相關性的檢驗方法有:圖示法、回歸法、DW檢驗、LM檢驗、Ljung-Box Q檢驗。數據集「d5p160.dta」包含1978~2018年中國名義支出法國內生產總值GDP、名義居民消費總量CONS、稅收總額、居民消費價格指數(1978=100)、實際居民消費總量Y、實際可支配收入X,單位均為億元。請參考!
❽ 序列相關性檢驗
(面板數據、截面數據: ,
時間序列數據: .)
自相關性:一個變數在不同期之間的相互依賴和相互關聯特徵。給定一組樣本,可計算SACF,SPACF,來判斷自相關性。
OLS回歸的重要假設之一:隨機擾動項不存在序列相關性。
檢驗隨機擾動項(回歸後的殘差序列)是否存在序列相關性
(即序列的隨機擾動項不序列相關)
, 和 分別表示在有約束條件下和無約束條件下回歸的殘差平方和, 為解釋變數的總個數。
檢驗隨機擾動項(回歸後的殘差序列)是否存在一階自相關,即是否為AR(1)過程。
若 ,則不存在序列相關性,否則可能存在序列相關性。
缺點:
檢驗序列的自相關性/序列相關性/是否為白噪音過程
, 是第j期自相關函數, 是樣本個數
注意:滯後階數太小,可能檢驗不出高階自相關;滯後階數太大,不能拒絕可能存在的自相關
Q檢驗若檢驗ARMA(p,q)模型,則自由度為k-p-q-1
❾ .1.自相關的檢驗方法有哪些各種的檢驗思想與判斷規則是如何的
相關性檢驗方法共同思路是:採用普通最小二乘法估計模型,以求的隨機干擾項的「近似估計量」,然後通過這些「近似估計量」之間的相關性以表達判斷隨機干擾項是否具有序列相關的目的,主要相關性檢驗有四種:圖示法、回歸檢驗法、杜賓-瓦森檢驗法(D.W.)、拉格朗日檢驗(GB)。最好的檢驗方法應該是GB檢驗,適用於高階序列相關及模型中存在滯後變數的情形。D.W.檢驗中,存在一個不能確定的D.W.值區域,且僅能檢測一階自相關,對存在置後被解釋變數的模型無法檢驗。後兩個問題,因不懂什麼是自相關形式、自相關類型,故暫時無法回答!