❶ 第三節 違背基本假設的情況
本節主要包括:
在這里先給大家普及一個單詞 aftermath 創傷!真的是,,,學完實變函數心靈受到了極大的創傷,,,
言歸正傳,接下來的幾章我們會說明,在回歸的 三大基本假設 不滿足的情況下,會有什麼解決方案。
還記得回歸的三大假設嘛?他們是:
在本章中我們主要研究不滿足第二條的情況我們該如何處理。
數學上說就是 。現實中這樣的例子也有很多,比方說收入模型,貧窮如我的人整天就會想怎麼才能吃飽,就算想買點東西也買不起,窮人之間的購買力差異就很小,而富有的人的話,有的人出手闊綽,有的人比較節約,這就導致了富有的人支出差異很大。在異方差出現的時候,會有很多問題。比方說 參數不再是最佳線性無偏估計(但依然無偏),顯著性檢驗也失效了。所以回歸的效果也很不理想 。所以統計學家要想辦法去偵測到它,並且努力去消除它。
因為正常情況下, ,所以異方差性是可以通過殘差看出來的,這就是殘差圖檢驗的由來。
以殘差ei為縱坐標,以其他適宜的變數為橫坐標畫散點圖。
常用的橫坐標有:
1.擬合值 ;
2.橫坐標, ;
3.觀測時間或序號.
在 滿足假設時 殘差圖上的n個點散布應是隨機的,無任何規律; 存在異方差 時,殘差圖上的點散布呈現相應的趨勢.比方說我的殘差長下面這個樣子
這種方法簡單來說就是計算自變數 與殘差絕對值 之間的相關性,看看他們之間有沒有什麼系統的關系(函數關系)。注意我們採用Spearman 等級相關系數而沒有採用 Pearson 簡單相關系數,這是因為等級相關系數可以反映非線性相關的情況。
定義:
等級相關系數:
斯皮爾曼檢驗量:
在做等級相關系數檢驗之前需要先對模型做一次回歸(雖然我們這里已經知道異方差性存在的情況下,回歸沒啥用了。但是如果你不做回歸測試異方差性,你又怎麼確定回歸沒用的呢?)。得到隨機誤差 的估計值殘差 .然後取殘差絕對值 ,把 與 都按照從高到低的順序或者從低到高排序,最後標記二者的排位(就是第幾大或者第幾小),算出二者等級的對應差值計算出來就是 。比如說一個數據的自變數值 是第8大的,但是它的對應的殘差絕對值 是第三大的,那麼對應的 。
這個檢驗量在 的時候是近似服從 t 分布的,因此如果檢驗量的值 ,就可以認為沒有異方差。否則說明 與 之間存在系統關系。
加權最小二乘估計是解決異方差問題的一種辦法。還有Box-Cox變換法,等等。
一般來說,在最小二乘回歸中,我們實際上就是要最小化 。注意到的是這個和式的每一項的期望都是 (因為異方差性假設存在,所以我們不再使用 )。所以如果某一項方差越大,實際上這一項所佔的比重就很大,那麼為了最小化我們的離差平方和,就必須要讓回歸直線「盡量偏向」這個方差很大的數據點。
從這里也可以看出來加權最小二乘法的一個局限性: 照顧小殘差項是以犧牲大殘差項為代價的。
為了解決這個問題我們把平方和改一下,寫成下面的樣子:
按照相同的方法回歸,可得:
得到啥你自己看書吧-.-!P97 4.5
所以這個回歸的關鍵就是如何選擇我們的 。直觀上來看,因為每一項的期望是 ,所以!只要讓 就可以啦~(讓回歸直線「盡量偏向」這個方差很大的數據點嘛,方差越大權重就小一點,回歸系數就大了)
problem solved~
不好意思沒那麼簡單,理論可行,可是 是啥你不知道啊。所以如果沒有電腦,我們一般是通過殘差圖去「猜測」應該用什麼權。比方說如果 與 成正比,那麼這個時候可以考慮拿 去作為權函數。實際上我們也是 一般使用類似於 這樣的自變數的冪函數來構造權函數 。
如果使用 SPSS 計算就簡單多了,通過尋找 m 值使得對數似然函數值最大,具體參見 P98。
多元的情況與一元十分相似,有一個問題就是我們權函數的構造,在一元中我們可以用自變數的冪函數構造。但是多元的情況,如果我們用每一個自變數的冪函數構造,那麼對應的計算量可能就是 級別的,所以在多元的情況下我們 一般都只使用其中一個自變數 。所以問題來了,我們用哪一個自變數呢?
這也是有一個法則的,一般來說需要計算每一個自變數 與變通殘差( )的等級相關系數(斯皮爾曼等級相關系數),取最大的那個構造即可。
具體的例子見 P103
隨機誤差項之間存在自相關性 的意思就是 。簡單點來說就是誤差項之間存在相關關系。
這種自相關包括 一階自相關 與 多階自相關 。
這在現實生活中也是很常見的。比如說金融危機一般都是要延後兩三年才會有很顯著的負面影響。另外時間序列模型本質上也就是一種自相關的模型。
(1)遺漏關鍵變數;
(2)經濟變數的滯後性;
(3)採用錯誤的回歸函數形式;
(4)蛛網現象帶來的序列自相關性;
(5)對數據加工整理導致誤差項之間產生自相關性。
自相關其實就相當於不滿足G-M條件了,如果還是使用普通最小二乘法估計參數就會產生很多問題:
(1)參數估計值不再具有最小方差線性無偏性;
(2)均方誤差(MSE)可能嚴重低估誤差項的方差;
(3)容易導致 t 值過高,所以 F 檢驗、 t 檢驗就失效了
(4)最小二乘估計量也會對抽樣的波動很敏感,意思是說在一些特定的樣本中, 雖然無偏,但是估計出來的值 卻可能嚴重與 真實值不同。
(5)預測和分析會帶來較大的方差,甚至錯誤的解釋。
這個問題還是挺嚴重的,下面瞅瞅怎麼把這個問題檢驗出來:
首先直接使用普通最小二乘法估計參數,根據回歸殘差項 的相關性來判斷隨機誤差項 的序列相關性。一般有兩種方法:
可以看出這相當於是說隨著時間的推移,殘差並不是散亂,而是有序,或者說以一個函數形式出現的。這就說明存在自相關性了。
但是這種定性的分析總是感覺不夠精確,所以我們需要更好的方法。
自相關系數說白了就是計算隨機誤差項之間的相關程度總和的一個量。如果這個量超過了某個數我們就認為這些隨機誤差項之間有關系,也就是說存在自相關性。
首先給出 誤差序列 的系相關系數 定義:
這也是時間序列中一個很重要的統計量。和簡單相關系數對比容易得到它的范圍是 。
當 接近 -1 時表明誤差序列存在負相關,當 接近 1 時表明誤差序列存在正相關 。
還是有一個問題就是,誤差序列 的真實值是未知的,那麼我們就只能使用其估計值:殘差 去代替。這就可以得到自相關系數的估計值 。
估計是可以的,但是這樣又產生了一個問題,就是這個 作為 的估計值就與樣本量有關了(直觀來想就是樣本量越多估計的越好唄),這就需要構造統計量,做一下顯著性檢驗才能確定自相關性是否存在。一般使用下面的 DW 檢驗代替對 的檢驗。
DW (Durbin-Watson)檢驗其實說白了就是一假設檢驗。要有假設,需要構造統計量,計算拒絕域,最後根據顯著性水平判斷。DW 檢驗是很常用的一種檢驗自相關的方法。
DW 檢驗有一定的 使用條件 :
首先需要知道,隨機擾動項的一階自回歸形式為:
其中 為自回歸系數(數值上等於自相關系數,就是剛剛剛學的自相關系數還記得嗎), 是滿足 G-M 條件的隨機誤差項。
為了檢驗序列相關性,(其實就是檢驗上面的方程成立) 原假設 是:
構造的 統計量 是:
其中: 是回歸估計式的殘差 。
接下來的問題就是求拒絕域啦,首先我們來看看 DW 的取值范圍:其實只需要將 DW 的分子展開一下就可以得到:
分子的第一項與第二項在 n 比較大的時候幾乎是相同的(所以一般來說 DW 檢驗要求 ),而第三項與分母的比就是我們的 。 所以有 ,換句話說 。 根據以上的分析我們大約知道 DW 的取值范圍為 。
因而 DW 值與 的對應關系表如下表所示:
在書上的P109頁有一張表。(假裝這里有表)
所以 確定拒絕域的方法是:根據樣本量 n 和解釋變數的數目 k (這里包括常數項)查 DW 分布表,得到臨界值 和 ,最後根據計算得到的 DW 值決定模型的自相關狀態。 如下圖所示:
行,我們費了老大勁把自相關問題檢驗出來了,下面看看咋處理吧,,,咋整呀,,,
在處理自相關問題的時候需要首先查明自相關產生的原因,我們順便復習一下 5 點奧(其實我也沒記住翻回去看的,逃有幾個問題可以直接解決,實在不行咱再想辦法:
迭代法的想法就是想辦法消掉誤差項中相關的那一部分(剩下的不就是不相關的),這樣就可以使用普通最小二乘回歸啦,最後再把所做的變數替換帶回去就可以的。
我們就以一階自相關來舉例:假設我們的模型為:
其中 滿足 G-M 條件(期望值相等,相互獨立)。
根據這個模型讓時間倒退回去一點,就可以得到:
為了消除自相關性,歸根結底是要讓誤差項回到 ,(誰讓人家滿足G-M條件嘛)
這就需要我們得到 。所以我們來計算
對應的變數做換元就可以可到: 。這個時候可以看出誤差項就滿足 G-M 條件啦。接下來就對變換後的模型使用普通最小二乘法就可以啦,然後再把變數帶回去。
那麼這樣的方法可以看出如果真的誤差項存在一階自相關的話,那麼很明顯是有效的。但是實際情況並不總是如此,有時候誤差項的自相關階數是很高的,所以我們的方法是不停的迭代,直到我們的 DW 檢驗能夠說明它沒有自相關了為止,可以說是簡單粗暴啊。
差分法的適用范圍就更窄了,它是適用於原模型存在 較高程度一階自相關 的情況才可使用。在迭代法的模型中我們設 ,就可以得到一個差分法的模型:( 注意這個模型不帶常數項 ,回歸直線過原點)
其中 ,
對它做一個回歸就可以得到: (注意 t = 2 開始是因為差分肯定只能從第二項開始才會有數據)。
一般來說我們先使用 估計 ,(注意這里的 是自相關系數,而不是普通相關系數),如果 接近 1 就 採用差分法而不使用迭代法 ,這是因為:
有時候數據中會包含一兩個極端或異常的觀測值,這些數據與其他數據遠遠分開,會引起較大的殘差,影響回歸效果(這可不是啥好事兒),所以呢我們就想著怎麼把這些害群之馬給踢了,一般對於二元三元呢,我們畫一個散點圖看一下就知道了,但是多元就麻煩了,這傢伙,沒法兒畫啊,你說氣不氣人,想想有沒有啥其他招吧。
一般來說我們會分為 x y 兩個維度討論異常值:
在數據分析中,剛開始總是要看有沒有特別特別「高」的點。一般來說會認為殘差 超過 的殘差的話它就是異常值。但是問題在於,多元回歸中 ,其中 為帽子矩陣 的主對角線元素,這也就說明每一個數據點的誤差是不相同的。那麼單純的因為它「特別高」就認為數據異常就不合適了。因為這很有可能是殘差導致的,換句話說這個數據「特別高」不是因為它異常,而是因為它「就完全有可能這么高」。換句話說,因為誤差是每一個數據點的固有性質,所以如果是因為殘差特別大,導致某一個數據點像異常值,那麼即使你剔除掉這個異常值,也不會對回歸有任何幫助。(就是你踢錯人了,人家不異常)
那麼應該如何去做呢?我們在之前介紹過一個學生化殘差
看似通過把杠桿值的影響去除掉可以解決方差不等的問題,但是如果觀測數據中真的存在異常值,學生化殘差也沒有什麼卵用。這是因為這個時候,異常值的存在會使得回歸線「偏向」它,進而使得回歸的標准差 實際上是偏大的。那麼這樣子的話,實際的學生化殘差是偏小的,這就不能使用 的原則來判斷殘差了。
為了解決異常值的問題,我們需要別的辦法。
我們這么構造刪除殘差:針對第 i 個觀測值,我們計算它的殘差時,用其餘 n-1 個觀測值擬合回歸方程,計算出第 i 個觀測值的刪除擬合值 ,那麼這個值顯然不會受到第 i 個值是否是異常值的影響。所以我們定義 刪除殘差 為:
進一步:
刪除化學生殘差為 :
一般來說,認為 的時候就是異常值點。
首先需要知道啥叫強影響點:還是關於殘差的方差式 ,可以看出 大的點殘差小,因此如果觀測值的杠桿值( )大,就會使得回歸方程偏移產生影響。所以一般來說 杠桿值大的點我們叫做強影響點 ,注意它不一定是 y 的異常值。
強影響點並不總是 y 值的異常點, 此強影響點並不總會對回歸方程造成不良影響 ,但是實際上,強影響點還是很需要被關注的,這是因為:
實際情況是很復雜的,所以一般使用一個粗略的標准,認為 就是異常值, 就是非異常值。
Box-Cox 變換也叫 方差穩定性變換 。這個方法比較特殊,所以把它單獨拿出來了,說他特殊是因為它真的太!好!使!了! B-C 變換可以處理異方差、自相關、誤差非正態、回歸函數非線性等情況。
夠狠!
它是對 y 做如下的變換:
在實際應用時,我們一般使用計算機找到一個 使得對數似然函數達到極大,也就是 達到最小即可(具體的推導見 P117)
最後找到最佳的 之後再把方程還原回去。下面舉一個特例,考試喜歡這么出一個:
轉化為原始變數方程:只需要把 代入,還原為原始方程為:
❷ 異方差性問題如何處理
在計量經濟學中,一些情況下會出現異方差問題,嚴重的異方差問題會影響模型估計和模型檢驗等,因而在OLS回歸時需要對其進行檢驗,如果出現異方差問題需要進行對應處理。
1、殘差圖
通過繪制殘差圖,將殘差項分別與模型的自變數X或者因變數Y,作散點圖,查看散點是否有明顯的規律性。
通常存在異方差時,散點圖會呈現出自變數X值越大,殘差項越大/越小的分布規律。如上圖中散點圖呈現出這樣的規律性,說明模型具有異方差性。
2、white檢驗
懷特檢驗是最常用於檢驗異方差的方法。SPSSAU中會自動輸出懷特檢驗結果。
3、BP檢驗
除此之外,也可用BP檢驗結果判斷,SPSSAU中會自動輸出此結果。如果BP結果與white檢驗結果出現矛盾,建議以懷特檢驗結果為准。
通過案例也許能夠能清楚地說明,以下是關於工資的影響因素的OLS回歸分析。共涉及四個因素分別是起始工資、性別、受雇月數和受教育年限。採用OLS回歸,得到如下結果:
由上圖可得到起始工資、受雇時間、受教育時間對當前工有顯著的正向影響關系。
但根據異方差檢驗結果顯示,White檢驗和BP檢驗均拒絕原假設(P<0.05)(原假設為模型沒有異方差),說明模型存在異方差問題。
解決異方差問題一般有三種辦法,分別是 數據處理(取對數) 、 Robust穩健標准誤回歸 和 FGLS法 ;三種辦法可以同時使用去解決異方差問題。
1. 對原數據做對數處理
針對連續且大於0的原始自變數X和因變數Y,進行取自然對數(或10為底對數)操作,如果是定類數據則不處理。
取對數可以將原始數據的大小進行『壓縮』,這樣會減少異方差問題。事實上多數研究時默認就進行此步驟處理。負數不能直接取對數,如果數據中有負數,研究人員可考慮先對小於0的負數,先取其絕對值再求對數,然後加上負數符號。
案例中,性別一項為定類數據,所以不需要對此項做處理。其他分析項均取其自然對數。
2. 使用Robust穩健標准誤回歸
這種研究方法是當前最為流行也最為有效的處理辦法。在SPSSAU中分析時,勾選上『robust穩健標准誤』即可。當然以上兩種方法可以結合使用,即先對數據取對數,然後進行Robuust穩健標准誤回歸:
3. FGLS回歸
FGLS是這樣的一類思路,即對於殘差值越大的點,給予越小的權重,從而解決異方差問題,FGLS回歸事實上一系列數據處理的過程。從分析上看,它依然還是使用OLS回歸方法進行。操作方法請參考: https://spssau.com/front/spssau/helps/conometricstudy/olsregression.html
1. 如果是取對數操作,特別需要注意原始數據中負數不能直接取對數,如果數據中有負數,研究人員可考慮先對小於0的負數,先取其絕對值再求對數,然後加上負數符號。
2. 穩健標准誤回歸不會輸出white檢驗和BP檢驗,Robust穩健標准誤回歸即是最終結果。
更多干貨內容可登錄 SPSSAU官網 查看
❸ 舉例說明什麼是異方差性
異方差性(heteroscedasticity )是相對於同方差而言的。所謂同方差,是為了保證回歸參數估計量具有良好的統計性質,經典線性回歸模型的一個重要假定:總體回歸函數中的隨機誤差項滿足同方差性,即它們都有相同的方差。如果這一假定不滿足,即:隨機誤差項具有不同的方差,則稱線性回歸模型存在異方差性。
若線性回歸模型存在異方差性,則用傳統的最小二乘法估計模型,得到的參數估計量不是有效估計量,甚至也不是漸近有效的估計量;此時也無法對模型參數的進行有關顯著性檢驗。
對存在異方差性的模型可以採用加權最小二乘法進行估計。
異方差性的檢測——White test
在此檢測中,原假設為:回歸方程的隨機誤差滿足同方差性。對立假設為:回歸方程的隨機誤差滿足異方差性。判斷原則為:如果nR^2>chi^2 (k-1),則原假設就要被否定,即回歸方程滿足異方差性。
在以上的判斷式中,n代表樣本數量,k代表參數數量,k-1代表自由度。chi^2值可由查表所得。
2含義
編輯
回歸模型的隨機擾動項ui在不同的觀測值中的方差不等於一個常數,Var(ui)= 常數(i=1,2,…,n),或者Var(u ) Var(u )(i j),這時我們就稱隨機擾動項ui具有異方差性(Heteroskedasticity)。
在實際經濟問題中,隨機擾動項ui往往是異方差的,但主要在截面數據分析中出現。
例如
(1)調查不同規模公司的利潤,發現大公司的利潤波動幅度比小公司的利潤波動幅度大;
(2)分析家庭支出時發現高收入家庭支出變化比低收入家庭支出變化大。
在分析家庭支出模型時,我們會發現高收入家庭通常比低收入家庭對某些商品支出有更大的方差;圖5-1顯示了一元線性回歸中隨機變數的方差ui隨著解釋變數 的增加而變化的情況。
異方差性破壞了古典模型的基本假定,如果我們直接應用最小二乘法估計回歸模型,將得不到准確、有效的結果。
來源
1.模型中缺少某些解釋變數,從而隨機擾動項產生系統模式
由於隨機擾動項ui包含了所有無法用解釋變數表示的各種因素對被解釋變數的影響,即模型中略去的經濟變數對被解釋變數的影響。如果其中被略去的某一因素或某些因素隨著解釋變數觀測值的不同而對被解釋變數產生不同的影響,就會使ui產生異方差性。
例如,以某一時間截面上不同收入家庭的數據為樣本,研究家庭對某一消費品(如服裝、食品等)的需求,設其模型為:
(5-1)
其中Qi表示對某一消費品的需求量,Ii為家庭收入,ui為隨機擾動項。ui包括除家庭收入外其他因素對Qi的影響。如:消費習慣、偏好、季節、氣候等因素,ui的方差就表示這些因素的影響可能使得Qi偏離均值的程度。在氣候異常時,高收入家庭就會拿出較多的錢來購買衣服,而低收入的家庭購買衣服的支出就很有限,這時對於不同的收入水平Ii,Qi偏離均值的程度是不同的,Var(ui) 常數,於是就存在異方差性了。
再比如,以某一時間截面上不同地區的數據為樣本,研究某行業的產出隨投入要素的變化而變化的關系,建立如下模型:
(5-2)
其中Yi表示某行業的產出水平。Li表示勞動力對產出的影響。Ki表示資本對產出的影響,ui表示除勞動力和資本外其他因素對產出水平的影響,諸如地理位置、國家政策等。顯然,對於不同的行業 ,這些因素對產出 的影響程度是不 同的,引起 偏離零均值的程度也是不同的,這就出現了異方差。
異方差性容易出現在截面數據中,這是因為在截面數據中通常涉及某一確定時點上的總體單位。比如個別的消費者及其家庭、不同行業或者農村、城鎮等區域的劃分,這些單位各自有不同的規模或水平,一般情況下用截面數據作樣本時出現異方差性的可能性較大。
2.測量誤差
測量誤差對異方差性的作用主要表現在兩個方面:一方面,測量誤差常常在一定時間內逐漸積累,誤差趨於增加,如解釋變數X越大,測量誤差就會趨於增大;另一方面,測量誤差可能隨時間變化而變化,如抽樣技術或收集資料方法的改進就會使測量誤差減少。所以測量誤差引起的異方差性一般都存在於時間序列中。
例如,研究某人在一定時期內學習打字時打字差錯數Yt與練習打字時間Xt之間的關系。顯然在打字練習中隨時間的增加,打字差錯數將減少,即隨著Xt的增加Yt將減小。這時Var(ut)將隨Xt的增加而減少,於是存在異方差性。
不僅在時間序列上容易出現異方差性,利用平均數作為樣本數據也容易出現異方差性。因為許多經濟變數之間的關系都服從正態分布,例如不同收入組的人數隨收入的增加是正態分布,即收入較高和較低的人是少數的,大部分人的收入居於較高和較低之間,在以不同收入組的人均數據作為樣本時,由於每組中的人數不同,觀測誤差也不同,一般來說,人數多的收入組的人均數據較人數少的收入組的人均數據具有較高的准確性,即Var(ui)隨收入Ii呈現先降後升的趨勢,這也存在著異方差性。
3.模型函數形式設置不正確
模型函數形式的設定誤差。如將指數曲線模型誤設成了線性模型,則誤差有增大的趨勢。
4.異常值的出現
隨機因素的影響,如政策變動、自然災害、金融危機、戰爭和季節等。
類型
異方差一般可歸結為三種類型:
(1)單調遞增型:隨X的增大而增大,即在X與Y的散點圖中,表現為隨著X值的增大Y值的波動越來越大
(2)單調遞減型:隨X的增大而減小,即在X與Y的散點圖中,表現為隨著X值的增大Y值的波動越來越小
(3)復雜型:與X的變化呈復雜形式,即在X與Y的散點圖中,表現為隨著X值的增大Y值的波動復雜多變沒有系統關系。
檢驗存在的方法
事實也證明,實際經濟問題中經常會出現異方差性,這將影響回顧模型的估計、檢驗和應用。因此在建立計量經濟模型時應檢驗模型是否存在異方差性。關於異方差性檢驗的方法大致如下:圖示檢驗法、Goldfeld - Quandt 檢驗法、White檢驗法、Park檢驗法和Gleiser檢驗法。
1)圖示檢驗法。①相關圖分析。方差為隨機變數的離散程度,通過觀察y和x的相關圖,可以觀察的離散程度和解釋變數之間的相關關系。若隨x的增加,y的離散程度呈逐漸增加或減少的趨勢則表明模型存在著遞增或者遞減的異方差性。②殘差圖分析。通過對模型殘差分布的觀察,如果分布的離散程度有明顯擴大的趨勢,則表明存在異方差性。圖示檢驗法只能較簡單粗略判斷模型是否存在著異方差性。
2)Goldfeld - Quandt 檢驗法。將解釋變數排序,分成兩個部分利用樣本1 和樣本2 分別建立回歸模型,並求出各自殘差平方 和,若誤差項的離散程度相同,則 和 的值大致相同,若兩者之間存在顯著差異,則表明存在差異性。為在檢驗過程中「誇大」差異性,在樣本中去掉c 個樣本數據(c= n/4),則構造F統計量
對於給定顯著水平,若,則表明模型存在異方差性,反之,則不存在。
3)懷特(white) 檢驗。White 檢驗是通過建立輔助回歸模型的方法來判斷異方差性。假設回歸模型為二元線性回歸模型 則White 檢驗的步驟為:估計回歸模型,計算殘差;估計輔助回歸模型:即將殘差平方關於解釋變數的一次項,二次項和交叉乘積項進行回歸;計算輔助回歸模型的判斷系數,可以證明在同方差的假定下( ) ,其中q 為輔助回歸模型中自變數的個數:給定顯著水平,若 ,則認為至少有一個不為0( ),存在異方差性。
4)帕克檢驗( Park test ) 和格里瑟檢驗( Glesgertest)。通過建立殘差序列對解釋變數的輔助回歸模型,判斷隨機項的誤差和解釋變數之間是否有較強的相關關系,以此來判斷模型是否存在異方差性。
Park檢驗:或 ;
Gleiser檢驗:h=±1,±2,±1/2,……,其中 是隨機誤差項,給定顯著水平,若
經檢驗其中的某個輔助回歸方程是顯著的,則證明原模型存在異方差性。帕克檢驗和格里瑟檢驗可以判斷模型是否存在異方差,而且可以探究模型異方差性的具體形式,這為後來解決異方差性打下基礎
後果
在古典回歸模型的假定下,普通最小二乘估計量是線性、無偏、有效估計量,即在所有無偏估量中,最小二乘估計量具有最小方差性——它是有效估計量。如果在其他假定不變的條件下,允許隨機擾動項ui存在異方差性,即ui的方差隨觀測值的變化而變化,這就違背了最小二乘法估計的高斯——馬爾柯夫假設,這時如果繼續使用最小二乘法對參數進行估計,就會產生以下後果:
1.參數估計量仍然是線性無偏的,但不是有效的
2.異方差模型中的方差不再具有最小方差性
3.t檢驗失去作用
4.模型的預測作用遭到破壞
❹ 異方差常用的估計方法
關於異方差性檢驗的方法大致有:圖示檢驗法、Goldfeld - Quandt 檢驗法、White檢驗法、Park檢驗法和Gleiser檢驗法。事實也證明,實際經濟問題中經常會出現異方差性,這將影響回顧模型的估計、檢驗和應用。因此在建立計量經濟模型時應檢驗模型是否存在異方差性。
異方差性是相對於同方差而言的。所謂同方差,是為了保證回歸參數估計量具有良好的統計性質,經典線性回歸模型的一個重要假定:總體回歸函數中的隨機誤差項滿足同方差性,即它們都有相同的方差隨機誤差項具有不同的方差,則稱線性回歸模型存在異方差性。
(4)解決異方差性問題的方法案例擴展閱讀
測量誤差對異方差性的作用主要表現在兩個方面:一方面,測量誤差常常在一定時間內逐漸積累,誤差趨於增加,如解釋變數X越大,測量誤差就會趨於增大;另一方面,測量誤差可能隨時間變化而變化,如抽樣技術或收集資料方法的改進就會使測量誤差減少。
不僅在時間序列上容易出現異方差性,利用平均數作為樣本數據也容易出現異方差性。收入較高和較低的人是少數的,大部分人的收入居於較高和較低之間,在以不同收入組的人均數據作為樣本時,由於每組中的人數不同,觀測誤差也不同。
檢驗異方差性的方法有: 1)圖示檢驗法。①相關圖分析。②殘差圖分析。 2)Goldfeld - Quandt 檢驗法。 3)懷特(white) 檢驗。 4)帕克檢驗( Park test ) 和格里奇檢驗( Glejser test)。