① 因變數與自變數之間產生內生性的來源是什麼,一般是用什麼方法解決
來源主要是:遺漏相關變數、解釋變數有測量誤差、雙向因果關系;
解決方法:工具變數法
② 怎樣解決計量中的內生性問題
內生變數是指與誤差項相關的解釋變數。對應還有一個術語叫『外生變數』,是指與誤差項不相關的解釋變數。
產生內生性問題的原因通常在三類,分別說明如下:
第一階段回歸結果為中間過程值,SPSSAU默認沒有輸出;第二階段回歸結果為最終結果值。
特別提示:
內生性問題涉及以下幾點:分別是內生變數判斷(Durbin-Wu-Hausman檢驗和理論判斷)、內生性問題的解決(兩階段最小二乘回歸TSLS或GMM)、工具變數引入後過度識別檢驗(Sargan檢驗和Basmann檢驗)等。
如果在理論上認為可能某解釋變數可能為內生變數,那麼直接進行TSLS回歸即可。
③ 怎樣確定內生解釋變數,前定解釋變數及外生解釋變數
內生變數為模型內可以解釋的變數,
外生變數為模型內不能解釋的變數。
④ 內生變數的解釋
內生變數解釋如下:
示例
例:P=a+bQ,表示價格與數量的關系,則a、b是參數,都是外生變數;P、Q是模型要決定的變數,所以是內生變數。除此之外,譬如相關商品的價格,人們的收入等其他與模型有關的變數,都是外生變數。
(4)列出內生解釋變數常用修正方法擴展閱讀:
一般情況下,內生變數與隨機項相關,即:在聯立方程模型中,內生變數既作為被解釋變數,又可以在不同的方程中作為解釋變數。在推動社會進步時,要有效的改變內生變數必須從改變決定內生變數的外生變數著手,如果不改變外生變數而想去直接改變內生變數。
那麼不僅會事與願違,而且很可能把事情搞得更糟。是由模型系統內部因素決定的變數,表現為具有一定概率分布的隨機變數,是模型求解的結果。
⑤ 內生性的檢驗
基本思想:直接比較OLS和IV估計值,若所有變數都是外生的,則OLS和IV估計都是一致的,若明顯不同,則我們就斷定解釋變數有內生性。
操作前提:首先找到一個外生變數用做工具變數。
一個問題:工具變數本身的外生性如果檢測?
⑥ 如何檢驗解釋變數的內生性問題
解釋變數內生性檢驗
首先檢驗解釋變數內生性(解釋變數內生性的Hausman 檢驗:使用工具變數法的前提是存在內生解釋變數。Hausman 檢驗的原假設為:所有解釋變數均為外生變數,如果拒絕,則認為存在內生解釋變數,要用IV;反之,如果接受,則認為不存在內生解釋變數,應該使用OLS。
reg ldi lofdi
estimates store ols
xtivreg ldi (lofdi=l.lofdi ldep lexr)
estimates store iv
hausman iv ols
(在面板數據中使用工具變數,Stata提供了如下命令來執行2SLS:xtivreg depvar [varlist1] (varlist_2=varlist_iv) (選擇項可以為fe,re等,表示固定效應、隨機效應等。詳見help xtivreg)
如果存在內生解釋變數,則應該選用工具變數,工具變數個數不少於方程中內生解釋變數的個數。「恰好識別」時用2SLS。2SLS的實質是把內生解釋變數分成兩部分,即由工具變數所造成的外生的變動部分,以及與擾動項相關的其他部分;然後,把被解釋變數對中的這個外生部分進行回歸,從而滿足OLS前定變數的要求而得到一致估計量。tptqtp
二、異方差與自相關檢驗
在球型擾動項的假定下,2SLS是最有效的。但如果擾動項存在異方差或自相關,
面板異方差檢驗:
xtgls enc invs exp imp esc mrl,igls panel(het)
estimates store hetero
xtgls enc invs exp imp esc mrl,igls
estimates store homo
local df = e(N_g) - 1
lrtest hetero homo, df(`df')
面板自相關:xtserial enc invs exp imp esc mrl
則存在一種更有效的方法,即GMM。從某種意義上,GMM之於2SLS正如GLS之於OLS。好識別的情況下,GMM還原為普通的工具變數法;過度識別時傳統的矩估計法行不通,只有這時才有必要使用GMM,過度識別檢驗(Overidentification Test或J Test):estat overid
三、工具變數效果驗證
工具變數:工具變數要求與內生解釋變數相關,但又不能與被解釋變數的擾動項相關。由於這兩個要求常常是矛盾的,故在實踐上尋找合適的工具變數常常很困難,需要相當的想像力與創作性。常用滯後變數。
需要做的檢驗:
檢驗工具變數的有效性:
(1) 檢驗工具變數與解釋變數的相關性
如果工具變數z與內生解釋變數完全不相關,則無法使用工具變數法;如果與僅僅微弱地相關,。這種工具變數被稱為「弱工具變數」(weak instruments)後果就象樣本容量過小。檢驗弱工具變數的一個經驗規則是,如果在第一階段回歸中,F統計量大於10,則可不必擔心弱工具變數問題。Stata命令:estat first(顯示第一個階段回歸中的統計量)
(2) 檢驗工具變數的外生性(接受原假設好)
在恰好識別的情況下,無法檢驗工具變數是否與擾動項相關。在過度識別(工具變數個數>內生變數個數)的情況下,則可進行過度識別檢驗(Overidentification Test),檢驗原假設所有工具變數都是外生的。如果拒絕該原假設,則認為至少某個變數不是外生的,即與擾動項相關。0H
Sargan統計量,Stata命令:estat overid
四、GMM過程
在Stata輸入以下命令,就可以進行對面板數據的GMM估計。
. ssc install ivreg2 (安裝程序ivreg2 )
. ssc install ranktest (安裝另外一個在運行ivreg2 時需要用到的輔助程序ranktest)
. use "traffic.dta"(打開面板數據)
. xtset panelvar timevar (設置面板變數及時間變數)
. ivreg2 y x1 (x2=z1 z2),gmm2s (進行面板GMM估計,其中2s指的是2-step GMM)
⑦ 內生性問題的解決方法
事實上,僅僅為了解決內生性問題,並不需要我們對內生性問題的緣起有很深入的理解。對於應用型的實證研究而言,我們只需要掌握解決內生性問題的具體方案即可。內生性問題的解決方案一共四種,理論上來講,這四種方案應對內生性問題都很有效。但於我個人而言,我對四種方法的評價是有高低的,由高到低分別介紹如下。
1.自然實驗法
所謂自然實驗,就是發生了某些外部突發事件,使得研究對象彷彿被隨機分成了實驗組或控制組。
這是我最喜歡的方法,只是自然實驗需要尋找一個事件,並且這個事件隻影響解釋變數而不影響被解釋變數。遇著這種事件是一種緣分,還要能識別出來,這對學者的眼光也是一種挑戰。
有很多文章聲稱使用了自然實驗,但嚴格來講,並沒有做到對研究對象進行了隨機分組。雖然如此,我對此類文章仍然很是喜歡。
2.雙重差分法
Difference-in-Difference (DID)一般稱為雙重差分法,或倍差法。倘若出現了一次外部沖擊,這次沖擊影響了一部分樣本,對另一部分樣本則無影響,而我們想看一下這次外部沖擊到底有何影響,雙重差分法就是用來研究這次沖擊的凈效應的。
其基本思想是,將受沖擊的樣本視作實驗組,再按照一定標准在未受沖擊的樣本中尋求與實驗組匹配的對照組,而後做差,做差剩下來的便是這次沖擊的凈效應。
雙重差分法實際上是固定效應的一個變種,差分的過程實際上是排除固定效應的過程。ZERA在《計量論文寫作和發表的黑客教程》有一個非常簡明風趣的舉例,我轉述於此,以饗讀者。
「大家都知道買房子靠不靠學校醫院等設施還是有很大差別的。但是,影響房價的因素又不止學區那麼簡單。
學校旁邊的學區房價格上升,難道一定是學區房因素導致的嗎?
現在我們要使用雙重差分法檢驗一個假設:學區房因素導致房價上升。
差分再差分,這個方法要湊效的秘訣是:學區房因素發生變化,而其他因素基本維持不變。例如教育管理機構重新劃分學區,一個著名小學突然在某個沒學校的地方建分校,或者一個著名小學搬遷,這些因素導致房子是否屬於學區房發生了變化。
以建分校為例。建校後周圍一片區域A的房子都屬於學區房,這個區域以外附近區域(B)的其他房子就不算該校學區房。然後收集建校前後兩個時間點上、A和B區域房價的數據。
所謂的差分再差分法,就是:A區域兩個時間點上的平均房價差距 - B區域兩時間點上的平均房價差距 = d,這個d就是建校對房價的影響了。d是兩個差距之間的差距,所以才叫做差分再差分。用計量回歸把這個d給估計出來,是有辦法的:
P= b0 + b1*Da +b2*Dt + d*(Da*Dt) + Xb + e
P是房價,Da是虛擬變數,在區域A則為1,否則為0, Dt是時間虛擬變數,建校後為1,建校前為0。 STATA一跑,就把d估計出來了。為什麼d可以如此表示?自己思考一下啦。實在想不出來,Wooldridge的書上有精確嚴格的解釋。這里給出一個直觀的粗略解釋:北京所有區域的房價每個月都在上升,因此需要控制這部分因素,這就是時間因素Dt;區域不同自然也有差別,需要控制區域位置因素,這就是Da,這就控制了即使不建校也存在的差距;控制住其他因素X,那麼剩下的Da*Dt就是建校帶來的房價提升效應了。這下明白了哦。」
當然,如果你想看到更學術化的探討,可以參考2015年第7期《數量經濟技術經濟研究》所刊文章《國內雙重差分法的研究現狀與潛在問題》。
3.工具變數法
這是一種處理內生性問題的經典方法,或者說被濫用最嚴重的方法。
這種方法相信大家都已經學過,就是找到一個變數和內生解釋變數相關,但是和隨機擾動項不相關。在OLS的框架下同時有多個工具變數(IV),這些工具變數被稱為two stage least squares (2SLS) estimator。具體的說,這種方法是找到影響內生變數的外生變數,連同其他已有的外生變數一起回歸,得到內生變數的估計值,以此作為IV,放到原來的回歸方程中進行回歸。
工具變數法最大的問題是滿足研究條件的工具變數難以找到,而不合乎條件的工具變數只能帶來更嚴重的估計問題。
當然,我確實見過非常精巧的工具變數,譬如,殖民地時代的死亡率。
4. 動態面板回歸法
基本思想是將解釋變數和被解釋變數的滯後項作為工具變數(IV)。其實,我是不認可這種處理方法,除非萬不得已,我不推薦這種方法,我也不太相信這種方法能真正緩解內生性問題。可是,確實很多人都在用。算了,不多說了。
⑧ 內生性檢驗方法
最近也在學習這個問題,還處於小白階段,分享下我的理解。
內生性問題,是指解釋變數x和殘差項u之間存在相關性。導致內生性問題的原因有多個,所以也就有多個與之對應的解決內生性的方法。
首先有可能是遺漏變數,遺漏的變數和x相關。如果你知道遺漏變數是什麼,直接加進來作為控制變數即可。這是最簡單的一種。
如果不知道遺漏變數是什麼,或者Y和X互為因果。可以使用工具變數法。工具變數法其實也就是2SLS回歸(當你選的工具變數個數和內生性變數相同時),或者GMM回歸(工具變數個數大於解釋變數個數)。在使用工具變數時還要考慮工具變數是不是弱工具變數,是不是存在無效工具變數,這都要進行檢驗。
其次,導致內生性問題的原因,還可能是面板數據中,由於個體特異性沒有考慮進去,這些個體特異性如果與解釋變數相關,那麼也會導致內生性問題(x與u相關)。這種情況下,如果你的自變數是隨時間變化的,用固定效應模型;如果你的自變數是不隨時間變化的,用hausman-taylor模型。
第三種,如果你的樣本存在自選擇的問題,也會導致內生性問題。這種情況下就會使用heckman二階段檢驗。
至於具體的實現命令,你直接在stata裡面 help+你想用的回歸方式,stata裡面提供的材料就挺清楚的了。樓主可以根據自己的需要看看。
剛開始這方面的學習,所以我的知識水平只到這。
至於你說的PSM傾向匹配得分法,DID雙重差分,據我所知,是工具變數法的替代解決方式,工具變數法有個非常致命的弱點是好工具變數非常難找。但是具體背後的原理我還不是特別清楚。
以上,希望對樓主有所幫助。