『壹』 SLS鍦ㄩ棿鎺ュ埗閫犻櫠鐡烽浂浠舵椂鏈夊摢浜涚摱棰堥棶棰濡備綍瑙e喅浜х敓鐨勫簲鍔
姝ラわ細
鍦ㄥ紑濮嬪姞宸ヤ箣鍓嶏紝鍏堝皢鍏呮湁姘姘旂殑宸ヤ綔瀹ゅ崌娓╋紝騫朵繚鎸佸湪綺夋湯鐨勭啍鐐逛竴涓嬨
鎴愬瀷鏃訛紝閫佹枡絳掍笂鍗囷紝閾虹矇婊氱瓛縐誨姩錛屽厛鍦ㄥ伐浣滃鉤鍙頒笂閾轟竴灞傜矇鏈鏉愭枡錛岀劧鍚庢縺鍏夋潫鍦ㄨ$畻鏈烘帶鍒朵笅鎸夌収鎴闈㈣疆寤撳瑰疄蹇冮儴鍒嗘墍鍦ㄧ殑綺夋湯榪涜岀儳緇擄紝浣跨矇鏈婧跺寲緇ц屽艦鎴愪竴灞傚滻浣撹疆寤撱傜涓灞傜儳緇撳畬鎴愬悗錛屽伐浣滃彴涓嬮檷涓鎴闈㈠眰鐨勯珮搴︼紝鍦ㄩ摵涓婁竴灞傜矇鏈錛岃繘琛屼笅涓灞傜儳緇擄紝濡傛ゅ驚鐜錛屽艦鎴愪笁緇寸殑鍘熷瀷闆朵歡銆傛渶鍚庣粡榪5-10灝忔椂鍐峰嵈錛屽嵆鍙浠庣矇鏈緙鎬腑鍙栧嚭闆朵歡銆
鏈緇忕儳緇撶殑綺夋湯鑳芥壙鎵樻e湪鐑х粨鐨勫伐浠訛紝褰撶儳緇撳伐搴忓畬鎴愬悗錛屽彇鍑洪浂浠躲傜矇鏈鏉愭枡閫夋嫨鎬х儳緇撳伐鑹洪傚悎蹇閫熸垚鍨嬩腑灝忎歡錛岃兘鐩存帴鐨勫埌濉戞枡銆侀櫠鐡鋒垨閲戝睘闆朵歡錛岄浂浠剁殑緲樻洸鍙樺艦姣旀恫鎬佸厜鏁忔爲鑴傞夋嫨鎬у滻鍖栧伐鑹鴻佸皬銆備絾榪欑嶅伐鑹轟粛闇瀵規暣涓鎴闈㈣繘琛屾壂鎻忓拰鐑х粨錛屽姞涓婂伐浣滃ら渶瑕佸崌娓╁拰鍐峰嵈錛屽揩閫熸垚鍨嬫椂闂磋緝闀褲
姝ゅ栵紝鐢變簬鍙楀埌綺夋湯棰楃矑澶у皬鍙婃縺鍏夌偣鐨勯檺鍒訛紝闆朵歡鐨勮〃闈涓鑸鍛堝氬瓟鎬с傚湪鐑х粨闄剁摲銆侀噾灞炰笌綺樼粨鍓傜殑娣峰悎綺夊苟寰楀埌鍘熷瀷闆朵歡鍚庯紝欏誨皢瀹冪疆浜庡姞鐑鐐変腑錛岀儳鎺夊叾涓鐨勭矘緇撳墏錛屽苟鍦ㄥ瓟闅欎腑娓楀叆濉鍏呯墿錛屽叾鍚庡勭悊澶嶆潅銆
『貳』 內生性問題的解決方法
事實上,僅僅為了解決內生性問題,並不需要我們對內生性問題的緣起有很深入的理解。對於應用型的實證研究而言,我們只需要掌握解決內生性問題的具體方案即可。內生性問題的解決方案一共四種,理論上來講,這四種方案應對內生性問題都很有效。但於我個人而言,我對四種方法的評價是有高低的,由高到低分別介紹如下。
1.自然實驗法
所謂自然實驗,就是發生了某些外部突發事件,使得研究對象彷彿被隨機分成了實驗組或控制組。
這是我最喜歡的方法,只是自然實驗需要尋找一個事件,並且這個事件隻影響解釋變數而不影響被解釋變數。遇著這種事件是一種緣分,還要能識別出來,這對學者的眼光也是一種挑戰。
有很多文章聲稱使用了自然實驗,但嚴格來講,並沒有做到對研究對象進行了隨機分組。雖然如此,我對此類文章仍然很是喜歡。
2.雙重差分法
Difference-in-Difference (DID)一般稱為雙重差分法,或倍差法。倘若出現了一次外部沖擊,這次沖擊影響了一部分樣本,對另一部分樣本則無影響,而我們想看一下這次外部沖擊到底有何影響,雙重差分法就是用來研究這次沖擊的凈效應的。
其基本思想是,將受沖擊的樣本視作實驗組,再按照一定標准在未受沖擊的樣本中尋求與實驗組匹配的對照組,而後做差,做差剩下來的便是這次沖擊的凈效應。
雙重差分法實際上是固定效應的一個變種,差分的過程實際上是排除固定效應的過程。ZERA在《計量論文寫作和發表的黑客教程》有一個非常簡明風趣的舉例,我轉述於此,以饗讀者。
「大家都知道買房子靠不靠學校醫院等設施還是有很大差別的。但是,影響房價的因素又不止學區那麼簡單。
學校旁邊的學區房價格上升,難道一定是學區房因素導致的嗎?
現在我們要使用雙重差分法檢驗一個假設:學區房因素導致房價上升。
差分再差分,這個方法要湊效的秘訣是:學區房因素發生變化,而其他因素基本維持不變。例如教育管理機構重新劃分學區,一個著名小學突然在某個沒學校的地方建分校,或者一個著名小學搬遷,這些因素導致房子是否屬於學區房發生了變化。
以建分校為例。建校後周圍一片區域A的房子都屬於學區房,這個區域以外附近區域(B)的其他房子就不算該校學區房。然後收集建校前後兩個時間點上、A和B區域房價的數據。
所謂的差分再差分法,就是:A區域兩個時間點上的平均房價差距 - B區域兩時間點上的平均房價差距 = d,這個d就是建校對房價的影響了。d是兩個差距之間的差距,所以才叫做差分再差分。用計量回歸把這個d給估計出來,是有辦法的:
P= b0 + b1*Da +b2*Dt + d*(Da*Dt) + Xb + e
P是房價,Da是虛擬變數,在區域A則為1,否則為0, Dt是時間虛擬變數,建校後為1,建校前為0。 STATA一跑,就把d估計出來了。為什麼d可以如此表示?自己思考一下啦。實在想不出來,Wooldridge的書上有精確嚴格的解釋。這里給出一個直觀的粗略解釋:北京所有區域的房價每個月都在上升,因此需要控制這部分因素,這就是時間因素Dt;區域不同自然也有差別,需要控制區域位置因素,這就是Da,這就控制了即使不建校也存在的差距;控制住其他因素X,那麼剩下的Da*Dt就是建校帶來的房價提升效應了。這下明白了哦。」
當然,如果你想看到更學術化的探討,可以參考2015年第7期《數量經濟技術經濟研究》所刊文章《國內雙重差分法的研究現狀與潛在問題》。
3.工具變數法
這是一種處理內生性問題的經典方法,或者說被濫用最嚴重的方法。
這種方法相信大家都已經學過,就是找到一個變數和內生解釋變數相關,但是和隨機擾動項不相關。在OLS的框架下同時有多個工具變數(IV),這些工具變數被稱為two stage least squares (2SLS) estimator。具體的說,這種方法是找到影響內生變數的外生變數,連同其他已有的外生變數一起回歸,得到內生變數的估計值,以此作為IV,放到原來的回歸方程中進行回歸。
工具變數法最大的問題是滿足研究條件的工具變數難以找到,而不合乎條件的工具變數只能帶來更嚴重的估計問題。
當然,我確實見過非常精巧的工具變數,譬如,殖民地時代的死亡率。
4. 動態面板回歸法
基本思想是將解釋變數和被解釋變數的滯後項作為工具變數(IV)。其實,我是不認可這種處理方法,除非萬不得已,我不推薦這種方法,我也不太相信這種方法能真正緩解內生性問題。可是,確實很多人都在用。算了,不多說了。