1. 怎样解决计量中的内生性问题
内生变量是指与误差项相关的解释变量。对应还有一个术语叫‘外生变量’,是指与误差项不相关的解释变量。
产生内生性问题的原因通常在三类,分别说明如下:
第一阶段回归结果为中间过程值,SPSSAU默认没有输出;第二阶段回归结果为最终结果值。
特别提示:
内生性问题涉及以下几点:分别是内生变量判断(Durbin-Wu-Hausman检验和理论判断)、内生性问题的解决(两阶段最小二乘回归TSLS或GMM)、工具变量引入后过度识别检验(Sargan检验和Basmann检验)等。
如果在理论上认为可能某解释变量可能为内生变量,那么直接进行TSLS回归即可。
2. 经济学中的内生性和外生性是什么意思
内生性是指影响经济的变量是其决定性的,是主要的经济变量,如需求理论中的价格因素。
外生性是指经济中的变量起次要的作用,比如需求理论中的偏好、预期等。存在内生性即是指经济变量之间是相互其决定作用的。
产生于经济模型内部的变量就是内生变量,内生变量之间往往相互影响,即体现互为变量与函数的关系;而外生变量来自于模型之外,往往是一些参数系数之类的,不会从模型内部得到。
内生变量解决的问题是自足性的,外生变量依靠模型本省是回答不了的,要借助外部数据。
(2)内生性解决的两种方法扩展阅读:
政治经济学根据所代表的阶级的利益为了突出某个阶级在经济活动中的地位和作用自发从某个侧面研究价值规律或经济规律,科学经济学自觉从整体上研究价值规律或经济规律。对称经济学就是科学经济学。经济学的核心是经济规律;
对称经济学看来,资源的优化配置与优化再生只是经济规律的展开和具体表现,经济学的对象应该是资源优化配置与优化再生后面的经济规律与经济本质,而不是停留在资源的优化配置与优化再生层面。
3. 内生性检验方法
最近也在学习这个问题,还处于小白阶段,分享下我的理解。
内生性问题,是指解释变量x和残差项u之间存在相关性。导致内生性问题的原因有多个,所以也就有多个与之对应的解决内生性的方法。
首先有可能是遗漏变量,遗漏的变量和x相关。如果你知道遗漏变量是什么,直接加进来作为控制变量即可。这是最简单的一种。
如果不知道遗漏变量是什么,或者Y和X互为因果。可以使用工具变量法。工具变量法其实也就是2SLS回归(当你选的工具变量个数和内生性变量相同时),或者GMM回归(工具变量个数大于解释变量个数)。在使用工具变量时还要考虑工具变量是不是弱工具变量,是不是存在无效工具变量,这都要进行检验。
其次,导致内生性问题的原因,还可能是面板数据中,由于个体特异性没有考虑进去,这些个体特异性如果与解释变量相关,那么也会导致内生性问题(x与u相关)。这种情况下,如果你的自变量是随时间变化的,用固定效应模型;如果你的自变量是不随时间变化的,用hausman-taylor模型。
第三种,如果你的样本存在自选择的问题,也会导致内生性问题。这种情况下就会使用heckman二阶段检验。
至于具体的实现命令,你直接在stata里面 help+你想用的回归方式,stata里面提供的材料就挺清楚的了。楼主可以根据自己的需要看看。
刚开始这方面的学习,所以我的知识水平只到这。
至于你说的PSM倾向匹配得分法,DID双重差分,据我所知,是工具变量法的替代解决方式,工具变量法有个非常致命的弱点是好工具变量非常难找。但是具体背后的原理我还不是特别清楚。
以上,希望对楼主有所帮助。
4. 内生性的解决方法
工具变量估计
工具变量:假定我们有一个可观测到的变量Z,它满足两个假定
(1):Z与U不相关,即与Cov(Z,U)=0;
(2):Z与X相关,即与Cov(Z,X)不等于0;
我们则称Z是X的工具变量(instrumental variable 简称IV)
举例:以双变量模型为例
Y=Q+WX+U;
其中X与U相关,因而OLS估计有偏,现在有X的工具变量Z,
于是有Cov(Z,Y)=Cov(Z,Q+WX+U)
=Cov(Z,WX)+Cov(Z,U)(Q为常数)
=WCov(Z,X)
所以有W=Cov(Z,Y)/Cov(Z,X)
工具变量的优劣
(1):Z与U不相关,即与Cov(Z,U)=0;
相关性越低,则越好
(2):Z与X相关,即与Cov(Z,X)不等于0;
相关性越高,则越好
Z与U相关性低,Z与X相关性高,这样的工具变量被称为好工具变量,反之则称为劣工具变量。
好的工具变量的识别
(1):Z与U不相关,即与Cov(Z,U)=0;
由于U无法观察,因而难以用正式的工具进行测量,通常由经济理论来使人们相信。
(2):Z与X相关,即与Cov(Z,X)不等于0;
将X对Z回归即可,看看X的系数是否显着异于零?
IV与OLS估计量的简单比较
IV估计量:C1=Cov(Z,Y)/Cov(Z,X)
而OLS估计量是:C2=Cov(X,Y)/Cov(X,X)
(1)因此,Z=X时,两者将完全一致,换句话说,当X外生时,它可用做自身的IV,IV估计量便等同于OLS估计量。
(2)若Z与X不相关,Cov(Z,X)等于0,则IV法无法给出估计量。
IV与OLS的取舍
(1)尽管当Z与U不相关,而Z与X存在着或正或负的相关时,IV是一致的,但当Z与X只是弱相关时IV估计值的标准误可能很大,Z与X之间的弱相关可能产生更加严重的后果:即使Z与U只是适度相关,IV估计的渐进偏误也可能很大。也即是说,当解释变量外生时,IV与OLS估计都是一致的,但IV估计不如OLS有效。
(2)所以,当内生性程度不严重或者好的工具变量找不到时,还不如用OLS。反之,当内生性程度严重时,就一定要想办法解决,否则,OLS估计就是不可接受的,当然,差的IV同样是不可接受的。
其它解决办法
(1)代理变量:某变量无法直接观测,而用其它变量替代。
(2)前定变量:用变量的前一期或前几期数据。
(3)面板数据模型。
5. 双重差分法为什么可以解决内生性问题
内生性问题伍德里奇的计量经济学导论讲的很清楚,主要是指由于遗漏变量造成误差项和解释变量相关,从而造成系数估计的偏误,比如能力这种因素就因为难以衡量而进入不了解释方程,但是通过工具变量法IV,用IQ作为工具变量替代能力,就可以解决内生性问题。DID也就是双重查分当然也是一种方法,主要用于政策的评估。
6. 因变量与自变量之间产生内生性的来源是什么,一般是用什么方法解决
来源主要是:遗漏相关变量、解释变量有测量误差、双向因果关系;
解决方法:工具变量法
7. 自变量与调节变量存在内生性如何解决
解释变量内生性检验 首先检验解释变量内生性(解释变量内生性的Hausman 检验:使用工具变量法的前提是存在内生解释变量。Hausman 检验的原假设为:所有解释变量均为外生变量,如果拒绝,则认为存在内生解释变量,要用IV;反之,如果接受,则认为不存在内生解释变量,应该使用OLS。 reg ldi lofdi estimates store ols xtivreg ldi (lofdi=l.lofdi ldep lexr) estimates store iv hausman iv ols (在面板数据中使用工具变量,Stata提供了如下命令来执行2SLS:xtivreg depvar [varlist1] (varlist_2=varlist_iv) (选择项可以为fe,re等,表示固定效应、随机效应等。详见help xtivreg) 如果存在内生解释变量,则应该选用工具变量,工具变量个数不少于方程中内生解释变量的个数。“恰好识别”时用2SLS。2SLS的实质是把内生解释变量分成两部分,即由工具变量所造成的外生的变动部分,以及与扰动项相关的其他部分;然后,把被解释变量对中的这个外生部分进行回归,从而满足OLS前定变量的要求而得到一致估计量。tptqtp 二、异方差与自相关检验 在球型扰动项的假定下,2SLS是最有效的。但如果扰动项存在异方差或自相关, 面板异方差检验: xtgls enc invs exp imp esc mrl,igls panel(het) estimates store hetero xtgls enc invs exp imp esc mrl,igls estimates store homo local df = e(N_g) - 1 lrtest hetero homo, df(`df') 面板自相关:xtserial enc invs exp imp esc mrl 则存在一种更有效的方法,即GMM。从某种意义上,GMM之于2SLS正如GLS之于OLS。好识别的情况下,GMM还原为普通的工具变量法;过度识别时传统的矩估计法行不通,只有这时才有必要使用GMM,过度识别检验(Overidentification Test或J Test):estat overid 三、工具变量效果验证 工具变量:工具变量要求与内生解释变量相关,但又不能与被解释变量的扰动项相关。由于这两个要求常常是矛盾的,故在实践上寻找合适的工具变量常常很困难,需要相当的想象力与创作性。常用滞后变量。 需要做的检验: 检验工具变量的有效性: (1) 检验工具变量与解释变量的相关性 如果工具变量z与内生解释变量完全不相关,则无法使用工具变量法;如果与仅仅微弱地相关,。这种工具变量被称为“弱工具变量”(weak instruments)后果就象样本容量过小。检验弱工具变量的一个经验规则是,如果在第一阶段回归中,F统计量大于10,则可不必担心弱工具变量问题。Stata命令:estat first(显示第一个阶段回归中的统计量) (2) 检验工具变量的外生性(接受原假设好) 在恰好识别的情况下,无法检验工具变量是否与扰动项相关。在过度识别(工具变量个数>内生变量个数)的情况下,则可进行过度识别检验(Overidentification Test),检验原假设所有工具变量都是外生的。如果拒绝该原假设,则认为至少某个变量不是外生的,即与扰动项相关。0H Sargan统计量,Stata命令:estat overid 四、GMM过程 在Stata输入以下命令,就可以进行对面板数据的GMM估计。 . ssc install ivreg2 (安装程序ivreg2 ) . ssc install ranktest (安装另外一个在运行ivreg2 时需要用到的辅助程序ranktest) . use "traffic.dta"(打开面板数据) . xtset panelvar timevar (设置面板变量及时间变量) . ivreg2 y x1 (x2=z1 z2),gmm2s (进行面板GMM估计,其中2s指的是2-step GMM)
8. 除了工具变量,还有哪些解决内生性的方法效果如何
解决内生性,
一般都要借助外部信息。
不同的解决方法适应于不同的外部信息。比如有前面一个时期的数据的时候可以用difference
in
differences。
当有其他数据或研究可以给出内生性的信息的时候可以用
propensity
score
calibration.
还有人说regression
discontinuity
design
可以解决内生性.
但一般最好用用得最多的还是工具变量
不借助外部信息的也就sensitivity
analysis
了。如果用sensitivity
analysis就随便你自己怎么玩了
9. 在经济学中,什么是内生性,什么是外生性
内生性是指影响经济的变量是其决定性的,是主要的经济变量,如需求理论中的价格因素。外生性是指经济中的变量起次要的作用,比如需求理论中的偏好、预期等。存在内生性即是指经济变量之间是相互其决定作用的。
产生于经济模型内部的变量就是内生变量,内生变量之间往往相互影响,即体现互为变量与函数的关系;而外生变量来自于模型之外,往往是一些参数系数之类的,不会从模型内部得到。
内生变量解决的问题是自足性的,外生变量依靠模型本省是回答不了的,要借助外部数据。
(9)内生性解决的两种方法扩展阅读:
对于一个经济主体(人,或者企业),内生性的东西指的是经济主体可以自己决定的东西,比方说,如果经济主体是个人,那么这个人可以决定早餐吃蔬菜水果还是馒头稀饭,所以早餐的食物类型就是内生性的。
外生性的东西指的是经济主体不可以自己决定的东西,比方说,如果经济主体是个人,那么这个人的性别是男还是女不可以自己决定(变性者除外),所以性别就是外生性的。
经济发展的规律就必须从整体上统一研究经济现象,宏观经济与微观经济是统一的经济体中对称的两个方面,所以在科学的对称经济学范式框架中,有宏观经济与微观经济之分,没有宏观经济学与微观经济学之别;而政治经济学总是把经济学分为宏观经济学与微观经济学。
经济学的对象是人类经济活动的本质与规律。社会经济发展是以主体创造价值活动为主导的、主客体从不对称向对称转化的动态平衡过程;以主体创造价值活动为主导的、主客体从不对称向对称转化,是社会经济发展的最根本动力。
因此主体创造、转化、实现价值过程中主客体的对称关系,就是人类经济活动的本质;以主体创造价值活动为主导的、主客体从不对称向对称转化的规律,就是人类经济活动的根本规律。
10. 内生性问题的解决方法
事实上,仅仅为了解决内生性问题,并不需要我们对内生性问题的缘起有很深入的理解。对于应用型的实证研究而言,我们只需要掌握解决内生性问题的具体方案即可。内生性问题的解决方案一共四种,理论上来讲,这四种方案应对内生性问题都很有效。但于我个人而言,我对四种方法的评价是有高低的,由高到低分别介绍如下。
1.自然实验法
所谓自然实验,就是发生了某些外部突发事件,使得研究对象仿佛被随机分成了实验组或控制组。
这是我最喜欢的方法,只是自然实验需要寻找一个事件,并且这个事件只影响解释变量而不影响被解释变量。遇着这种事件是一种缘分,还要能识别出来,这对学者的眼光也是一种挑战。
有很多文章声称使用了自然实验,但严格来讲,并没有做到对研究对象进行了随机分组。虽然如此,我对此类文章仍然很是喜欢。
2.双重差分法
Difference-in-Difference (DID)一般称为双重差分法,或倍差法。倘若出现了一次外部冲击,这次冲击影响了一部分样本,对另一部分样本则无影响,而我们想看一下这次外部冲击到底有何影响,双重差分法就是用来研究这次冲击的净效应的。
其基本思想是,将受冲击的样本视作实验组,再按照一定标准在未受冲击的样本中寻求与实验组匹配的对照组,而后做差,做差剩下来的便是这次冲击的净效应。
双重差分法实际上是固定效应的一个变种,差分的过程实际上是排除固定效应的过程。ZERA在《计量论文写作和发表的黑客教程》有一个非常简明风趣的举例,我转述于此,以飨读者。
“大家都知道买房子靠不靠学校医院等设施还是有很大差别的。但是,影响房价的因素又不止学区那么简单。
学校旁边的学区房价格上升,难道一定是学区房因素导致的吗?
现在我们要使用双重差分法检验一个假设:学区房因素导致房价上升。
差分再差分,这个方法要凑效的秘诀是:学区房因素发生变化,而其他因素基本维持不变。例如教育管理机构重新划分学区,一个着名小学突然在某个没学校的地方建分校,或者一个着名小学搬迁,这些因素导致房子是否属于学区房发生了变化。
以建分校为例。建校后周围一片区域A的房子都属于学区房,这个区域以外附近区域(B)的其他房子就不算该校学区房。然后收集建校前后两个时间点上、A和B区域房价的数据。
所谓的差分再差分法,就是:A区域两个时间点上的平均房价差距 - B区域两时间点上的平均房价差距 = d,这个d就是建校对房价的影响了。d是两个差距之间的差距,所以才叫做差分再差分。用计量回归把这个d给估计出来,是有办法的:
P= b0 + b1*Da +b2*Dt + d*(Da*Dt) + Xb + e
P是房价,Da是虚拟变量,在区域A则为1,否则为0, Dt是时间虚拟变量,建校后为1,建校前为0。 STATA一跑,就把d估计出来了。为什么d可以如此表示?自己思考一下啦。实在想不出来,Wooldridge的书上有精确严格的解释。这里给出一个直观的粗略解释:北京所有区域的房价每个月都在上升,因此需要控制这部分因素,这就是时间因素Dt;区域不同自然也有差别,需要控制区域位置因素,这就是Da,这就控制了即使不建校也存在的差距;控制住其他因素X,那么剩下的Da*Dt就是建校带来的房价提升效应了。这下明白了哦。”
当然,如果你想看到更学术化的探讨,可以参考2015年第7期《数量经济技术经济研究》所刊文章《国内双重差分法的研究现状与潜在问题》。
3.工具变量法
这是一种处理内生性问题的经典方法,或者说被滥用最严重的方法。
这种方法相信大家都已经学过,就是找到一个变量和内生解释变量相关,但是和随机扰动项不相关。在OLS的框架下同时有多个工具变量(IV),这些工具变量被称为two stage least squares (2SLS) estimator。具体的说,这种方法是找到影响内生变量的外生变量,连同其他已有的外生变量一起回归,得到内生变量的估计值,以此作为IV,放到原来的回归方程中进行回归。
工具变量法最大的问题是满足研究条件的工具变量难以找到,而不合乎条件的工具变量只能带来更严重的估计问题。
当然,我确实见过非常精巧的工具变量,譬如,殖民地时代的死亡率。
4. 动态面板回归法
基本思想是将解释变量和被解释变量的滞后项作为工具变量(IV)。其实,我是不认可这种处理方法,除非万不得已,我不推荐这种方法,我也不太相信这种方法能真正缓解内生性问题。可是,确实很多人都在用。算了,不多说了。