首页 stata命令大全(全)

stata命令大全(全)

举报
开通vip

stata命令大全(全)*********面板数据计量分析与软件实现*********说明:以下do文件相当一部分内容来自于中山大学连玉君STATA教程,感谢他的贡献。本人做了一定的修改与筛选。面板数据模型1.静态面板模型:FE和RE2.模型选择:FEvsPOLS,REvsPOLS,FEvsRE(pols混合最小二乘估计)3.异方差、序列相关和截面相关检验4.动态面板模型(DID-GMM,SYS-GM)M5.面板随机前沿模型6.面板协整分析(FMOLS,DOL)S***说明:1-5均用STATAM牛实现,6用GAUS软件实现。*生产效率分...

stata命令大全(全)
*********面板数据计量分析与软件实现*********说明:以下do文件相当一部分 内容 财务内部控制制度的内容财务内部控制制度的内容人员招聘与配置的内容项目成本控制的内容消防安全演练内容 来自于中山大学连玉君STATA教程,感谢他的贡献。本人做了一定的修改与筛选。面板数据模型1.静态面板模型:FE和RE2.模型选择:FEvsPOLS,REvsPOLS,FEvsRE(pols混合最小二乘估计)3.异方差、序列相关和截面相关检验4.动态面板模型(DID-GMM,SYS-GM)M5.面板随机前沿模型6.面板协整分析(FMOLS,DOL)S***说明:1-5均用STATAM牛实现,6用GAUS软件实现。*生产效率分析(尤其指TFP):数据包络分析(DEA与随机前7&分析(SFAA***说明:DEAJ软件实现,SF岫实现,尤其后者,侧重于比较C-D与Translog生产函数,一步法与两步法的区别。常应用于地区经济差异、FDI溢出效应(SpilloversEffect)、工业行业效率状况等。*空间计量分析:SLM莫型与SEMI型说明:STATgMatlab结合使用。常应用于空间溢出效应(R&D、财政分权、地方政府公共行为等。*一、常用的数据处理与作图**添加标签或更改变量名labelvarh"人力资本"renamehhum排序sortidyear/宽>>>长数据是以STATAU板数据格式出现*/sortyearid/*是以DE醺式出现*/删除个别年份或省份dropifyear<1992dropifid==2/*注意用==*/如何得到连续year或id编号(当完成上述操作时,year或id就不连续,为形成panel格式,需要用egen命令)egenyear_new=group(year)xtsetidyear_new*保留变量或保留观测值keepinv/*删除变量*/*或keepifyear==2000*排序sortidyear/*是以STATAU板数据格式出现sortyearid/*是以DE醺式出现*长数据和宽数据的转换长>>>宽数据reshapewidelogy,i(id)j(year)reshapelogy,i(id)j(year)追加数据(用于面板数据和时间序列)xtsetidyear或者xtdestsappend,add(5)/表示在每个省份再追加5年,用于面板数据/tsset或者tsdes.tsappend,add(8)/表示追加8年,用于时间序列/方差分解,比如三个变量Y,X,Z都是面板格式的数据,且满足Y=X+Z,求方差var(Y),协方差Cov(X,Y)和Cov(Z,Y)bysortyear:corrYXZ,cov生产虚拟变量生成年份虚拟变量tabyear,gen(yr)生成省份虚拟变量tabid,gen(dum)生成滞后项和差分项xtsetidyeargenylag=/求出各省2000年以前的openinv的平均增长率产生一阶滞后项),同样可产生二阶滞后项*/genylag2=gendy=/*产生差分项*/collapse(mean)openinvifyear<2000,by(id)变量排序,当变量太多,按规律排列。可用命令aorder或者orderfdiopeninsti二、静态面板模型简介面板数据的结构(兼具截面资料和时间序列资料的特征)use,clearbrowsextsetidyearxtdes*固定效应模型*实质上就是在传统的线性回归模型中加入N-1个虚拟变量,使得每个截面都有自己的截距项,截距项的不同反映了个体的某些不随时间改变的特征例如:lny=a_i+b1一个例子:中国29个省份的C-D生产函数的估计tabid,gen(dum)lnK+b2*lnL+e_it考虑中国29个省份的C-D生产函数******画图*散点图+线性拟合直线twoway(scatterlogyh)(lfitlogyh)散点图+二次拟合曲线twoway(scatterlogyh)(qfitlogyh)散点图+线性拟合直线+置信区间twoway(scatterlogyh)(lfitlogyh)(lfitcilogyh)按不同个体画出散点图和拟合线,可以以做出fevsre的初判断*twoway(scatterlogyhifid<4)(lfitlogyhifid<4)(lfitlogyhifid==1)(lfitlogyhifid==2)(lfitlogyhifid==3)按不同个体画散点图,sobeautiful!!!*graphtwowayscatterlogyhifid==1||scatterlogyhifid==2,msymbol(Sh)||scatterlogyhifid==3,msymbol(T)||scatterlogyhifid==4,msymbol(d)||,legend(position(11)ring(0)label(1"北京")label(2"天津")label(3"河北")label(4"山西"))*每个省份logy与h的散点图,并将各个图形合并twowayscatterlogyh,by(id)ylabel(,format(%)xlabel(,format(%)每个个体的时间趋势图*xtlinehifid<11,overlaylegend(on)list*回归分析reglogylogklogldumy_it=u_i+x_it*b+e_it(1)*ym_i=u_i+xm_i*b+em_i(2)*ym=um+xm*b+em(3)stata后台操作,揭开fe估计的神秘面纱!!!,eststoremolsxtreglogylogklogl,feeststoremfeesttablem_olsm_fe,b(%star*Wald检验testlogk=logl=0testlogk=logl*stata的估计方法解析目的:如果截面的个数非常多,那么采用虚拟变量的方式运算量过大因此,要寻求合理的方式去除掉个体效应的系数,而非每个截面的截距项组内平均样本平均处理方法:*(1)-(2),可得:*(y_it-ym_i)=(x_it-xm_i)*b+(e_it-em_i)4)/*withinestimator*/*(4)+(3),可得:*(y_it-ym_i+ym)=um+(x_it-xm_i+xm)*b+(e_it-em_i+em)*可重新表示为:Yit=a0+Xit*b+Eit对该模型执行OLS估计,即可得到b的无偏估计量个体内部平均*/egeny_meanw=mean(logy),by(id)/解读xtreg,fe的估计结果xtreglogyhinvgovopen,fe*--RA2*y_it=a_0+x_it*b_o+e_it(1)pooledOLS*y_it=u_i+x_it*b_w+e_it(2)withinestimator*ym_i=a_0+xm_i*b_b+em_i(3)betweenestimatoregeny_mean=mean(logy)/*样本平均*/egenk_meanw=mean(logk),by(id)egenk_mean=mean(logk)egenl_meanw=mean(logl),by(id)egenl_mean=mean(logl)gendyw=logy-y_meanwgendkw=logk-k_meanwgendlw=logl-l_meanwregdywdkwdlw,noconseststorem_statagendy=logy-y_meanw+y_meangendk=logk-k_meanw+k_meangendl=logl-l_meanw+l_meanregdydkdleststorem_stataesttablem_*,b(%star*-->R-sq:within模型(2)对应的R2,是一个真正意义上的R2*-->R-sq:betweencorr{xm_i*b_w,ym_i}A2*-->R-sq:overallcorr{x_it*b_w,y_it}A2*--F(4,373)=检验除常数项外其他解释变量的联合显著性*--corr(u_i,Xb)=*--sigma_u,sigma_e,rho*rho=sigma_uA2/(sigma_uA2+sigma_eA2)dise(sigma_u)八2/(e(sigma_u)八2+e(sigma_e)A2)*个体效应是否显著?*F(28,373)=H0:a1=a2=a3=a4=a29*Prob>F=表明,固定效应高度显著*---如何得到调整后的R2,即adj-R2?ereturnlistreglogyhinvgovopendum**---拟合值和残差y_it=u_i+x_it*b+e_itpredictnewvar,[option]/*xbxb,fittedvalues;thedefaultstdpcalculatestandarderrorofthefittedvaluesueu_i+e_it,thecombinedresidualxbuxb+u_i,predictionincludingeffectuu_i,thefixed-orrandom-errorcomponentee_it,theoverallerrorcomponenty_it=x_it*b+(a_i+u_it)*=x_it*b+v_it*基本思想:将随机干扰项分成两种*一种是不随时间改变的,即个体效应a_i*另一种是随时间改变的,即通常意义上的干扰项u*估计方法:FGLS*Var(v_it)=sigma_aA2+sigma_uA2*Cov(v_it,v_is)=sigma_aA2*Cov(v_it,v_js)=0*利用PooledOLS,WithinEstimator,BetweenEstimator*可以估计出sigma_aA2和sigma_uA2,进而采用GLS^FGLS*Re估计量是Fe估计量和B时计量的加权平均*yr_it=y_it-theta*ym_ixrit=xit-theta*xmi/xtreglogylogklogl,fepredicty_hatpredicta,upredictres,epredictcres,uegenares=a+reslistarescresin1/10it随机效应模型*theta=1-sigma_u/sqrt[(T时间效应、模型的筛选和常见问题目录sigma_aA2+sigma_uA2)]*解读xtreg,re的估计结果use,clearxtreglogylogklogl,re--R2-->R-sq:withincorr{(x_it-xm_i)*b_r,y_it-ym_i}A2-->R-sq:betweencorr{xm_i*b_r,ym_i}A2-->R-sq:overallcorr{x_it*b_r,y_it}A2上述R潴B不是真正意义上的R2,因为Re莫型采用的是GLS古计rho=sigma_uA2/(sigma_uA2+sigma_eA2)dise(sigma_u)A2/(e(sigma_u)A2+e(sigma_e)A2)corr(u_i,X)=0(assumed)这是随机效应模型的一个最重要,也限制该模型应用的一个重要假设然而,采用固定效应模型,我们可以粗略估计出corr(u_i,X)xtregmarketinveststock,feWaldchi2(2)=Prob>chi2=7.2.1时间效应(双向固定(随机)效应模型)7.2.2模型的筛选7.2.3面板数据常见问题7.2.4面板数据的转换*时间效应*单向固定效应模型y_it=u_i+x_it固定效应模型还是PooledOLS?xtreglogylogkloglyr*,fe/*Waldquitabid,gen(dum)/*LRreglogylogklogl/*POLS*/eststorem_olsreglogylogklogldum*,noconsb+e_it双向固定效应模型y_it=u_i+f_t+x_it*b+e_itquitabyear,gen(yr)dropyr1xtreglogylogkloglyr*,fe随机效应模型中的时间效应xtreglogylogkloglyr*,fe**模型的筛选检验*/检验*/*eststorem_felrtestm_olsm_feesttablem_*,b(%starREvsPooledOLS?H0:Var(u)=0*方法一:B-P检验xtreglogylogklogl,rexttest0FEvsRE?y_it=u_i+x_it*b+e_it---Hausman检验---基本思想:如果Corr(u_i,x_it)=0,Fe和Re都是一致的,但RefE有效如果Corr(u_i,x_it)!=0,Fe仍然有效,但Re>有偏的基本步骤***情形1:huasman为正数xtreglogylogklogl,feeststorem_fextreglogylogklogl,reeststorem_rehausmanm_fem_re情形2:quixtreglogyhinvgovopen,feeststorefequixtreglogyhinvgovopen,reeststorerehausmanfereHausman检验值为负怎么办?通常是因为RE莫型的基本假设Corr(x,u_i)=0无法得到满足*检验过程中两个模型的方差-协方差矩阵都采用Fe模型的hausmanfere,sigmaless*两个模型的方差-协方差矩阵都采用Re模型的hausmanfere,sigmamore==为何有些变量会被drop掉?use,cleartssetidcodeyearxtregln_wagehourstenurettl_exp,fe/*正常执行*/产生种族虚拟变量tabrace,gen(dum_race)xtregln_wagehourstenurettl_expdum_race2dum_race3,fe为何dum_race2和dum_race3会被dropped?固定效应模型的设定:y_it=u_i+x_it*b+e_it(1)由于个体效应u_i不随时间改变,因此若x_it包含了任何不随时间改变的变量,都会与u_i构成多重共线性,Stata会自动删除之。******异方差、序列相关和截面相关问题简介y_it=x_it*b+u_i+e_it*由于面板数据同时兼顾了截面数据和时间序列的特征,所以异方差和序列相关必然会存在于面板数据中;同时,由于面板数据中每个截面(公司、个人、国家、地区)之间还可能存在内在的联系,所以,截面相关性也是一个需要考虑的问题。*此前的分析依赖三个假设条件:(1)Var[e_it]=sigma”同方差假设(2)Corr[e_it,e_it-s]=0序列无关假设(3)Corr[e_it,e_jt]=0截面不相关假设*当这三个假设无法得到满足时,便分别出现异方差、序列相关和截面相关问题;我们一方面要采用各种方法来检验这些假设是否得到了满足;另一方面,也要在这些假设无法满足时寻求合理的估计方法。假设检验==组间异方差检验(截面数据的特征)Var(e_i)=sigma_iA2Fe模型xtreglogylogklogl,fexttest3Re模型Re本身已经较大程度的考虑了异方差问题,主要体现在sigma_uA2上==序列相关检验Fe模型*xtserialWooldridge(2002),若无序列相关,则一阶差分后残差相关系数应为xtseriallogylogkloglxtseriallogylogklogl,output*Re模型xtreglogylogklogl,rexttest1/*提供多个统计检验量*/*截面相关检验*xttest2命令H0:所有截面残差的相关系数都相等xtreglogylogklogl,fexttest2由于检验过程中执行了SUE古计,所以要求T>Nxtreglogylogkloglifid<6,fexttest2*xtcsd命令(提供了三种检验方法)xtreglogylogklogl,fextcsd,pesaran/估计方法Pesaran(2004)*/xtcsd,friedman/*Friedman(1937)*/xtreglogylogklogl,rextcsd,pesaran*异方差稳健型估计xtreglogyhinvgovopen,ferobusteststoreferbxtreglogyhinvgovopen,ferobusteststorefe*结果对比esttabfe_rbfe,b(%se(%mtitle(fe_rbfe)*序列相关估计一阶自相关xtregar,fe/re模型:y_it=u_i+x_it结果对比xtreglogyhinvgovopen,feeststorefeb+v_it(1)vit=rho*vit-1+zit(2)*(1)*(2)*(3)Baltagi-WuLBI=基本上没有太大的参考价值,xtregarlogyhinvgovopen,feeststorefear1xtregarlogyhinvgovopen,felbi/*Baltagi-WuLBItest*/说明:这里的Durbin-Watson=具有较为复杂的分布,不同于时间序列中的D-惭计量o其临界值见Bhargavaetal.(1982,TheReviewofEconomicStudies49:553-549)因为他们并未提供临界值表,而该统计量的分布又相当复杂xtregarlogyhinvgovopen,reeststorerear1*两阶段估计xtregarlogyhinvgovopen,fetwostepeststorefear1twolocalmodels"fefear1rear1fear1two"esttab'models',b(%se(%mtitle('models')r2sca(r2_wcorr)*高阶自相关*newey2命令newey2logyhinvgovopen,lag(2)*组间相关(截面相关)*cluster选项use,clearxtreglogyhinvgovopen,fecluster(id)eststorefeclusterxtreglogyhinvgovopen,recluster(id)eststorerecluster************看过去很晕,采用一种综合处理:xtgls命令xtpcse命令简介(Greene,2000,chp15)模型y=X应用范围:多用于“大T,小N'型面板数据,因为,此时截面的异质性并不是重点关注的,而时序特征则较为明显因此,模型设定中未考虑个体效果b+U重点在于考虑干扰项U的结构,包括(1)异方差(2)序列相关(3)截面相关性TOC\o"1-5"\h\z|y_1||X_1||e_1||y_2||X_2||e_2||.||.||.||.|=|.|*b+|.||.||.||.||y_n||X_n||e_n|截面异方差E[e_i*e_i']=s_iA2|sW20...0|0s2A2...00...snA2|截面相关E[e_i*e_i']=s_ijA2|s_11s_12...s_1n||s_21s_22...s_2n||s_n1s_n2...s_nn|序列相关E[e_i*e_i']=s_i八2*M_i|s1A2*M_100s2A2*M2...00...snA2*M*GLS估计=[X'VA{-1}*X]A{-1}[X'VA{-1}y]Var[b]=[X'VA{-1}*X]A{-1}估计和检验*===xtgls命令use,clearxtglsmarketinveststock,panels(iid)/*iid,等同于PooledOLS*/eststoreg_0regmarketinveststockeststoreg_olsxtglsmarketinveststock,panel(het)/*截面异方差*/eststoreg_phetxtglsmarketinveststock,corr(ar1)/*所有截面具有相同的自相关系数*/eststoreg_par1xtglsmarketinveststock,corr(psar1)/*每个截面有自己的自相关系数*/eststoreg_psar1截面间相关且异方差*/xtglsmarketinveststock,panel(corr)/*eststoreg_pcorrxtglsmarketinveststock,p(c)corr(ar1)eststoreg_all检验异方差xtglsmarketinveststock,panel(het)/*截面异方差*/xttest3检验序列相关xtserialmarketinveststock检验截面相关xtglsmarketinveststock,panel(het)xttest2结果对比xtregmarketinveststock,feeststorefelocalmodels"feg_0g_ols"esttab'models',b(%se(%mtitle('models')r2sca(r2_w)localmodels"feg_phetg_par1g_psar1g_pcorrg_all"esttab'models',b(%se(%mtitle('models')r2sca(r2_w)compress说明:为何xtgls不汇报R2?因为此时的R以必介于0和1之间,不具有传统线性回归模型中R2的含义*===xtpcse命令默认假设:存在截面异方差和截面相关估计方法:OLS或Prais-Winsten回归有别于xtgls(采用FGLS古计)更适于方块面板N不大(10-20),T不大(10-40)与xtgls的区别:估计方法不同xtgls采用GLS®行估at,而xtpsce采用OLSuse,clearxtpcseinvestmarketstock*/eststorepcse_full/当Nt大时,采用该方法会非常费时,*因为方差协方差矩阵是采用OLS古计的残差计算的use,clearxtdesxtpcsetlsizendtstangtobinnpr/*大约5-8分钟*/eststorextpcsextregtlsizendtstangtobinnpr,feOLS估计,调整异方差和截面相关后的标准误xtglsinvestmarketstock,panels(correlated)eststorem_xtgls/*FGLS估计,异方差和截面相关*/xtpcseinvestmarketstock,correlation(ar1)eststorepcse_ar1/*Prais_Winsten估计,共同的自相关系数*/xtpcseinvestmarketstock,correlation(ar1)hetonlyeststorepcse_ar1/*不考虑截面相关*/结果对比xtreginvestmarketstock,feeststorefelocalmodels"fepcse_fullm_xtglspcse_ar1pcse_ar1"esttab'models',b(%se(%mtitle('models')r2sca(r2_w)xtpcse的结果与xtgls非常相似,但前者可以汇报R2eststorefe*结果对比localmodels"fextpcse"esttab'models',b(%se(%mtitle('models')r2sca(r2_w)*系数估计值有较大差别,但符号和显著性是一致的。***动态面板模型PartI动态面板模型简介一阶差分IV估计量(AndersonandHisao,1982)一阶差分GMMr计量(ArellanoandBond,1991)系统GMMr计量(AB,1995;BB,1998)简介==模型:y[it]=a0*y[it-1]+a1*x[it]+a2*w[it]+u_i+e[it]特征:解释变量中包含了被解释变量的一阶滞后项可以是非平行面板,但要保证时间连续x[it]w[it]严格外生变量E[x_it,e_is]=0foralltands即,所有干扰项与x都不相关先决变量E[w_it,e_is]!=0fors=t即,前期干扰项与当期X相关,但当期和未来期干扰项与x不相关。y[it-1]内生变量E[x_it,e_is]!=0fors<=t即,前期和当期,尤其是当期干扰项与x相关u_i随机效应,在截面间是iid的。u_i与e[it]独立。**内生性问题:*(1)若假设u_i为随机效应,则Corr(y[i,t-1],u_i)!=0*(2)若假设u_i为个体效应,需要想办法去除之,因为数据为“大N/J、T"一阶差分:[i,t-1]=y[i,t-1]-y[i,t-2][i,t]=e[i,t]-e[i,t-1]显然:Corr[i,t-1],[i,t])!=0,差分方程存在内生问题;组内去心:ym[i,t-1]=y[i,t-1]-1/(T-1)基本思想:采用一阶差分去除个体效应u_i,(y[i,t-1]+…+y[i,T])em[i,t]=e[i,t]-1/T*(e[i,t]+e[i,t-1]+…+e[i,T])仍然存在内生性问题显然:Corr(ym[i,t-1],em[i,t])!=0,*处理办法:IV估计或GMM•计,选择合适的工具变量*矩条件:E[e_it,z_it]=0*========================================*=========一阶差分IV估计量============的滞后二阶作为[it-1]的工具变量同时,[it-2]也可以作为[it-1]的工具变量:AndersonandHisao(1982)*========================================use,cleardes/适用范围:大N,小T随后,我们会介绍“小n大r’型动态面板的估计方法变量的定义*/tssetidyear模型:nit=b1*nit-1+b2*nit-2+b3*wit+b4*wit-1+b5*kit+b6*kit-1+b7*kit-2+b8*ys_it+b9*ys_it-1+b10*ys_it-2xtivregnwkysyr1981-yr1984L(0/2).(kys)yr1981-yr1984=,fd一阶差分GMM•计量:AB91(1982)提出GMMArellanoandBond(1991)模型:y[it]=a0*y[it-1]+a1*x[it]+a2*w[it]+u_i+v[it]假设条件:干扰项v[it]不存笈序列相关;*基本思想:在AndersonandHisao(1982)基础上增加了更多可用的工具变量t=3处,y_i1可以作为所有滞后项的工具变量t=4处,y_i1,y_i2可以作为所有滞后项的工具变量[it]=a1K=3为例,则Z_i的列数为(1+2+3+4+5)+3=18设定工具变量的基本原则:对-内生-变量的处理:与上述方法类似,[it-1]+a2*[it]+[it]X_it=[x_it,w_it]因此,所有工具变量构成的矩阵如下:|y_i100000...0...0|0y_i1y_i2000...0...0|000y_i1y_i2y_i3...0...0Z_i=|000...y_i1...yiT-2Zi的行数为T-2Zi的列数为sum_(m=1F(T-2){m}+K,K为X的列数以T=7即滞后两阶以上的水平变量均可作为差分方程的工具变量对-先决-变量的处理:滞后一阶以上的水平变量均可作为工具变量(GMMtype)(GMMtype)对-外生-变量的处理:自己作为自己的工具变量(StandardIV)==例1:一阶差分估计量的基本设定解释变量仅包含y_it的一阶滞后项,默认设定干扰项同方差,一阶段估计use,clearxtabondnL(0/1).wL(0/2).(kys)yr1980-yr1984eststoreab_0*-结果释疑**-1-工具变量的个数是如何确定的?(xtdpd,*外生变量的工具变量等于外生变量的个数共13个L(0/1).wL(0/2).(kys)yr1980-yr1984内生变量的工具变量:共27个*listidyearnifid==140**差分方程的可用工具变量**yearofYearsofNumberof*differenceequationinstrumentsinstruments*197819761*19791976-19772*19801976-19783*19811976-19794*19821976-19805*19831976-19816*19841976-1982728-2-GMM-type和Standard两种类型的工具变量有何差异?(xtabond,*GMM-type是针对内生变量或先决变量而言的工具变量,有多列Standard是针对外生变量而言的工具变量,只有一列-过度识别检验(工具变量的使用是否合理)*estatsargan*说明:H0:overidentifyingrestrictionsarevalid这里,我们拒绝了原假设,但AB91指出,当干扰项存在异方差时,Sargan检验倾向于过度拒绝原假设,因此此处得到的结论并不可信。采用两阶段估计,然后再执行Sargan检验较为稳妥:*xtabondnL(0/1).wL(0/2).(kys)yr1980-yr1984,twostepestatsargan*说明:不过,AB91发现,若存在异方差,在两阶段估计后执行Sargan检验往往倾向于Underreject问题,即过度接受原假设。通常而言,这很可能是我们的模型设定不当,或是工具变量的选择不合理。-干扰项序列相关检验*AB91一阶差分估计量要求原始模型的干扰项不存在序列相关,显然,差分后的干扰项必然存在一阶序列相关,因此,我们需要检验差分方程的残差是否存在二阶(或更高阶)序列相关即可*默认,二阶序列相关检验xtabondnL(0/1).wL(0/2).(kys)yr1980-yr1984,vce(robust)estatabond说明:若存在二阶相关,则意味着选取的工具变量不合理高阶序列相关检验xtabondnL(0/1).wL(0/2).(kys)yr1980-yr1984,vce(robust)artest(3)estatabond*==稳健型估计xtabondnL(0/1).wL(0/2).(kys)yr1980-yr1984,lags(2)robusteststoreab4_one_rb*此时,无法Sargan统计量estatsargan*==两阶段估计AB91(Tab4(a2))考虑异方差问题利用第一阶段估计得到的残差构造方差-协方差矩阵,进而重新估计模型*xtabondnL(0/1).wL(0/2).(kys)yr1980-yr1984,lags(2)twostepeststoreab4_twostep此时,Sargan检验无法拒绝原假设*estatsarganAB91重要建议:(1)采用一阶段估计结果进行系数显著性的统计推断;*(2)采用两阶段估计给出的Sargan统计量进行模型筛选进一步的讨论:虽然AB91建议不要采用两阶段(非稳健)估计进行统计推断,但Windmeijer(2005,JournalofEconometrics)通过模拟分析表明,采用纠偏(bias-corrected,WC)后的稳健性VCE,可以更好地进行统计推断xtabondnL(0/1).wL(0/2).(kys)yr1980-yr1984,lags(2)twostepvce(robust)eststoreab_wc_rb结果对比localmm"ab4_one_rbab4_twostepab_wc_rb"esttab'mm',mtitle('mm')*结论:AB91_onestep_rb的结果与AB91_WC_rb的参数估计相同,后者标准误较大建议采用Windmeijer(2005)两阶段-纠偏-稳健型估计量。*==先决变量的设定由于当期干扰项显然会影响后续w和k,所以把它们设定为先决变量更为合理注意:此时逗号前就不能再出现这两个变量了xtabondnL(0/1).ysyr1980-yr1984,lags(2)twostepsyr1980-yr1984,lags(2)twostep*解释:*pre(w,lag(1,3))*lag(1,3)中的1表示也会作为解释变量,*lag(1,3)中的3表示和可以作为的工具变量,但不可以;pre(k,lag(2,.))lag(2,.)中的2表示,都会作为解释变量;lag(2,.)中的.表示,...都可以作为的工具变量*说明:上述设定都可附加-vce(robust)-选项以便获得稳健型标准误。*==工具变量过多导致的问题过多的工具变量往往导致过度约束假设无法满足估计结果的有效性降低,因为部分工具变量与内生或先决变量的相关性很弱对矩阵尺寸的要求增加解决办法:限制最大的滞后阶数xtabondnL(0/1).ysyr1980-yr1984,lags(2)twostep.差分GMMr计量与系统GM帏计量的区别(1)(2)(3)差分GMM•计量采用水平值的滞后项作为差分变量的工具变量;如y_it-3是的工具变量都可以作为[i,t-1]的工具变量系统GMM•计量进一步采用差分变量的滞后项作为水平值的工具变量;相当于进一步增加了可用的工具变量,且估计过程中同时使用水平方程和差分方程主要原因在于差分GMMJ工具变量往往是弱工具变量,即corr(X,Z)过低*---xtabond2命令---Roodman(2005)既可以估计差分GMM估计量,也可以估计系统GMM估计量;同时可以估计一般化的回归模型提供两阶自相关检验,Sargan检验,Hansen检验,以及工具变量外生性检验*---xtdpdsys命令---Stata官方命令,以xtabond2命令为基础xtabond2命令*===一阶差分估计量部分解释变量内生适用于Stata8-10各个版本既可以完成-一阶差分gmMt计-也可以完成-系统GM岫计-详细参考资料:Roodman,D.2006.HowtoDoxtabond2:AnIntroductionto"Difference"and"System"GMMinStata.WorkingPaper103.CenterforGlobalDevelopment,Washington.==使用xtabond2命令得到-一阶差分估计量--附加-noleveleq-选项即可采用xtabond2估计AB91文中表4的结果ArellanoandBond(1991),Table4Column(a1)useabdata,clearxtabond2nL(1/2).nL(0/1).wL(0/2).(kys)yr1980-yr1984,l(0/2).(kys)yr1980-yr1984)L(0/2).(kys)yr1980-yr1984,lags(2)eststoreaba1_abesttababa1_ab2aba1_ab,mtitle(aba1_ab2aba1_ab)Column(a2)两阶段估计xtabond2nL(0/1).wL(0/2).(kys)L(1/2).nyr1980-yr1984,l(0/2).(kys)yr1980-yr1984)L(0/2).(kys)yr1980-yr1984,lags(2)twostepeststoreaba2_abesttababa2_ab2aba2_ab,mtitle(aba2_ab2aba2_ab)一阶段估计xtabond2nL(0/1).(wk)yr1980-yr1984,wkn))iv(yr1980-yr1984)wk)yr1980-yr1984,wkn))iv(yr1980-yr1984)wk)yr1978-yr1984,wk)yr1978-yr1984)restrictions:chi2(34)34=47-13(13是外生变量的个数,包含常数项)可见,无论采用Sargan检验还是HansenJ检验,都拒绝了工具变量合理的原假设指定工具变量应用于水平方程还是差分方程例如,假设w,k,以及年度虚拟变量都是外生的(当然,这一假设可能并不合理)*xtabond2nL(0/1).(wk)yr1978-yr1984,gmmwk)yr1978-yr1984,eq(level))wk)yr1978-yr1984,wkn))iv(yr1978-yr1984,eq(level))wk)yr1978-yr1984,wkn))iv(yr1978-yr1984,eq(both))obinL(0/1).npryr序列相关检验estatabond*过度识别检验estatsargan/*稳健型估计下无法获得Sargan统计量*/*正确方法localxx"sizetangndtsL(0/1).tobinL(0/1).npryr*"xtdpdsystl'xx',twostepestatsargan"xtdpdsystl'xx',vce(robust)twostepdisln(2)/(1-_b[])/*调整半周期*/eststoredycs_2sys设定说明:(1)无需设定,因为xtdpdsys默认设定被解释变量的滞后一期为解释变量,而且该变量被自动设定为内生变量;(2)稳健型估计采用vce(robust)选项加以设定;(3)该命令不会自动进行AR(2)序列相关检验和Sargan过度识别检验*CaseIITobin和npr为先决变量localxx"sizetangndtsyr结论:"/*此处不应再包含tobin和npr*/xtdpdsystl'xx',pre(tobinnpr,lag(1,.))twostepeststoredycs_2preestatabondestatsarganCaseIII:假设Tobin和npr为内生变量localxx"sizetangndtsyr*"/*此处不应再包含tobin和npr*/xtdpdsystl'xx',endog(tobinnpr,lag(1,.))twostepeststoredycs_2endogestatabondestatsarganCaseIV:假设除了年度虚拟变量和公司规模外,所有解释变量均为先决变量localxx"sizeyr*"xtdpdsystl'xx',pre(tobinnpr,lag(1,.))obinL(0/1).npryr*"regtl'xx',robusteststoredycs_2OLSFE估计(调整系数的下限)localxx"sizetangndtsL(0/1).tobinL(0/1).npryr*"xtregtl'xx',robustfeeststoredycs_2FE结果对比localmm"dycs_2sysdycs_2predycs_2endogdycs_2preAlldycs_2OLSdycs_2FE"localss"ar2ar2psargansar_dfsarganp"esttab'mm',mtitle('mm')scalar('ss')compress*(1)估计出的调整系数介于合理的范围内,即OL守口F三间;(2)就模型设定而言,dycs_2sys最为合理,即把所有解释变量均设定为外生变量。*调整半周期为:localxx"sizetangndtsL(0/1).tobinL(0/1).npryr*"xtdpdsystl'xx',vce(robust)twostepdisln(2)/(1-_b[])/*调整半周期*/xtabond2logyhinvgovopenfdiyr4-yr14,///gmmh)iv(govopenfdiyr4-yr14)robusttwostep*指定面板格式xtsetidyear(id为截面名称,year为时间名称)xtdes/*数据特征*/xtsumlogyh/*数据统计特征*/sumlogyh/*数据统计特征*/
本文档为【stata命令大全(全)】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: ¥22.0 已有0 人下载
最新资料
资料动态
专题动态
个人认证用户
captmumuma
精通药剂学
格式:doc
大小:58KB
软件:Word
页数:35
分类:
上传时间:2022-01-20
浏览量:27