伍德里奇《计量经济学导论》(第4版)笔记和课后习题详解(2-8章)

伍德里奇《计量经济学导论》(第4版)笔记和课后习题详解(2-8章)使用普通最小二乘法，此时最小化的残差平方和为211niiiyx利用一元微积分可以证明，1必须满足一阶条件110niiiixyx从而解出1为：1121niiiniixyx当且仅当0x时，这两个估计值才是相同的。2.2课后习题详解一、习题1．在简单线性回归模型01yxu中，假定0Eu。令0Eu，证明：这个模型总可以改写为另一种形式：斜率与原来相同，但截距和误差有所不同，并且新的误差期望值为零。证明：在方程右边加上0Eu，则0010yxu...

使用普通最小二乘法，此时最小化的残差平方和为211niiiyx利用一元微积分可以证明，1必须满足一阶条件110niiiixyx从而解出1为：1121niiiniixyx当且仅当0x时，这两个估计值才是相同的。2.2课后习题详解一、习题1．在简单线性回归模型01yxu中，假定0Eu。令0Eu，证明：这个模型总可以改写为另一种形式：斜率与原来相同，但截距和误差有所不同，并且新的误差期望值为零。证明：在方程右边加上0Eu，则0010yxu令新的误差项为0eu，因此0Ee。新的截距项为00，斜率不变为1。2．下表包含了8个学生的ACT分数和GPA（平均成绩）。平均成绩以四分制计算，且保留一位小数。studentGPAACT12.82123.42433.02643.52753.62963.02572.72583.730（Ⅰ）利用OLS估计GPA和ACT的关系；也就是说，求出如下方程中的截距和斜率估计值01ˆˆGPAACT＾评价这个关系的方向。这里的截距有没有一个有用的解释？请说明。如果ACT分数提高5分，预期GPA会提高多少？（Ⅱ）计算每次观测的拟合值和残差，并验证残差和（近似）为零。（Ⅲ）当20ACT时，GPA的预测值为多少？（Ⅳ）对这8个学生来说，GPA的变异中，有多少能由ACT解释？试说明。答：（Ⅰ）变量的均值为：3.2125GPA，25.875ACT。15.8125niiiGPAGPAACTACT根据公式 2.19可得：1ˆ5.8125/56.8750.1022。根据公式2.17可知：0ˆ3.21250.102225.8750.5681。因此0.56810.1022GPAACT＾。此处截距没有一个很好的解释，因为对样本而言，ACT并不接近0。如果ACT分数提高5分，预期GPA会提高0.1022×5=0.511。（Ⅱ）每次观测的拟合值和残差表如表2-3所示：表2-3iGPAGPA＾uˆ12.82.71430.085723.43.02090.379133.03.2253-0.225343.53.32750.172553.63.53190.068163.03.1231-0.123172.73.1231-0.423183.73.63410.0659根据表可知，残差和为-0.002，忽略固有的舍入误差，残差和近似为零。（Ⅲ）当20ACT，则0.56810.1022202.61GPA＾。（Ⅳ）残差平方和为：21ˆ0.4347niiu，而211.0288niiyy，则判定系数为：21SSR/SST10.4377/1.02880.577RGPA的变异中，有57.7%能由ACT解释。3．令kids表示一名妇女生过的孩子数目，educ表示该妇女接受过教育的年数。生育率对受教育年数的简单回归模型为01kidseducu其中，u是无法观测到的误差。（Ⅰ）u中包含什么样的因素？它们可能与受教育程度相关吗？（Ⅱ）简单回归分析能够揭示教育对生育率在其他条件不变下的影响吗？请解释。答：（Ⅰ）收入、年龄和家庭背景（如兄弟姐妹的数量）都可能包含在误差项中。它们可能是与受教育程度相关的：收入和受教育程度是呈正相关的；年龄与受教育程度是呈负相关的；兄弟姐妹的数量与受教育程度是负相关的。（Ⅱ）假定（Ⅰ）中所列举的因素固定不变，即以误差项的形式呈现在回归方程中，但是误差项与解释变量是相关的，因此0Eueduc，经典假定被推翻，因此简单回归分析不能解释教育对生育率在其他条件不变下的影响。4．假设你对估计花在SAT备考课程上的小时数（hours）对SAT总分（sat）的影响感兴趣。总体是某一年内所有计划上大学的中学高年级学生。（Ⅰ）假设你有权进行一项控制实验。请说明为了估计hours对sat的引致效应，你将如何构建实验。（Ⅱ）考虑一个更加实际的情形，即由学生选择在备考课程上花多少时间，而你只能随机地从总体中抽出sat和hours的样本。将总体模型写作如下形式：01sathoursu其中，与通常带截距的模型一样，我们可以假设0Eu。列举出至少两个u中包含的因素。这些因素与hours可能呈正相关还是负相关？（Ⅲ）在（Ⅱ）的方程中，如果备考课程有效，那么1的符号应该是什么？（Ⅳ）在（Ⅱ）的方程中，0该如何解释？答：（Ⅰ）构建实验时，首先随机分配准备课程的小时数，以保证准备课程的时间与其他影响SAT的因素是独立的。然后收集实验中每个学生SAT的数据，建立样本1，：，，iisathourin，n表示试验中所包括的学生的数量。根据方程2.7，应该尝试采用尽可能多的有差异的“小时数”。（Ⅱ）误差项还可能包含以下三个因素：天赋能力、家庭收入以及考试当天的健康状况。如果学生拥有天赋能力，那么他们不需要为考试花费太多时间，能力与时间是负相关的。家庭收入与学习时间呈正相关关系，因为家庭收入越高，就能负担去越多的课时费用。排除慢性的健康问题，考试当天的健康状况与为准备考试花费的时间是无关的。（Ⅲ）如果备考课程有效，1的符号应该为正，在其他因素相同的情况下，备考时间越多，sat越高。（Ⅳ）截距有一个有用的解释：因为0EU，0表示备考时间为0时学生获得的平均sat总分。5．考虑储蓄函数01savincu，uince其中，e是一个随机变量，且有0Ee和2Varee，假设e独立于inc。（Ⅰ）证明：若|0Euinc，则满足零条件均值的关键假设（假定SLR.4）。[提示：若e独立于inc，则|EuincEe]（Ⅱ）证明：若2Var|euincinc，则不满足同方差假定SLR.5。特别地，sav的方差随着inc而增加。[提示：若e和inc独立，则Var|Vareince。]（Ⅲ）讨论支持储蓄方差随着家庭收入递增的证据。证明：（Ⅰ）计算inc的条件期望值时，inc变为一个常数，因此|0EuincEinceincincEeinc。（Ⅱ）inc的方差为：22Var|VarVareuincinceincinceincinc。（Ⅲ）低收入家庭支出的灵活性较低，因为低收入家庭必须首先支付衣食住行等必需品。而高收入家庭具有较高的灵活性，部分选择更多的消费，而另一部分家庭选择更多的储蓄。这种较高的灵活性暗示高收入家庭中储蓄的变动幅度更大。6．令0ˆ和1ˆ分别为OLS截距和斜率估计量，并令u为误差（不是残差）的样本均值。（Ⅰ）证明：1ˆ可写成111ˆniiiwu，其中/SSTiiiwd和iidxx。（Ⅱ）利用（Ⅰ）及10niiw，证明：1ˆ和u无关。[提示：要求你证明11ˆ0Eu]（Ⅲ）证明0ˆ可写成0011ˆˆux。（Ⅳ）利用（Ⅱ）和（Ⅲ）证明：2220ˆVarSSTxnx／／。（Ⅴ）（Ⅳ）中的表达式能简化成方程（2.58）吗？[提示：2121SST/nxiinnxx。]证明：（Ⅰ）该理论推导与公式2.52的推导本质上是一样的，区别只是将/SSTiiiwd带到求和的里面。（Ⅱ）因为111ˆˆcovuEu，，公式右边等于0。从（Ⅰ）可知，1111ˆnniiiiiiEuEwuwEuu。因为误差项两两互不相关，则0ihEuu，ih，22//iiEuuEunn。因此22111//0nnniiiiiiiwEuuwnnw。（Ⅲ）最小二乘估计的截距公式为：0ˆˆyx，代入01yxu，则0011011ˆˆˆxuxux。（Ⅳ）因为1ˆ和u是不相关的，则有：222222201xˆˆVarVarVar//SST//SSTxuxnxnx（Ⅴ）能。根据2121SST/nxiinnxx，则2202122221211ˆVarSST//SST/SST/SSTxxnniixiixnxnxxxnx7．利用KielandMcClain（1995）有关1988年马萨诸塞州安德沃市的房屋出售数据，如下方程给出了房屋价格（price）和距离一个新修垃圾焚化炉的距离（dist）之间的关系：2log9.400.312log1350.162pricedistnR＾，（Ⅰ）解释logdist的系数。它的符号是你所预期的吗？（Ⅱ）你认为简单回归给出了price对dist在其他条件不变下弹性的无偏估计量吗？（考虑一个城市决定放置焚化炉的地点的决策。）（Ⅲ）还有哪些其他因素影响房屋的售价？这些因素会与距离焚化炉的远近相关吗？答：（Ⅰ）符号为正，与预期相符。logdist的系数表示距离焚化炉的距离越远，价格就越高，价格的距离弹性是0.312，即距离远1%，价格上升0.312%。（Ⅱ）如果城市决定将焚化炉放置在远离较贵的居民区的地方，则logdist与房价是正相关的。这将违背假定4，而OLS估计是有偏的。（Ⅲ）房屋的面积、洗手间的数量、占地面积大小、房龄社区质量（包括学校质量）都会影响房屋的售价。这些与距离焚化炉的远近是有关的。8．（Ⅰ）令0ˆ和1ˆ为iy对ix进行回归的截距和斜率（有n次观测）；1c和2c为常数且20c；0和1为1icy对2icx进行回归的截距和斜率。证明120ˆˆ/cc１且010ˆˆc，从而验证了2.4节中关于度量单位的命题。[提示：为得到1，把改变了度量单位的x和y代入方程（2.19）。然后用方程（2.17）求0，确定代入的是进行度量单位变换后的x和y以及正确的斜率。（Ⅱ）现在令0和1得自（1icy）对（2icx）的回归（对1c和2c不加任何限制）。证明：11ˆˆ且00121ˆˆˆcc。（Ⅲ）令0ˆ和1ˆ为logiy对ix回归的OLS估计值，其中我们必须假定对所有i，都有0iy。对10c，令0和1为1logicy对ix回归的截距和斜率．证明：11ˆˆ且010ˆˆlogc。（Ⅳ）现在假定对所有i，都有0x。令0和1为iy对2logicx回归的截距和斜率。1和1与iy对logix回归的截距和斜率相比如何？答：（Ⅰ）因为11cycy，2xcxcx，当为1icy对2icx进行回归时，可以通过方程2.19得到方程的斜率：2211121112222221111112221ˆˆ=nniiiiiinniiiiniiiniicxcxcycyccxxyycxcxcxxxxyyccccxx根据公式2.17可得截距项为：0112112121110ˆˆˆˆˆ/cycxcycccxcyxc（Ⅱ）使用与（Ⅰ）相同的方法，可得11cycy，22cxcx。因此1111iiicycycycyyy，22iicxcxxx。在（1icy）对（2icx）的回归中，1c和2c被完全排除在斜率公式以外，以及11ˆˆ。截距为：011211211210121ˆˆˆˆˆˆˆcycxcycxyxcccc。（Ⅲ）因为11logloglogiicycy，令1c代替1logc，iy代替logiy，且20c，然后采用与（Ⅱ）相同的方法。（Ⅳ）采用与（Ⅱ）相同的方法，设10c，2c替代2logc，ix替代logix，如果0ˆ和1ˆ是原截距和斜率，那么此时的截距和斜率为：0021ˆˆˆlogc和11ˆˆ。9．在线性消费函数01ˆˆconsinc＾中，收入的（估计）边际消费倾向（MPC）无非就是斜率1ˆ，而平均消费倾向（APC）为01ˆˆ//consincinc＾。利用对100个家庭的年收入和消费观测（均以美元计），便得到如下方程：2124.840.8531000.692consincnR＾，（Ⅰ）解释这个方程中的截距，并评价它的符号和大小。（Ⅱ）当家庭收入为30000美元时，预计消费为多少？（Ⅲ）以inc为横轴，画出估计的MPC和APC图。答：（Ⅰ）截距表示当0inc，cons预计将为-124.84美元。但这与事实不符，反映出消费函数在预测方面（尤其是收入处于较低的水平上时）是薄弱的。从年同比角度而言，124.84美元与0美元的差距并没有那么大。（Ⅱ）将30000美元代入方程：预计消费124.840.8533000025465（美元）。（Ⅲ）MPC和APC如图2-1所示。即使截距是负的，样本中最小的APC是正的。图中从年均收入水平1000美元开始。图2-110．在高斯-马尔可夫假定SLR.1～SLR.5之下，考虑标准的简单回归模型01yxu。通常的OLS估计量0ˆ和1ˆ都是各自总体参数的无偏估计量。令1表示通过假定截距为零而得到1的估计量（见2.6节）。（Ⅰ）用1x、0和1表示1E。证明：当总体截距（0）为零时，1是1的无偏估计量。有没有其他的情况使得1也是无偏的？（Ⅱ）求1的方差。（提示：方差不依赖于0。）（Ⅲ）证明11ˆˆVarVar。[提示：对任何数据样本，221111nniixxx，除非0x，否则该式严格不等。]（Ⅳ）当我们要从1ˆ和1中做出选择时，评论偏误和方差的替代关系。答：（Ⅰ）从方程2.66可知：2111ˆnniiiiixyx将01iiiyxu代入可得：011211ˆnniiiiiixxux分子化简后可写为：201111nnniiiiiiixxxu因此220111111ˆnnnniiiiiiiiixxxux对于所有的i而言，0iEu，则：210111ˆnniiiixx上式中右边的第一项表示1的偏差。当00、0x或10niix时，1是无偏的。（Ⅱ）根据（Ⅰ）中所表示的1，可得方差为：2222211112222221111VarVarVarˆnnnniiiiiiiiiinnniiiiiixxuxxuxxx（Ⅲ）根据公式2.57，2211ˆVar/niixx，对任何数据样本，2211nniiiixxx，除非0x。因此11ˆˆVarVar。（Ⅳ）对于给定的样本而言，当x增加，1的有偏程度增加。但是当x增加时，1的变化与1ˆVar是相关的。当0较小时，1的偏差也很小。因此0、x以及样本大小n（21niix的规模）决定了在均方误差上1和1ˆ的优劣。11．数据集BWGHT.RAW包含了美国妇女生育方面的数据。我们关心的两个变量是因变量[婴儿出生体重的盎司数（bwght）]和解释变量[母亲在怀孕期间平均每天抽烟的根数（cigs）]．下面这个简单回归是用1388n个出生数据进行估计的：119.770.514bwghtcigs＾（Ⅰ）当0cigs时，预计婴儿的出生体重为多少？当20cigs（每天一包）时呢？评价其差别。（Ⅱ）这个简单回归能够得到婴儿出生体重和母亲抽烟习惯之间的因果关系吗？请解释。（Ⅲ）要预测出生体重125盎司，cigs应该为多少？（Ⅳ）样本中在怀孕期间不抽烟的妇女比例约为0.85。这有助于解释第（Ⅲ）部分中的结论吗？答：（Ⅰ）当0cigs时，预计婴儿的出生体重为119.77盎司；当20cigs时，预计婴儿的出生体重为109.49盎司，比前者下降8.6%。（Ⅱ）不能。因为还有其他因素影响婴儿的出生体重，如母亲的整体健康状况和产前护理的质量。这些因素可能与怀孕期间吸烟量是相关的。另外，咖啡因的摄入也会影响到婴儿的出生体重，这也与吸烟量相关。（Ⅲ）要预测出生体重为125盎司，那么125119.77/0.52410.18cigs。这是无意义的，它表明在一个解释变量的情况下预测出生体重会发生的后果。尽管有约700名婴儿的出生体重大于119.77盎司，但最大的预测出生体重不能超过119.77盎司。（Ⅳ）因为模型仅仅使用吸烟量来解释出生体重，因此仅有一个结果：即0cigs时的出生体重。0cigs时的预测结果必然大致位于样本数据的中间位置，因此可以预测高出生率。二、计算机习题1．401K.RAW中的数据是帕普克（Papke，1995）所分析数据的一个子集，帕普克是为了研究401（k）养老金计划的参与率和该计划的慷慨程度之间的关系。变量prate是有资格参与该计划的员工中拥有活动账户的百分比，也是我们要解释的变量。慷慨程度指标是计划的匹配率mrate。这个变量给出了员工每向这个账户存1美元，公司为该员工匹配的平均数量。例如，若0.50mrate，则员工每投入1美元，公司就匹配50美分。（Ⅰ）求出该计划的样本中平均参与率和平均匹配率。（Ⅱ）现在估计下面这个简单回归方程01ˆˆpratemrate＾报告你的结果以及样本容量和2R。（Ⅲ）解释你的方程中的截距。解释mrate的系数。（Ⅳ）当3.5mrate时，求出prate的预测值。这是一个合理的预测吗？解释这里出现的情况。（V）prate的变异中，有多少是由mrate解释的？你认为，这是一个足够大的量吗？答：（Ⅰ）平均参与率是87.63%，平均匹配率是0.732。（Ⅱ）回归方程为：283.055.8615340.075pratemratenR＾，（Ⅲ）截距表示即使0mrate，预测的参与率是83.05%。mrate的系数表明匹配率每增加1美元，则有资格参与该计划的员工中拥有活动账户的百分比（prate）增加5.86%。该结果假定prate的变动是可能的。如果prate已经达到98%，那么截距就是无意义的。（Ⅳ）3.5mrate，则83.055.8683.055.863.5103.59pratemrate＾。这不是一个合理的预测，因为参与率不超过100%。这表明因变量是有界限的，简单回归所预测的自变量的极值是不符合常理的。（V）prate的变异中，有7.5%是由mrate解释的，说明还有其他因素影响养老金计划参与率。2．数据集CEOSAL2.RAW包含了美国公司首席执行官的信息。变量salary是以千美元计的年薪，ceoten是已担任公司CEO的年数。（Ⅰ）求出样本中的平均年薪和平均任期。（Ⅱ）有多少位CEO尚处于担任CEO的第一年（就是说，0ceoten）？最长的CEO任期是多少？（Ⅲ）估计简单回归模型01logsalaryceotenu，用通常的形式报告你的结果。多担任一年CEO，预计年薪增长（近似）的百分数是多少？答：（Ⅰ）平均年薪为865.864千美元，平均任期为7.95年。（Ⅱ）有5位CEO处于担任CEO的第一年。最长的CEO任期是37年。（Ⅲ）回归方程是：2log6.510.00971770.013salaryceotennR＾，多担任一年CEO，预计年薪增长的近似百分数是0.97%（或1%）。3．利用BiddleandHamermesh（1990）中的SLEEP75.RAW数据，研究在每周用于睡眠的时间和用于有酬工作的时间之间是否存在替代关系。我们可以用它们中的任何一个作为因变量。为具体起见，估计模型01sleeptotwrku其中，sleep是每周用于晚上睡眠的分钟数，totwrk是这一周中用于工作的分钟数。（Ⅰ）用方程的形式，连同观测的次数和2R报告你的结果。该方程中的截距表示什么？（Ⅱ）若totwrk增加2小时，则sleep估计要减少多少？你觉得这是一个很大的效应吗？答：（Ⅰ）估计方程为：23586.40.1517060.103sleeptotwrknR＾，截距表示不工作的人每周用于晚上睡眠的时间为3586.4分钟。这意味着每晚睡眠的时间达到8.5小时。（Ⅱ）当120totwrk，则0.15112018.12sleep（分钟）。这并不是一个很大的效应。如果某人工作日的工作时间均增加一小时，睡眠总减少时间约为45分钟，平摊在每晚只有约6分钟。4．利用WAGE2.RAW中的数据估计一个简单回归，以便用智商（IQ）来解释月薪（wage）。（Ⅰ）求出样本中的平均工资和平均IQ。IQ的样本标准差是多少？（总体中的IQ已标准化为平均值是100，标准差是15。）（Ⅱ）估计一个简单回归模型，其中IQ提高一个单位导致wage变化相同的数量。利用这个模型计算IQ提高15个单位时，工资的预期变化。IQ能够解释大多数工资变异吗？（Ⅲ）现在再估计一个模型，其中IQ提高一个单位对工资具有相同的百分比影响。如果IQ提高15个单位，预期工资提高的百分比大约是多少？答：（Ⅰ）平均工资为957.95美元，平均IQ为101.28。IQ的样本标准差为15.05，与总体标准差非常接近。（Ⅱ）简单回归模型为：2116.998.39350.096wageIQnR＾，IQ提高15个单位导致工资变化8.3×15=124.5（美元）。IQ不能够解释大多数工资变异，薪水的变异中，仅有9.6%是由IQ解释的。（Ⅲ）回归模型为：2log5.890.00889350.099wageIQnR＾，如果IQ提高15个单位，则log0.0088150.132wage＾，因此预期工资提高的百分比大约是13.2%。5．在化工产业的企业总体中，令rd表示年研发支出，sales表示年销售额（都以百万美元计）。（Ⅰ）写一个模型（不是估计方程），其中rd和sales之间的弹性为常数。哪一个参数代表弹性？（Ⅱ）再用RDCHEM．RAW中的数据估计模型。用通常的形式写出估计方程。rd关于sales的弹性估计值是多少？用文字解释这个弹性的含义。答：（Ⅰ）不变弹性的对数-对数模型为：01loglogrdsalesu参数1代表弹性。（Ⅱ）估计方程为：2log4.1051.076log320.910rdsalesnR＾，rd关于sales的弹性估计值是1.076，说明sales每增长1%，rd将会增长1.08%。6．例2.12中曾使用了MEAP93.RAW中的数据。现在，我们想用这个文件中的数据来说明数学通过率（10math）与每个学生的平均支出（expend）之间的关系。（Ⅰ）就多花一美元对通过率的影响而言，你认为具有恒定不变的影响合适呢，还是这种影响越来越小更合适？请加以解释。（Ⅱ）在总体模型0110logmathexpendu中，证明110／表示expend提高10%导致10math改变的百分数。（Ⅲ）利用MEAP93.RAW中的数据，估计（Ⅱ）中的模型．按照通常的方式报告估计方程，包括样本容量和及2R。（Ⅳ）支出的估计影响有多大？也就是说，如果支出提高10%，估计10math会提高多少个百分点？（Ⅴ）有人担心这个回归分析可能得到10math的拟合值会超过100。为什么在这个数据集中不必担心这个问题？答：（Ⅰ）多花一美元对通过率的影响而言，这种影响越来越小更合适。在支出较小的学校，多花钱可以用于购买更多的教材、电脑以及雇用高质量的教师，但在一个高支出水平上，即已经具备了大量教材、足够好的设备和高质量的教师时，再增加支出对通过率的影响几乎没有，即使有也会很小。（Ⅱ）1110log/100%mathexpendexpend，如果%10expend，则110/10math。（Ⅲ）估计方程为：21069.3411.16log4080.0297mathexpendnR＾，（Ⅳ）支出提高10%，估计10math会提高1.1%。支出的估计影响并不大，但这对低支出水平的学校而言是无影响的，因为10%的支出增加从绝对数量上看是很小的。（Ⅴ）在这个数据集中，最大的10math为66.7，远小于100。实际上，最大的拟合值仅为30.2。7．利用CHARITY.RAW中的数据[得自于FransesandPaap（2001）]回答如下问题：（Ⅰ）在这个4268人的样本中，平均捐款数量是多少（以荷兰盾为单位）？没有捐款的人数百分比是多少？（Ⅱ）每年平均寄出的邮件数量是多少？其最小值和最大值是多少？（Ⅲ）用普通最小二乘法估计如下模型：01giftmailsyearu按照通常的方式报告估计方程，包括样本容量和2R。（Ⅳ）解释斜率系数。如果每封邮件的成本是1盾，那么慈善机构预期能够从寄出的每一封邮件中获得净利润吗？这意味着慈善机构从每封邮件中都获得了净利润吗？请加以解释。（Ⅴ）样本中最小慈善捐款的预测值是多少？利用这个简单的回归分析，你有可能预测gift等于0吗？答：（Ⅰ）平均捐款数量为7.44荷兰盾。在4268个被调查者中，2561人没有捐款，占60%。（Ⅱ）每年平均寄出的邮件量为2.05。最小值为0.25，这意味着有人每四年寄出一封邮件，最大值为3.5。（Ⅲ）估计方程为：22.010.6542680.0138giftmailsyearnR＾，（Ⅳ）斜率系数为2.65，意味着年均邮件量导致了额外2.65荷兰盾的捐赠。如果每一封邮件的成本是1盾，那么每封邮件的预期净收益则是1.65盾，然而这只是从平均角度而言的，并不意味着慈善机构从每封邮件中都获得了净利润。部分邮件对捐赠量没有任何贡献，或者其贡献额小于邮寄成本，部分邮件可能产生远高于邮寄成本的捐赠量。（Ⅴ）样本中最小慈善捐款的预测值是：2.012.650.252.67。即使从总体来看，某些人没有收到邮件，最小慈善捐款为2。因此不可能预测gift等于0。为了构造置信区间并进行检验，估计ˆj的标准差也就是方差的平方根：1/22ˆsd/SST1jjjR由于未知，所以用其估计量ˆ来取代，则：1/22ˆˆse/SST1jjjR如果误差表现出异方差性，标准误公式就不是ˆsdj的一个可靠估计量，从而使标准误无效。五、0LS的有效性：高斯-马尔可夫定理1．最优线性无偏估计量（1）估计量：它是一个可应用于任何一个数据样本，并产生一个估计值的规则。（2）无偏估计量：如果j的一个估计量，对任意01k，，„，都有ˆjjE，那么它就是j的一个无偏估计量。（3）“线性”：j的一个估计量j是线性的充分必要条件是，它能表示成因变量数据的一个线性函数：1njijiiwy其中每个ijw都可以是所有自变量样本值的一个函数。（4）“最优”：最优被定义为最小方差。2．定理3.4：高斯-马尔可夫定理（1）主要内容在假定MLR.1～MLR.5下，01ˆˆˆk，，„，分别是01k，，„，的最优线性无偏估计量。假定MLR.1～MLR.5被称为（横截面数据分析的）高斯-马尔可夫假定。（2）高斯-马尔可夫定理的重要性当这个标准假定集成立时，不需要再去寻找其他无偏估计量：没有一个会比OLS更好。如果高斯-马尔可夫假定中的任何一个不成立，那么这个定理也就不再成立。零条件均值的假定（假定MLR.4）不成立会导致OLS产生偏误，异方差性（假定MLR.5不成立）虽不致使OLS有偏，但它在线性无偏估计量中不再具有最小方差。3.2课后习题详解一、习题1．用WAGE2·RAW中有关男工人的数据估计了如下方程：210.360.0940.1310.2107220.214educsibsmeducfeducnR＾，其中，educ是受教育年数，sibs是兄弟姐妹的个数，meduc是母亲受教育的年数，feduc则是父亲受教育的年数。（i）sibs是否具有预期的影响？请给出解释。保持meduc、feduc不变，为了使预测的受教育程度减少一年，需要sibs增加多少？（这里不要求答案为整数。）（ii）讨论对meduc的系数的解释。（iii）假设一个男工人A没有兄弟姐妹，其父母都接受了12年的教育。另一个男工人B也没有兄弟姐妹，但其父母都接受了16年的教育。预计B和A所接受教育的年数差别为多少？答：（i）sibs具有预期的影响。家庭中兄弟姐妹的数量越多，每一个小孩受教育的年数都会减少。为了使预测的受教育程度减少一年，需要增加1/0.9410.6sibs。（ii）变量sibs和feduc保持不变，则母亲受教育的年数每增加一年，预计受教育年数将会增加0.131年。因此母亲受教育年数增加4年，她的儿子受教育年数增加约半年（0.524）。（iii）因为兄弟姐妹的个数是相同的，但是meduc和feduc均不相同，因此B和A所接受教育的年数为：0.1310.21041.364（年）。2．利用GPA2.RAW中有关4137名大学生的数据，用0LS估计了如下方程：21.3920.01350.0014841370.273colgpahspercsatnR＾，其中，colgpa以四分制度量，hsperc是在高中班上名次的百分位数（比方说，5hsperc，就意味着位于班上前5%之列），而sat是在学生能力测验中数学和语言的综合成绩。（i）为什么hsperc的系数为负也讲得通？（ii）当20hsperc和1050sat时，大学GPA的预测值是多少？（iii）假设两个在高中班上具有同样百分位数的高中毕业生A和B，但A学生的SAT分数要高出140分（在样本中相当于一倍的标准差），那么，预计这两个学生的大学GPA相差多少？这个差距大吗？（iv）保持hsperc不变，SAT的分数相差多少，才能导致预测的colgpa相差0.50或四分制的半分？评论你的结论。答：（i）在高中班上名次的百分位数（hsperc）越小，学生在高中排名就越好，越大则排名越差。其它条件不变的情况下，学生在高中的排名越差，他/她预计的GPA将越小。（ii）将20hsperc，1050sat代入估计方程可得：1.3920.0135200.014810502.676colgpa（iii）预计中A的成绩比B的成绩高出0.01481400.207。这个差距较大。（iv）hsperc不变，0.00148colgpasat。当0.5colgpa时，0.5/0.00148338sat。在其他条件不变的情况下，SAT分数的差异为约2.5个标准差，才能预测colgpa相差0.50。3．刚从法学院毕业的学生的起薪中位数由下式决定：012345logloglogsalaryLSATGPAlibvolcostranku其中，LSAT是整个待毕业年级LSAT成绩的中位数，GPA是该年级大学GPA的中位数，libvol是法学院图书馆的藏书量，cost是进入法学院每年的费用，而rank是法学院的排名（1rank的法学院是最好的）。（i）解释为什么我们预期50。（ii）你预计其他斜率参数的符号如何？给出你的理由。（iii）使用LAWSCH85.RAW中的数据，估计出来的方程是2log8.340.00470.2480.095log0.038log0.00331360.842salaryLSATGPAlibvolcostranknR＾，在其他条件不变的情况下，预计GPA中位数相差一分会导致薪水有多大差别？（以百分比回答。）（iv）解释变量loglibvol的系数。（v）你是否认为，应该进入一个排名更高的法学院？从预计的起薪来看，排名相差20位的价值有多大？答：（i）法学院的排名越大，说明该学院的声望越差，这将使得起薪下降。例如，排名100意味着还有99所学校更好。因此预期50。（ii）预计10，20,因为LSAT和GPA都衡量了待毕业班级的质量，好学生进入学院使得预计的平均工资更高。340，，法学院图书馆的藏书量以及进入法学院每年的费用都衡量了学校的质量。成本的作用小于藏书量，但反映了教员和硬件设施的质量。（iii）预计GPA中位数相差一分会导致薪水增加24.8%。（iv）应该进入一个排名更高的法学院。排名相差20位的价值为：1000.0033206.6%。4．下面这个模型是BiddleandHamermesh（1990）所用多元回归模型的一个简化版本，原模型研究睡眠时间和工作时间之间的取舍，并考察影响睡眠的其他因素：0123sleeptotwrkeducageu其中，sleep和totwrk都以分钟／周为单位，而educ和age则以年为单位。（也可参见计算机习题C2.3。）（i）如果成年人为工作而放弃睡眠，1的符号是什么？（ii）你认为2和3的符号应该是什么？（iii）利用SLEEP75.RAW中的数据，估计出来的方程是23638.250.14811.132.207060.113sleeptotwrkeducagenR＾，如果有人一周多工作5个小时，预计sleep会减少多少分钟？这是一个很大的舍弃吗？（iv）讨论educ的估计系数的符号和大小。（v）你能说totwrk，educ和age解释了sleep的大部分变异吗？还有什么其他因素可能影响花在睡眠上的时间？它们与totwrk可能相关吗？答：（i）1的符号应该为负。（ii）2的符号不明确。一些人认为更高教育水平的人想获得更多，其他条件相同的情况下，他们休息的较少，此时20。睡眠与年龄之间的关系比模型描述的更为复杂，经济学家不能很好的判断这件事情。（iii）因为totwrk都以分钟／周为单位，因此将时转化为分可得，560300totwrk。预计睡眠将会下降0.14830044.4（分）。对一周而言，这并不是一个很大的舍弃。（iv）受教育年限educ越多暗示着预计睡眠时间越少，但是这种影响是很小的。假设在其他条件不变的情况下，大学和高中的区别是四年间大学学生每周睡眠时间少休息45分钟。（v）不能，totwrk、educ和age只解释了11.3%的sleep的变异。一个包含在误差项中的重要因素是总体健康状况。另一个重要因素是婚姻状况，以及是否有孩子。健康、婚姻状况、孩子的数量和年龄与totwrk是相关的。5．考虑含有三个自变量的多元回归模型，并满足假定MLR.1～MLR.4，0112233yxxxu你对估计1x和2x的参数之和感兴趣；把这个和记为112。（i）证明112ˆˆˆ是1的一个无偏估计量。（ii）求出用1ˆVar、2ˆVar和12ˆˆCorr，表示的1ˆVar。答：（i）11212121ˆˆˆˆˆEEEE。（ii）112ˆˆˆVarVar6．在一项调查大学GPA与在各种活动中折耗费时间之关系的研究中，你对几个学生分发了调查问卷。学生被问到，他们每周在学习、睡觉、工作和闲暇这四种活动中各花多少小时。任何活动都被列为这四种活动之一，所以对每个学生来说，这四个活动的小时数之和都是168。（i）在模型01111+++++GPAstudysleepworkleisureu中，保持sleep，work和leisure不变而改变study是否有意义？（ii）解释为什么这个模型违背了假定MLR.3。（iii）你如何才能将这个模型重新表述，使得它的参数具有一个有用的解释，而又不违背假定MLR.3。答：（i）没有意义。因为四种活动的总时间固定为168小时，其他三种不变，则study时间也不会改变。（ii）从（i）可知，study是其他三种活动的线性函数：168studysleepworkleisure。这种关系对于每一个观测值都成立，因此违背了MLR.3。（iii）应该去掉一个解释变量leisure，模型变为：0123GPAstudysleepworku1是study的参数，当其他条件不变的情况下，study每增加一小时，GPA增加1。但是如果学习时间增加一小时，leisure时间必须减少一小时。其他参数解释与此类似。7．假设制造业中每个工人的平均生产力（avgprod）取决于培训的平均小时数（avglrain）和工人的平均能力（avgabil）两个因素：012avgprodavgtrainavgabilu假设这个方程满足高斯-马尔可夫假定。如果将培训津贴给了那些工人能力较差的企业，以致avgtrain和avgabil呈负相关，那么，将avgprod对avgtrain进行简单回归所得到的可能出现什么样的偏误？答：利用表3-2。因为20，且12Corr0xx，。因此1存在一个向下的偏误，即11E：。简单回归估计低估了培训时间的影响。即使10，E也可能是负的。8．下面哪些因素会导致0LS估计量出现偏误？（i）异方差性。（ii）遗漏一个重要变量。（iii）模型中同时包含的两个自变量之间的样本相关系数达到0.95．答：只有（ii）才会导致OLS出现偏误，且所遗漏的变量必须与模型中包含的变量是相关的。同方差性假设并不影响OLS估计量的无偏性，仅影响估计量的方差。样本解释变量之间共线性的程度并不影响高斯-马尔科夫假定。只有当自变量之间完全共线时，才会违背MLR.3。9．假设你对估计其他条件不变情况下y和1x之间的关系感兴趣。为此，你可以搜集两个控制变量2x和3x的数据。（为真实起见，你可以想象y为期末考试分数，1x为到课率．2x为上学期之前的GPA，3x为SAT或ACT分数。）令1ˆ表示y列1x进行简单回归的系数估计值，而1ˆ为y对1x，2x，3x进行多元回归的斜率估计值。（i）若样本中1x与2x和3x高度相关，且2x和3x对y具有很大的偏效应，预计和1ˆ是十分类似还是十分不同？请解释。（ii）若1x与2x和3x几乎无关但2x和3x高度相关，预计和1ˆ是十分类似还是十分不同？请解释。（iii）若样本中1x与2x和3x高度相关，且2x和3x对y具有很小的偏效应，预计1se和1ˆse哪个更小？请解释。（iv）若1x与2x和3x几乎无关，2x和3x对y具有很大的偏效应，并且2x与3x高度相关，预计1se和1ˆse哪个更小？请解释。答：（i）因为1x与2x和3x高度相关，后面的变量对y具有很大的偏效应，简单和多元回归中1x的系数十分不同。由方程3.46以及对遗漏一个变量的讨论可知，系数不相同是直觉的结论。（ii）若1x与2x和3x几乎无关但2x和3x高度相关，预计1和1ˆ十分类似。因为1x与2x和3x几乎无关，则2x和3x的相关程度对多元回归中对1x的回归估计没有直接的影响。（iii）1se更小。在本案例中，加入2x和3x大幅度增加了1x的系数的标准误，因此11ˆsese。（iv）1ˆse更小。在模型中加入2x和3x将会减少残差，而不导致多重共线性，因此可得11ˆsese。2x和3x的相关关系并不影响1ˆse。10．假设决定y的总体模型是0112233yxxxu，而这个模型满足假定MLR.1～MLR.4。但我们估计了漏掉3x的模型。令0，1和2为y对2x和3x回归的OLS估计量。（给定样本中自变量的值）证明1的期望值是1E其中1iˆr是1x对2x回归所得到的0LS残差。[提示：1的公式来自方程（3.22）。将0112233iiiiiyxxxu代入这个方程。经过一些计算之后，将3ix和1iˆr视为非随机量而取期望。]答：由公式3.22可得：111211ˆˆˆniiiniiryr。代入真实的模型可得：1011223311211ˆ+ˆˆniiiiiiniirxxxur因为11ˆ0niir，121ˆ0nriirx，211111ˆˆnniiiiirxr，1iˆr是1ix对2ix回归的残差，1iˆr有零均值，且与2ix无关。因此分子简化为2113131111ˆˆˆnnnrririiiirrxru将分子代入原式得：13111113221111ˆˆˆˆnniiiiinniiiirxrurr由于随机误差项的均值为0，因此131113211ˆˆniiiniirxEr11．下面这个方程把一个社区住房的中间价格表示成污染水平（用nox表示氧化亚氮）和社区中每套住房平均房间数量（rooms）之间的关系：012loglogpricenoxroomsu（i）1和2的符号可能是什么？对1有何解释？请加以说明。（ii）为什么nox[或更准确地说，是lognox]与rooms可能负相关？如果是这样，将logprice对lognox进行简单回归得到1的偏误估计量是偏高还是偏低？（iii）利用HPRICE2.RAW中的数据，估计出如下方程：22log11.711.043log5060.264log9.230.718log0.3065060.514pricenoxnRpricenoxroomsnR＾＾，，根据你在第（ii）部分的回答，就price对nox的弹性估计值而言，上述简单回归结果和多元回归结果之间的关系与你的预期一致吗？这个结果是否意味着-0.718比-1.043更加接近真实弹性？答：（i）10，更高的污染水平导致预计房屋价格更低。1表示房屋价格的污染弹性，即污染水平上升1%，则房屋价格下降1%。20，每套住房平均房间数量越多，说明房屋面积越大，则房屋价格越高。（ii）假设平均房间数量随着房屋质量的提高而增长，lognox与rooms可能负相关，因为实际上贫穷的社区污染水平更高。利用表3.2可判断偏误的方向，如果20且12Corr0xx，，简单回归估计得到的1有一个向下的偏误。当10，意味着在同样的回归中，平均污染水平的作用1被高估了。（iii）上述简单回归结果和多元回归结果之间的关系与预期一致。简单回归估计的结果-1.043小于多元回归的结果-0.718。如果这些估计只是对于一个样本而言，那么就不能判断哪一个更接近1，但如果这是一个典型的样本，则-0.718更接近真实的1。12．（i）在前4个高斯-马尔可夫假定之下，考虑简单回归模型01yxu，对某个函数gz，比如2gxx或2log1gxx。定义iizgx定义一个斜率估计量为111/nniiiiiizzyzzx证明1是线性无偏的。记住，在你的推导过程中，因为0Eux，所以你可以把ix和iz都看成非随机的。（ii）增加同方差假定MLR.5，证明1Var（iii）在高斯-马尔可夫假定下，直接证明11ˆVarVar，其中1ˆ是OLS估计量。[提示：附录8中的柯西-施瓦兹不等式意味着222111111nnniiiiiiinzzxxnzznxx注意，我们可以将x从样本协方差中去掉。证明：（i）记1nzxiiiszzx，这不完全是z和x样本协方差，因为并没有除以1n。但为了简化计算而使用它。由此可知：11niiizxzzys这是一个iy的线性函数，设权重为/iizxwzzs。为了表示无偏性，将01iiiyxu加入该方程可得：0111niiiizxzzxus0111nnizxiiiizxzzszzus11niiizxzzus因为10niizz，zxs是iz、ix和预计期望值的函数。对于所有的i，都有0iEu。因此可得：11111niizxzzEuEs（ii）据（i）可得：2211121222VarVarVar=nnniiiiiiiizxzxzxzzuzzuzzsss。（iii）已知2211ˆVar/niixx，将x从样本协方差中去掉，消去1n，可以得到：22211/1/nnizxiiizzsxx两边乘以2，可得11ˆVarVar。13．如下式所示，在由美国各个县构成的总体中，各种税收比例对随后就业增长方面的影响：0122pISgrowthshareshareshare其他因素其中，growth是就业从1980年到1990年的变化百分比，p

                    本文档为【伍德里奇《计量经济学导论》(第4版)笔记和课后习题详解(2-8章)】，请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑，
                    图片更改请在作品中右键图片并更换，文字修改请直接点击文字进行修改，也可以新增和删除文档中的内容。 
 该文档来自用户分享，如有侵权行为请发邮件ishare@vip.sina.com联系网站客服，我们会及时删除。

                    [版权声明] 本站所有资料为用户分享产生，若发现您的权利被侵害，请联系客服邮件isharekefu@iask.cn，我们尽快处理。

                    本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用。

                    网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
                

下载需要：￥14.0 已有0 人下载

立即下载

伍德里奇《计量经济学导论》(第4版)笔记和课后习题详解(2-8章)

你可能还喜欢