首页 应用回归实验报告

应用回归实验报告

举报
开通vip

应用回归实验报告..DOC资料.重庆交通大学学生实验报告实验课程名称应用回归分析开课实验室理学院实验室学院09年级信息与计算科学专业班1学生姓名林艳学号09180117开课时间2011至2012学年第1学期总成绩教师签名2.15一家保险公司十分关心其总公司营业部加班的程度,决定认真调查一下现状。经过10周时间,收集了每周加班工作时间的数据和签发的心保单数目,x为每周签发的新保单数目,y为每周加班工作时间(小时)。见表2.7.表2.7周序号12345678910X8252151070550...

应用回归实验报告
..DOC资料.重庆交通大学学生实验 报告 软件系统测试报告下载sgs报告如何下载关于路面塌陷情况报告535n,sgs报告怎么下载竣工报告下载 实验课程名称应用回归分析开课实验室理学院实验室学院09年级信息与计算科学专业班1学生姓名林艳学号09180117开课时间2011至2012学年第1学期总成绩教师签名2.15一家保险公司十分关心其总公司营业部加班的程度,决定认真调查一下现状。经过10周时间,收集了每周加班工作时间的数据和签发的心保单数目,x为每周签发的新保单数目,y为每周加班工作时间(小时)。见表2.7.表2.7周序号12345678910X825215107055048092013503256701215Y3.51.04.02.01.03.04.51.53.05.0画散点图;答:X与y之间是否大致呈线性关系;答:由(1)的散点图可以看出x与y之间大致呈线性关系。用最小二乘估计求出回归方程;答:由SPSS得:系数a模型非 标准 excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载 化系数标准系数tSig.B标准误差试用版1(常量).118.355.333.748x.004.000.9498.509.000a.因变量:y由该系数表得出最小二乘估计的回归方程为:求回归标准误差;答:模型汇总模型RR方调整R方标准估计的误差1.949a.900.888.48002a.预测变量:(常量),x。由上表得回归标准误差为:=0.48002给出与的置信度为95%的区间估计;答:系数a模型非标准化系数标准系数tSig.B的95.0%置信区间B标准误差试用版下限上限1(常量).118.355.333.748-.701.937x.004.000.9498.509.000.003.005a.因变量:y由上表得:得置信区间为:(-0.701,0.0937);得置信区间为:(0.003,0.005);计算x与y的决定系数;答:由(4)得模型汇总表得:=0.900,从相对水平上来看,回归方程能够减少因变量y得99.0%得方差波动。对回归方程做方差分析;答:由SPSS得方差表:Anovab模型平方和df均方FSig.1回归16.682116.68272.396.000a残差1.8438.230总计18.5259a.预测变量:(常量),x。b.因变量:y由方差分析表中看到,F=72.396,Sig=0.000,说明y对x得线性回归高度显著。做回归系数β1显著性的检验;答:从(5)中得系数表中可得:回归系数β1检验的t值=8.509,显著性Sig=0.000,与F检验的检验结果一致。做相关系数的显著性检验;答:从(4)的模型汇总表可得:r=0.949,说明y与x有显著的线性关系,与F检验和回归系数检验的结果一致。也说明对于一元线性回归三种检验的结果是完全一致的;对回归方程作残差图并作相应的分析;答:残差图:从残差图上看出,残差是围绕e=0随机扰动,从而模型的基本假定是满足的。该公司预计下一周签发新保单=1000张,需要的加班时间是多少?答:由SPSS得下表:xyPRELICIUICILMCIUMCI8253.53.075861.913294.238442.720513.4312221510.88893-0.387912.165770.252531.52534107043.954222.755315.153143.493694.4147555022.089950.910863.269051.68382.4961148011.838990.646133.031851.394462.2835392033.416452.245384.587523.034223.7986813504.54.958063.664136.251994.288025.628093251.51.28330.047122.519470.7331.8335967032.520171.355773.684572.158892.88145121554.474063.232465.715673.911695.0364410003.703262.519494.887033.283734.12279从表中得出加班时间:给出的置信水平为95%的精确预测区间和近似预测区间。答:从(10)表可以得出置信水平为95%的精确预测区间为(3.28373,4.12279),近似预测区间为即(2.74332,3.70326)。给出E()置信水平为95%的区间估计。答:从(11)表中得E()置信水平为95%的区间估计为:(2.51949,4.88703)。2.16表2.8是1985年美国50个州和哥伦比亚特区公立学校中教师的人均年工资y(美元)和学生的人均经费投入x(美元)。(1)绘制y对x的散点图,可以用直线回归描述两者之间的关系吗?(2)建立y对x的线性回归;(3)用线性回归的Plots功能绘制标准残差的直方图和正态概率图,检验误差项的正态性假设。(4)通过p-p图或q-q,若有异常点剔出后再分析。表2.8序号yx序号yx序号yx119583334618208163059351953826422202633114191809529673620460312432032535542020939328537214192752426800454221226443914382510634295294704669222462445173922482394762661048882327186434940209692509730678571024339905020412722454408271705536252338235944225892404292585341682620627282143226443402102450035472722795336644246402829112427431592821570292045223412297122714036212922080298046256102932133016837823022250373147260153705142652542473120940285348257884123152736039823221800253349291323608162169035683322934272950414808349172197431553418443230551258453766解:(1)由图看出x与y大致呈直线关系;(2):由SPSS得:系数a模型非标准化系数标准系数tSig.B标准误差试用版1(常量)12109.8791196.94810.117.000x3.314.312.83510.630.000a.因变量:y回归方程为:(3)由标准残差的直方图和正态概率图可以看出,误差项通过了正态性假设。(4)yxDREZRESRE195833346-3696.68-1.55754-1.5748202633114-2224.35-0.93347-0.9457203253554-3636.03-1.53486-1.55042268004542-375.051-0.15628-0.158892947046691958.1840.812460.8278266104888-1780.17-0.73204-0.7492306785710-392.213-0.15325-0.1609271705536-3575.91-1.41585-1.47673258534168-72.0447-0.0303-0.03066245003547647.71380.273410.276182427431591737.7220.729930.739152714036213090.4091.304891.317943016837825635.1982.379292.40314265254247348.59290.146380.148252736039822097.3420.884320.8938216903568-2290.41-0.96691-0.97667219743155-607.181-0.25503-0.25826208163059-1471.5-0.61677-0.62523180952967-3963.59-1.65744-1.68214209393285-2105.59-0.8864-0.89661226443914-2488.5-1.04991-1.06083246244517-2536.66-1.05785-1.07509271864349681.41740.285480.289473399050205526.4252.258292.31852233823594-651.909-0.27524-0.278206272821-860.884-0.35843-0.36456227953366-480.739-0.2026-0.20482215702920-224.075-0.09358-0.0950322080298096.679740.040440.04104222503731-2269.6-0.95838-0.96793209402853-646.131-0.26929-0.273762180025331354.8680.557930.570612293427291847.0290.766580.78094184432305-1381.23-0.56254-0.57851195382642-1382.66-0.57197-0.58364204603124-2055.73-0.86289-0.8741214192752195.49050.08120.082692510634291666.6310.702870.71033224823947-2766.33-1.1668-1.1791209692509569.4720.234260.23971272245440-3149.78-1.25555-1.30514258924042394.84580.166370.16821226443402-756.692-0.31903-0.322462464028293262.3921.358651.381732234122972770.3961.127841.16012561029323900.3661.629421.654512601537051658.6460.700410.7073825788412314.120310.005940.006012913236085166.62.181452.203314148083492883.0480.732280.95362584537661279.1540.540110.54551由标准化残差可以看出无异常点。研究货运总量y(万吨)与工业总产值x1(亿元)、农业总产值x2(亿元)、居民非商品支出x3(亿元)的关系。数据见表3.9.表3.9货运总量y(万吨)工业总产值x1亿元农业总产值x1亿元居民非商品之处x3(亿元)16070351.026075402.421065402.026574423.024072381.222068451.527578424.016066362.027570443.225065423.0计算出y,x1,x2,x3的相关系数矩阵;解:由SPSS软件得:相关性yx1x2x3yPearson相关性1.556.731*.724*显著性(双侧).095.016.018N10101010x1Pearson相关性.5561.113.398显著性(双侧).095.756.254N10101010x2Pearson相关性.731*.1131.547显著性(双侧).016.756.101N10101010x3Pearson相关性.724*.398.5471显著性(双侧).018.254.101N10101010*.在0.05水平(双侧)上显著相关。所以y,x1,x2,x3的相关系数矩阵为:求y关于x1,x2,x3的三元线性回归方程;解:由SPSS得:系数a模型非标准化系数标准系数tSig.B的95.0%置信区间B标准误差试用版下限上限1(常量)-348.280176.459-1.974.096-780.06083.500x13.7541.933.3851.942.100-.9778.485x27.1012.880.5352.465.049.05314.149x312.44710.569.2771.178.284-13.41538.310a.因变量:y由上表可得:=3.754x1+7.101x2+12.447x3-348.280⑶对所求得的方程作拟合优度检验;模型汇总b模型RR方调整R方标准估计的误差1.898a.806.70823.442a.预测变量:(常量),x3,x1,x2。b.因变量:y复相关系数R=0.806,决定系数R方=0.898,由决定系数看回归方程显著相关。(4)对回归方程作显著性检验;Anovab模型平方和df均方FSig.1回归13655.37034551.7908.283.015a残差3297.1306549.522总计16952.5009a.预测变量:(常量),x3,x1,x2。b.因变量:y方差分析表,F=8.283,P=0.015,表明回归方程显著相关,说明x1,x2,x3整体上对y有显著的线性影响。(5)对每一个回归系数作显著性检验;系数a模型非标准化系数标准系数tSig.B的95.0%置信区间B标准误差试用版下限上限1(常量)-348.280176.459-1.974.096-780.06083.500x13.7541.933.3851.942.100-.9778.485x27.1012.880.5352.465.049.05314.149x312.44710.569.2771.178.284-13.41538.310a.因变量:y由上表数据可知:自变量x1,x2,x3对应P值为P1=0.100,P2=0.049,P3=0.284,从定性分析看,x2通过了显著性检验,x3的P值最大,明显未通过显著性检验,说明x3居民非商品支出对货运总量的影响是最小的。(6)如果有的回归系数没通过显著性检验,将其剔除,重新建立回归方程,再作回归方程的显著性检验和回归系数的显著性检验。解:将x3剔除后,用y与x1,x2作回归,计算结果如图:模型汇总b模型RR方调整R方标准估计的误差1.872a.761.69224.081a.预测变量:(常量),x2,x1。b.因变量:yAnovab模型平方和df均方FSig.1回归12893.19926446.60011.117.007a残差4059.3017579.900总计16952.5009a.预测变量:(常量),x2,x1。b.因变量:y系数a模型非标准化系数标准系数tSig.B的95.0%置信区间B标准误差试用版下限上限1(常量)-459.624153.058-3.003.020-821.547-97.700x14.6761.816.4792.575.037.3818.970x28.9712.468.6763.634.0083.13414.808a.因变量:y剔除x3后的回归方程为:=4.676x1+8.971x2-459.624回归方程的显著性检验:此时的F=11.117,P=0.007,表明回归方程高度显著,说明x1,x2整体上对y有高度的线性影响。回归系数的显著性检验:剔除x3后,其余自变量的显著性都发生了不同程度的变化,这是由于自变量之间的相关性造成的,此时P1=0.037,P2=0.008,说明自变量都已显著,都通过了显著性检验。⑺求出每一个回归系数的置信水平为95%的置信区间;β1置信区间为(0.381,8.970)β2的置信区间为(3.134,14.808)⑻求标准化回归方程;解:⑼求当=75,=42,=3.1时的,给定置信水平为95%,用spss软件计算精确置信区间,用手工计算近似预测区间。货运总量y(万吨)工业总产值x1亿元农业总产值x1亿元居民非商品支出x3(亿元)PRELICIUICI16070351.0181.6541114.1804249.127926075402.4249.8871186.7191313.055121065402.0203.1308139.2701266.991526574423.0263.1534200.9208325.385924072381.2217.9183155.9556279.880922068451.5262.0125195.3407328.684227578424.0281.8559213.4631350.248716066362.0171.9226105.138238.707127570443.2262.3928199.0204325.765125065423.0221.0727156.1113286.034175423.1267.829204.4355331.2225从上面的数据可知:,精确置信区间为(204.4355,331.2225),由前面问题6的表得;手工计算进似预测区间为即(219.667,315.991)⑽结合回归方程对问题做一些基本分析。解:回归方程:从这个回归方程我可以看出当工业总产值每增加一个单位时货运就增加4.676个单位,而当农业增加一个单位时货运量就增加8.971个单位,可以看出该地区是一农业发展为主,工业还没有农业发展快。我们可以通过该模型来预测将来。3.12用表3.10的数据,建立GDP对和的回归。对得到的二元回归方程,你能够合理地解释两个回归系数吗?如果现在不能给出合理的解释,不妨在学过第6章多重共线性后再来解释这个问题,学过第7章领回归后再来改进这个问题。数据如下:年份GDP第一产业增加值x1第二产业增加值x2第三产业增加值x3199018547.95017.07714.45813.5199121617.85288.69102.27227.0199226638.15800.011699.59138.6199334634.46882.116428.511323.8199446759.49457.222372.214930.0199558478.111993.028537.917947.2199667884.613844.233612.920427.5199774462.614211.237222.723028.7199878345.214552.438619.325173.5199982067.514472.040557.827037.7200089468.114628.244935.329904.6200197314.815411.848750.033153.02002105172.316117.352980.236047.82003117390.216928.161247.139188.02004136875.920768.172387.243720.6(1)计算出y,,,的相关系数矩阵;解:由SPSS得:相关性yx1x2x3yPearson相关性1.978**.999**.997**显著性(双侧).000.000.000N15151515x1Pearson相关性.978**1.975**.962**显著性(双侧).000.000.000N15151515x2Pearson相关性.999**.975**1.995**显著性(双侧).000.000.000N15151515x3Pearson相关性.997**.962**.995**1显著性(双侧).000.000.000N15151515**.在.01水平(双侧)上显著相关。(2)求y关于,,的三元线性回归方程;解:系数a模型非标准化系数标准系数tSig.B标准误差试用版1(常量)6.06010.500.577.575x1.997.002.133469.870.000x21.000.001.538690.105.000x31.002.002.333521.475.000a.因变量:y回归方程为:(3)对所求得的方程作拟合优度检验;解:模型汇总b模型RR方调整R方标准估计的误差11.000a1.0001.0007.889a.预测变量:(常量),x3,x1,x2。b.因变量:y复相关系数R=1.000,决定系数R方=1.000,由决定系数看回归方程高度显著。(4)对回归方程做显著性检验;解:Anovab模型平方和df均方FSig.1回归1.811E1036.037E99.699E7.000a残差684.6131162.238总计1.811E1014a.预测变量:(常量),x3,x1,x2。b.因变量:y从方差分析表看出F=9.699E7,P=0.000,表明回归方程显著相关,说明x1,x2,x3整体上对y有高度显著的线性影响。(5)对每一个回归系数做显著性检验;解:系数a模型非标准化系数标准系数tSig.B标准误差试用版1(常量)6.06010.500.577.575x1.997.002.133469.870.000x21.000.001.538690.105.000x31.002.002.333521.475.000a.因变量:y从上表看每个自变量对应的sig=0.000,所以都通过了显著性检验。(6)求出每一个回归系数的置信水平为95%的置信区间;系数a模型非标准化系数标准系数tSig.B的95.0%置信区间B标准误差试用版下限上限1(常量)6.06010.500.577.575-17.05029.169x1.997.002.133469.870.000.9921.001x21.000.001.538690.105.000.9971.003x31.002.002.333521.475.000.9981.006a.因变量:yβ1置信区间为(0.992,1.001)β2的置信区间为(0.997,,1.006)β3的置信区间为(0.998,1.006)(7)结合回归方程对问题做一些基本分析。其实我们从相关系数矩阵可以看出自变量之间的相关性比较大,还有从复相关系数和决定系数也可以看出用线性来拟合这组数据有些问题,因为它们的值都为1,而在实际生活中一般是不存在这样的数据。因此我们不能就认定这回归方程通过了显著性检验就正确,因为它们的自变量之间有非常大的相关性,所以我们应考虑用其他的方法来做回归分析。
本文档为【应用回归实验报告】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
个人认证用户
liyxi2018
暂无简介~
格式:doc
大小:670KB
软件:Word
页数:18
分类:
上传时间:2022-01-13
浏览量:0