首页 统计学原理与实务-徐静霞

统计学原理与实务-徐静霞

举报
开通vip

统计学原理与实务-徐静霞思考与练习一、思考题1、分类数据的图示方法,其中包括条形图、Pareto图、对比条形图和饼图等。顺序数据除了上文提到的条形图、pareto图、对比条形图、饼图之外还可以借助累积频数分布图和环形图来进行描述。2、条形图、饼图、环形图、累积分布图、直方图、茎叶图、箱形图、散点图、线图、三维散点图、气泡图、雷达图等。3、数据分组按照分组标志的不同可以分为单变量值分组和组距分组两种。根据组距不同还可以分为等距分组和不等距分组。4、分组和编制频数分布表的具体步骤如下:第1步:排序。将变量按照一定的大小顺序进行排序,通常是由小...

统计学原理与实务-徐静霞
思考与练习一、思考题1、分类数据的图示方法,其中包括条形图、Pareto图、对比条形图和饼图等。顺序数据除了上文提到的条形图、pareto图、对比条形图、饼图之外还可以借助累积频数分布图和环形图来进行描述。2、条形图、饼图、环形图、累积分布图、直方图、茎叶图、箱形图、散点图、线图、三维散点图、气泡图、雷达图等。3、数据分组按照分组标志的不同可以分为单变量值分组和组距分组两种。根据组距不同还可以分为等距分组和不等距分组。4、分组和编制频数分布表的具体步骤如下:第1步:排序。将变量按照一定的大小顺序进行排序,通常是由小至大的递增顺序,使用计算机软件进行整理时此步可以忽略。第2步:确定组数。一般与数据本身的特点及数据的多少有关。由于分组的目的之一是为了观察数据分布的特征,因此组数的多少应适中。如组数太少,数据的分布就会过于集中,组数太多,数据的分布就会过于分散,这都不便于观察数据分布的特征和规律。组数的确定应以能够显示数据的分布特征和规律为目的。一般情况下,一组数据所分的组数K不应少于5组且不多于15组,即5<K<15。在实际分组时,也可以借助经验公式来确定组数K,2lglg1nK其中n为数据的个数,对结果四舍五入取整数即为组数。第3步:确定各组的组距。在组距分组中,一个组的最小值称为下限(lowlimit);一个组的最大值称为上限(upperlimit),组距(classwidth)是一个组的上限与下限的差。组距可根据全部数据的最大值和最小值及所分的组数来确定,即,组距=(最大值—最小值)/组数。5、饼图是用圆形及圆内扇形的角度来表示数值大小的图形,它主要用于表示一个样本(或总体)中各组成部分的数据占全部数据的比例,对于研究结构性问题十分有用。环形图中间有一个“空洞”,样本或总体中的每一部分数据用环中的一段表示。饼图只能显示一个总体和样本各部分所占的比例,而环形图则可以同时绘制多个总体或样本的数据系列,每一个总体或样本的数据系列为一个环。因此环形图可显示多个总体或样本各部分所占的相应比例,从而有利于进行比较研究。6、直方图与条形图是不同的,首先,条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)则是固定的;直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度则表示各组的组距,因此其高度与宽度均有意义。其次,由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是分开排列。最后,条形图主要用于展示分类数据,而直方图则主要用于展示数值型数据。7、茎叶图类似于横置的直方图,与直方图相比,茎叶图既能给出数据的分布状况,又能给出每一个原始数值,即保留了原始数据的信息。而直方图虽然能很好地显示数据的分布,但不能保留原始的数值。在应用方面,直方图通常适用于大批量数据,茎叶图通常适用于小批量数据。8、统计图一般由下面几个部分构成:(1)标题,即图的名称,简明扼要说明资料的中心内容,必要时注明时间和地点,一般写在图的正下方位置,同时将图形的编号写在标题的前面。(2)标目,分为纵标目与横标目,分别表示纵轴与横轴数字刻度的意义,一般注明度量衡单位。(3)点线条面,借以用来显示数据的元素,这是图形的主体部分,用于显示数据和展示数据的规律和关系。(4)刻度,指在纵轴或横轴上的坐标。(5)图例,其目的是为了使读者能区分统计图中各种图形的意义。9、一般用“图优性(Graphicalexcellency)”来描述一个好的统计图。“图优性”是指图形能够在最短的时间内,用最少的笔墨,在最小的空间里,给观众最多的思想。一张好的图形应包括如下基本特性:显示数据,集中反映图形的内容,避免歪曲,数据之间可进行有效比较,目的明确且唯一,统计描述和文字说明清晰。10、常见的统计表一般由4个主要部分组成,即表头、行标题、列标题和数据,此外,必要时可以在统计表的下方加上表外附加说明。11、在具体编制统计表时,应当遵循以下几点规则:(1)统计表的结构要合理,内容要简练,形式要美观。比如行标题、列标题、数字资料的位置应安排合理。如果有合计一项,一般放在最后一行或最后一列。有时,由于强调的问题不同,行标题和列标题可以互换,但应使统计表的横竖长度比例适当,避免出现过高或过长的表格形式。(2)统计表一般使用“三线表”的形式,如表3—24所示,表的上下两端横线一般用粗线条绘制,用细线把行标题和数字资料进行分离,统计表的左右两端不封口。这样使人看起来清楚、醒目、美观。如果数据关系复杂,单靠三条线是不够的,在这种情况下,数据资料也可用横线或竖线对数据资料进行分开,以表明数据的隶属关系,但必须用细线,总之表中尽量少用横竖线。(3)表头一般应包括表号、总标题和表中数据的单位等内容。总标题应简明确切地概括出统计表的内容,一般需要表明统计数据的时间(When)、地点(Where)以及何种数据(What),即标题内容应满足3W要求。如果表中的全部数据都是同一计量单位,可放在表的右上角标明,若各变量的计量单位不同,则应放在每个变量后或单列出一列标明。(4)表中的数据一般是右对齐,有小数点时应以小数点对齐,而且小数点的位数应统一。当数字因小可略而不计时,可写上“0”;当缺某项数字资料时,可用符号“…”表示;不应有数字时用符号“一”表示,一张填好的统计表不应出现空白单元格。(5)在绘制统计表时,为保证统计资料的科学性与严肃性,在统计表下,应注明资料来源,以表明表中数据的可靠性,或是方便读者查阅使用。必要时,也可在统计表下添加注解,以对变量或数据进行必要的解释和文字说明。二、单项选择题1-5CACCD6-10CBBBC11-15CDDBC16-20CDDBB21-25BBBCB26-30ACABD三、练习题1、(1)属于顺序数据(2)计数项:成绩成绩汇总8252615ABCDE6总计80(3)成绩人数累计频率A880.1B25330.4125C26590.7375D15740.925E6801总计80801(4)ABCDE汇总2、(1)(2)正态分布优良中及格不及格02468101214161820甲班乙班ABCDE051015202530汇总汇总3、(1)接收频率累积%接收频率累积%49510.00791530.0059520.00891152.00691040.00691072.00791570.0049582.00891192.0059592.00994100.00994100.00合计0-合计0-(2)(3)VAR00001Stem-and-LeafPlotFrequencyStem&Leaf2.004.133.004.6673.005.0032.005.895.006.011445.006.577997.007.00013448.007.556667886.008.0113445.008.577893.009.0221.009.7Stemwidth:10.00Eachleaf:1case(s)4、(2)(3)接收频率%累积%接收频率累积%6944.00991122.00%791216.00109940.00%891632.0089856.00%991854.00119770.00%1091672.0079682.00%1191486.00129490.00%129894.0069294.00%139498.00139298.00%1492100.00其他1100.00%100——VAR00004Stem-and-LeafPlotFrequencyStem&Leaf2.006.896.007.2335668.008.0112345611.009.122245567889.0010.0024666787.0011.23558994.0012.46782.0013.241.0014.1Stemwidth:10.00Eachleaf:1case(s)5、(1)VAR00003Stem-and-LeafPlotFrequencyStem&Leaf1.0011.62.0012.021.0012.82.0013.042.0013.562.0014.222.0014.78.0015.1.0015.52.0016.021.0016.84.0017.0233Stemwidth:100.00Eachleaf:1case(s)6、(1)计数项:时间 时间汇总7:0037:3048:0048:3079:002总计20(2)7:007:308:008:309:00012345678汇总汇总7:007:308:008:309:00汇总7、(1)、(2)台式机笔记本050010001500200025003000350040004500联想戴尔惠普华硕苹果索尼宏基海尔三星神州联想戴尔惠普华硕苹果索尼宏基海尔8、(1)0200000050000100000150000200000250000300000全社会固定资产投资全社会固定资产投资0100000200000050000100000150000200000250000300000全社会固定资产投资全社会固定资产投资(2)(3)200620072008200920100100000200000300000400000500000国内生产总值全社会固定资产投资社会零售品消费总额200620072008200920100100000200000300000400000500000国内生产总值全社会固定资产投资社会零售品消费总额9、(1)接收频率%累积%接收频率%累积%291010.0020-30510.00391626.0030-40826.00491238.0040-50638.00591664.0050-601364.00692084.0060-701084.00791296.0070-80696.00894100.0080-902100.00合计100-合计100-(2)(3)10、(1)0501001500100020003000400050006000700080009000降雨量(mm)降雨量(mm)(2)11、(1)(2)(3)第四章二、单项选择题1-5CADBD6-10BCBDD11-15BACCC16-20BBBCD21-25CDACC26-28DAA三、计算分析题4.1(1)首先将数据由小到大进行排列,中位数的位置为,即排在第7位7211321n的数值为中位数,即民生银行的营业收入为中位数,350.17亿元。eM平均数中中中809.14621384.10604.12337.402904.49001nxxnii(2)25.34134nQL中中中即在第3个数值(145.13)和第4个数值(176.11)之间0.25的位置上,因此LQ(亿元)875.15225.0)13.14511.176(13.145LQ5.79413343nQU中中中即在第9个数值(1295.31)和第10个数值(3340.37)之间0.75的位置上,因此UQ(亿元)105.282975.0)31.129537.3340(31.1295UQ(3)百分位数的位置9.3131003013100Pi由于不是整数,百分位数的位置就是第个位置的数据的整数部分,则第30个百i1i分位数是第4个数,即华夏银行的营业收入176.11亿元为第30个百分数。(4)=1786.559(亿元),112nxxsnii中中809.1462x65.0-599.1786809.1462-15.297sxxzii4.2通常情况下,这种比赛对选手的打分是计算切尾均值,即同时集中平均数和中位数两种统计量的优点,且考虑到歌手B的得分中存在极端高分,故用切尾均值比较合适。首先将歌手A的分数按升序整理为顺序统计量,得到,,,,,,,,1x2x3x4x5x6x7x8x9x7.9,8.1,8.2,8.3,8.5,8.6,8.6,8.7,8.9因为极端高分只有一个,因此去掉一个最高分,去掉一个最低分,取。91则歌手A的最后得分为:43.877.82.81.8299192983291992919191991xxxxxxx歌手B的最后得分为:37.877.82.81.8299192983291992919191991xxxxxxx由以上计算结果,可知歌手A的分数略高于歌手B。4.3若按单利计算:设本金为V,则该笔本金12年应得的利息总和=V(0.03×3+0.05×1+0.08×2+0.1×3+0.15×1)=0.75V则平均年利率%5.71075.0VVfxfx若按复利计算:则平均年利率%43.7115.011.0108.0105.0103.0110323x4.4已知(元),(元),20000M1850eM则(元)17752200018503230MMxe因为,因此该公司职工月工资收入呈左偏分布。0MMxe4.5(1)众数72和74.30M中位数的位置为5.15213021n则中位数为排序后处于15位和16位的两个数值的平均数,即7425.745.73eM平均数为82.7330687.698.783.741nxxnii中(2)5.74304nQL中中中即在第7个数值(71.2)和第8个数值(71.2)之间0.5的位置上,因此LQ(g/L)2.715.0)2.712.71(2.71LQ5.22430343nQU中中中即在第22个数值(75.8)和第23个数值(75.9)之间0.5的位置上,因此UQ(g/L)85.755.0)8.759.75(8.75UQ(3)众数72和74.3的频数均为4,故两种情况下异众比率均为%67.8630411imimirfffffV极差为5.15655.80minmaxiixxR标准差91.313082.736882.733.7412212nxxsnii(4)用Excel求得偏态系数为-0.013,峰态系数为-0.446。(5)由于众数与平均数非常接近,可知数据分布应较为对称,又由于标准差数值较小,可知数据离散程度应不大。这一点同时可由偏态系数-0.013和峰态系数-0.446得到印证,即女大学生血清总蛋白含量数据属轻微的左偏分布,同时略有扁平。4.6已知,,根据经验法则,有95.45%的年份里二氧化硫超标的天数在21~3729x4s天之间,有2.275%的年份里超标天数大于37天,有0.00135%的年份里超标天数大于41天,有15.865%的年份里超标天数少于25天。4.7(元/人)22.1623267433400fxfxA(元/人)25.52626796.74056237)(2ffxxsA%42.3222.162325.526AAAxsv(元/人)1664ffxxB(元/人)17.546298304)(2ffxxsB%82.32166417.546BBBxsv由以上计算可得:(1)B企业的平均工资高于A企业的平均工资。(2)由于,ABvv所以A企业的平均工资更具有代表性。4.8(1)2008年粗钢产量的平均数(百万吨)37.901nxxnii中2008年粗钢产量的中位数的位置为,故中位数5.6211221n(百万吨)7.4926.538.45eM(2)2009年粗钢产量的四分位数为34124nQL中中中即为第3个数值,即(百万吨)LQ3.25LQ9412343nQU中中中即为第9个数值,即(百万吨)UQ60UQ则2009年粗钢产量的四分位差为(百万吨)7.343.2560LUdQQQ2009年粗钢产量的平均数(百万吨)25.861nxxnii中因此2009年粗钢产量的标准差为(百万吨)16.15311225.869.1525.868.56712212nxxsnii(3)2008年粗钢产量的标准差为(百万吨)23.13211237.909.1937.903.50012212nxxsnii因此2008年中国、印度、俄罗斯和巴西的值分别为:z1.323.13237.90-3.500sxxz中中中中25.023.13237.90-8.57sxxz中中中中17.023.13237.90-5.68sxxz中中中中中中43.023.13237.90-7.33sxxz中中中中2009年中国、印度、俄罗斯和巴西的值分别为:z14.316.15325.86-8.567sxxz中中中中15.0-16.15325.86-8.62sxxz中中中中-0.1716.15325.86-60sxxz中中中中中中-0.3916.15325.86-5.26sxxz中中中中由以上计算结果可知,中国、俄罗斯、巴西三国的标准分数变数不大,而印度则有明显提高,因此印度粗钢产量的排名也由2008年的第5位上升到2009年的第3位。4.9(1)由20-30岁年龄组的分数计算离散系数为%73.2211025111xsv由60-64岁年龄组的分数计算离散系数为%78.279025222xsv因此,60-64岁年龄组的分数差异较大。(2)由于20-30岁年龄组的WAIS分数大致是正态分布,根据经验法则,可知20-30岁年龄组中有68.27%的人分数在85~135之间。(3)由于60-64岁年龄组的WAIS分数大致是正态分布,根据经验法则,可知60-64岁年龄组中有68.27%的人分数在65~115之间。(4)莎拉的标准分为125110-13511sxxz母亲的标准分为2.12590-12022sxxz由计算结果可知,莎拉的母亲在60-64年龄组中分数比较高。4.10064.05.19043027744.1216550028.10815067.6803513313iiikiiifMnsfxMSK748.0328.1081501464325660034414nsfxMKkiii4.11(1)茎叶图如下:数茎树叶数据个数638937012678999991180001126(2)最省油自动挡SUV耗油量的平均数和标准差分别为32.8201.109.95.53.51nxxnii中中59.1112nxxsnii中(3)最省油手动挡SUV耗油量的平均数和标准差分别为615.7202.81.88.63.61nxxnii中中53.0112nxxsnii中因此%11.1932.859.1中中中xsv%96.6615.753.0中中中xsv由以上结果可知,自动挡SUV耗油量的离散程度较大。(4)平均来看,自动挡SUV的耗油量要高于手动挡,且离散程度较大,如果购买一款SUV,从经济省油的角度考虑,选择手动挡较合适。第五章二.单项选择题:1-5BCDAA6-10DDBBD11-15BBDBD16-20AABAC21-25DBCAB26-30ACDBA三计算分析题1、解:(1)根据原始数据,计算可得:(小时);=735(小时);4340fxfx112nxxsnii则其68.27%的置信区间为:]5.4413~5.4266[10735143402nszx(2),n=100,,则其68.27%的置信区间为:%9810098ˆp12z]994.0~966.0[100)98.01(98.0198.0)ˆ1(ˆˆ2nppzp2、解:(1),,n=100,24.5x71.22s22z]57.5~91.4[10071.2224.52nszx(2)已知:,n=100,,则其95.45%的置信区间为:%70ˆp22z]61.0,79.0[100)7.01(7.027.0)ˆ1(ˆˆ2nppzp3、解:(1)已知:n=20,,,1500x150s142.2)19(2t由方差未知时,小样本的区间估计公式得:]85.1571~15.1428[20150142.215002nstx(2)已知:,,,则其置信区间为:1800x100s22z]52.1836~48.1763[30100218002nszx4、解:已知:,,,则其置信区间为:35x4s96.12z]64.32,36.37[110010100101696.1351100101001022szx5、解:已知:,,,则其置信区间为:5.501x8s32z]9.503~1.499[100835.5012nszx6、解:已知%,2%,95E22z(件)47502.005.095.02)1()(22222Ezn7、解:已知%,4%,98E96.12z(个)480596.47)04.0(02.098.096.1)1()(22222Ezn8、解:已知:,n=136,,则其95%的置信%85.94136129ˆp96.1025.0z区间为:]9856.0~9114.0[136)9485.01(9485.096.19485.0)ˆ1(ˆˆ025.0nppzp9、解:(1)已知:n=16,,,75.6x25.2s131.2)15(2t由方差未知时,小样本的区间估计公式得:]95.7~55.5[1625.2131.275.62nstx即该单位平均每个家庭每天看电视的95%的置信区间为5.55小时到7.95小时。(2)若已知总体标准差,且要求区间估计的边际误差与上5.2一题的相同,即取边际误差。当20.11625.2131.22nstE05.0时,,估计总体均值时样本容量的确定公式为:96.12z1720.15.296.1)(2222222Ezn只需增加一个样本就能满足精度需要。10、解:已知:,,,则其置信区间为:2.10x4.2s96.1025.0z]04.11~36.9[314.296.12.10025.0nszx第六章二单选1-5ABABC6-10ACDAB11-15BABBD16-20DBDAD21-25CCCAA26-30BABAD31-35CBADA36-40DADAC三计算分析6.1解:建立原假设与备择假设为:,5:0H5:1H(1)检验统计量<,所以拒绝原假设,18.350/2.0591.4z58.2005.02zz认为该批元件的厚度不符合规定的要求。(2)利用P值决策。用【NORMSDIST】计算出的P值为0.00146<=0.01,18.3z所以拒绝原假设,认为该批元件的厚度不符合规定的要求,与统计量决策结果一致。6.2解:(1),。70:0H70:1H(2)样本数据表明应该拒绝原假设时,意味着该生产线生产的玻璃纸平均横向延伸率不符合规格,必须对生产线进行调整。(3)样本数据无法支持拒绝原假设时意味着质量控制监督人员没有充分的理由认为该生产线所处状态不正常,无需停产调整。6.3解:(1)发生第一类错误指的是实际上奖励计划并未提高销售人员的平均销售额,而公司董事长却认为它提高了销售人员的平均销售额,这将导致公司错误的推行新的奖励计划,却无法获得更高的销售额。(2)发生第二类错误指的是实际上奖励计划提高了销售人员的平均销售额,公司董事长却没有意识到,这将使公司错过推行新的奖励计划的机会,也就无法进一步提高销售额。6.4解:建立原假设与备择假设为:,;12:0H12:1H(1)检验统计量<,在5%的显著性水平83.1253.01289.11z65.105.0zz下,拒绝原假设,既有足够的证据认为新的教学方法使100米成绩有所提高。(2)利用P值决策。用【NORMSDIST】计算出的P值为0.0337<=0.05,83.1z拒绝原假设,有足够的证据认为新的教学方法使100米成绩有所提高,与统计量决策结果一致。6.5解:建立原假设与备择假设为:;400:0H400:1H(1)检验的临界值是,检验统计量,所以645.105.0z645.133.325/130400420z拒绝原假设,即在5%的显著性水平下,认为该化肥能够使小麦增产。(2)利用P值决策。用【NORMSDIST】计算出的P值为0.0004<=0.05,所以33.3z拒绝原假设,即在5%的显著性水平下,认为该化肥能够使小麦增产,与统计量决策结果一致。6.6建立原假设与备择假设为:;400:0H400:1H,由Excel中的【TINV】函数得33.325/30400420)24(t71.1)24()1(05.0tnt因为,所以拒绝原假设,即在5%的显著性水平下,认为该化肥71.1)24(33.305.0tt能够使小麦增产。(2)利用P值决策。用【TDIST】计算出的P值为0.0014<=0.05,所以拒绝原33.3T假设,即在5%的显著性水平下,认为该化肥能够使小麦增产,与统计量决策结果一致。6.7建立原假设与备择假设为:,8.3:0H8.3:1H(1)检验统计量,所以拒绝原假设,认为645.196.3400/01.18.36.305.0zz该城市平均人口有所下降。(2)利用P值决策。用【NORMSDIST】计算出的P值为0.0000374749<=0.05,33.3Z所以拒绝原假设,即在5%的显著性水平下,认为该城市平均人口有所下降,与统计量决策结果一致。6.8建立原假设与备择假设为:,100:0H100:1H(1)检验统计量,所以拒绝原假设,认为该厂的32.239/251007501.0zz平均成本有所下降。(2)利用P值决策。用【NORMSDIST】计算出的P值为0.001<=0.01,所以拒绝3Z原假设,即在5%的显著性水平下,认为该厂的平均成本有所下降,与统计量决策结果一致。6.9建立原假设与备择假设为:;%96:0H%96:1H(1)检验统计量<,不能拒绝原假设,因此444.045)96.01(96.096.04543z65.105.0z没有充分的理由认为该批皮鞋优质率达到96%,所以不接受该批订货。(2)利用P值决策。用【NORMSDIST】计算出的P值为0.671>=0.05,444.0Z所以不能拒绝原假设,没有充分的理由认为该批皮鞋优质率达到96%,不接受该批订货,与统计量决策结果一致。6.10建立原假设与备择假设为:;%80:0H%80:1H(1)检验统计量<,同时也小于,2475.0200)8.01(8.08.073.0z65.105.0z32.201.0z所以不拒绝原假设,因此没有充分的理由认为超过80%的行人有违章行为。(2)利用P值决策。用【NORMSDIST】计算出的P值为0.4022>=0.052475.0Z或=0.01,所以不拒绝原假设,没有充分的理由认为超过80%的行人有违章行为,与统计量决策结果一致。第7章相关与回归分析二单项选择题1-5BCBAC6-10CCABA11-15BCCAA16-20CCBDB21-25CBBAA26_30BCBBA31_35CBABA36_40BAAAA三计算分析题7.1(1)散点图如下:从散点图可以看出,销售收入与广告费用之间为正的线性相关关系。(2)利用Excel的“CORREL”函数计算的相关系数为。947663.0r(3)首先提出如下假设:,。0:0H0:1H计算检验的统计量272.7947663.0128947663.01222rnrt当时,。由于检验统计量,05.09687.2)28(205.0t9687.2272.72tt拒绝原假设。表明产量与生产费用之间的线性关系显著。7.2(1)散点图如下:020406080100010203040复习时间考试分数从散点图可以看出,复习时间与考试分数之间为正的线性相关关系。(2)利用Excel的“CORREL”函数计算的相关系数为。相关系数8621.0r,表明复习时间与考试分数之间有较强的正线性相关关系。8.0r7.3(1)散点图如下:7.3利用Excel的“CORREL”函数计算的相关系数为。9489.0r由Excel输出的回归结果如下表:得到的回归方程为:xy003585.0118129.0ˆ回归系数表示运送距离每增加1公里,运送时间平均增加0.003585003585.0ˆ1天。7.4(1)散点图如下:020406080100120140020406080100航班正点率投诉次数从散点图可以看出,航班正点率与被投诉次数之间为负的线性相关关系。(2)由Excel输出的回归结果如下表:回归统计MultipleR0.868643RSquare0.75454AdjustedRSquare0.723858标准误差18.88722观测值10方差分析 dfSSMSFSignificanceF回归分析18772.5848772.58424.591870.001108残差82853.816356.727总计911626.4    Coefficients标准误差tStatP-valueIntercept430.189272.154835.9620290.000337XVariable1-4.700620.947894-4.959020.001108得到的回归方程为:。回归系数表示航班正点率每xy7.41892.430ˆ7.4ˆ1增加1%,顾客投诉次数平均下降4.7次。(3)回归系数检验的P-Value=0.001108<),拒绝原假设,回归系数显05.0著。(4)(次)。1892.54807.41892.430ˆ80y(5)当时,,。置信区间为:05.0306.2)210(205.0t18.88722es48.161892.54397.024)75.8680(10118.88722306.21892.54)()(1ˆ2122020niiexxxxnsty即(37.7,70.7)。预测区间为:57.461892.54397.024)75.8680(101118.88722306.21892.54)()(11ˆ2122020niiexxxxnsty即(7.6,100.8)。7.5Excel输出的回归结果如下:回归统计MultipleR0.968167RSquare0.937348AdjustedRSquare0.916463标准误差3.809241观测值5方差分析 dfSSMSFSignificanceF回归分析1651.2691651.26944.88310.00678518残差343.5309414.51031总计4694.8    Coefficients标准误差tStatP-valueIntercept13.625414.3994283.0970860.053417XVariable12.3029320.3437476.6994910.006785由上述结果可知:回归方程为,回归系数表明,xy3029.26254.13ˆx每增加一个单位平均增加2.3029个单位;判定系数,表y%74.932R明回归方程的拟合程度较高;估计标准误差,表明用来预8092.3esx测时平均的预测误差为3.8092。y7.5(1)方差分析表中所缺的数值如下:变差来源dfSSMSFSignificanceF回归11622708.61622708.6359.192.17E-09残差1040158.074015.807——总计111642866.67———(2)根据方差分析表计算的判定系数。%76.989876.067.164286660.16227082SSTSSRR表明汽车销售量的变差中有98.7%是由于广告费用的变动引起的。(3)相关系数可由判定系数的平方根求得:。9935.02Rr(4)回归方程为:。回归系数表示广告xy420211.16891.363ˆ420211.1ˆ1费用每增加一个单位,销售量平均增加1.420211个单位。(5)由于SignificanceF=2.17E-09<,表明广告费用与销售量之间的线05.0性关系显著。7.6当时,。100x96.2100037895.08295.0ˆ4y当,。05.03979.2)225()2(205.02tnt的平均值的95%的置信区间为:y即(1.98,3.94)。(2)当时,95x77.295037895.08295.0ˆ4y。当,。05.03979.2)225()2(205.02tnt的平均值的95%的预测区间为:y85.477.2154399.6)3.12095(25119799.13979.277.2)()(11ˆ2122020niiexxxxnsty(-2.08,7.62)98.096.2154399.6)3.120100(2519799.13979.296.2)()(1ˆ2122020niiexxxxnsty第八章第8章时间序列分析和预测8.1(1)从时间序列图可以看出,国家财政用于国防的支出额大体上呈指数上升趋势。(2)年平均增长率为:。%1.161%1.116131.2901.49511190nnYYG(3)。2271.5748%)1.161(1.49512ˆ010Y8.2(1)(2)2010年的预测值为:8.6945347457.6372.7494.7623.7534.5712010F(3)由Excel输出的指数平滑预测值如下表:2010年时的预测值为:3.024.6679.679)3.01(7.6373.0)1(2010ttFYF时的预测值为:5.085.683730)5.01(7.6375.0)1(2010ttFYF比较误差平方可知,更合适。5.08.3(1)第19个月的3期移动平均预测值为:33.63031891366064458719F(2)由Excel输出的指数平滑预测值如下表:月份营业额预测0.3误差平方预测0.4误差平方预测0.5误差平方12952283295.0144.0295.0144.0295.0144.03322291.4936.4290.21011.2289.01089.04355300.62961.5302.92712.3305.52450.35286316.9955.2323.81425.2330.31958.16379307.65093.1308.74949.0308.15023.37381329.02699.4336.81954.5343.61401.68431344.67459.6354.55856.2362.34722.39424370.52857.8385.11514.4396.6748.510473386.67468.6400.75234.4410.33928.711470412.53305.6429.61632.9441.7803.112481429.82626.2445.81242.3455.8633.513449445.115.0459.9117.8468.4376.914544446.39547.4455.57830.2458.77274.815601475.615724.5490.912120.5501.49929.416587513.25443.2534.92709.8551.21283.317644535.411803.7555.87785.2569.15611.718660567.98473.4591.14752.7606.52857.5合计——87514.7—62992.5—50236时的预测值:3.0,误差均方=87514.75.5959.567)3.01(6603.019F时的预测值:4.0,误差均方=62992.57.6181.591)4.01(6604.019F时的预测值:5.0,误差均方=50236。3.6335.606)5.01(6605.019F比较各误差平方可知,更合适。5.0(3)根据最小二乘法,利用Excel输出的回归结果如下:回归统计MultipleR0.9673RSquare0.9356AdjustedRSquare0.9316标准误差31.6628观测值18方差分析 dfSSMSFSignificanceF回归分析1232982.5232982.5232.39445.99E-11残差1616040.491002.53总计17249022.9    Coefficients标准误差tStatP-valueLower95%Upper95%Intercept239.7320315.5705515.39655.16E-11206.7239272.7401XVariable121.9287931.43847415.244495.99E-1118.8793624.97822。tYt9288.2173.239ˆ8.4(1)趋势图如下:(2)从趋势图可以看出,我国财政用于文教、科技、卫生事业费支出额呈现指数增长趋势,因此,选择指数曲线。xcy1635.1*79.3478.5(1)原煤产量趋势图如下:从趋势图可以看出,拟合二阶曲线比较合适。(2)用Excel求得的二阶曲线趋势方程为:当t=21时,y=0.077*21*21-0.7047*21+12.874=33.957-14.7987+12.874=32.03238.6(1)趋势图如下:从趋势图可以看出,每一年的各月份数据没有趋势存在,但从2006——2010年的变化看,订单金额存在一定的线性趋势。(2)由于是预测各月份的订单金额,因此采用移动平均法或指数平滑法比较合适。(3)用Excel采用12项移动平均法预测的结果为:。4.711/2011F用Excel采用指数平滑法()预测的预测结果为:。4.05.721/2011F8.7各季节指数如下:1季度2季度3季度4季度季节指数0.75170.85131.23431.1627季节变动图如下:00.30.60.91.21.51234季度季节指数根据分离季节因素后的数据计算的趋势方程为:tYt7064.16392.2043ˆ
本文档为【统计学原理与实务-徐静霞】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: ¥17.0 已有0 人下载
最新资料
资料动态
专题动态
个人认证用户
盼盼书屋
暂无简介~
格式:pdf
大小:574KB
软件:PDF阅读器
页数:0
分类:教育学
上传时间:2021-03-18
浏览量:25