首页 统计学导论第二版课后答案-曾五一

统计学导论第二版课后答案-曾五一

举报
开通vip

统计学导论第二版课后答案-曾五一1统计学导论(第二版)习题详解第一章一、判断题一、判断题1.统计学是数学的一个分支。答:错。统计学和数学都是研究数量关系的,两者虽然关系非常密切,但两个学科有不同的性质特点。数学撇开具体的对象,以最一般的形式研究数量的联系和空间形式;而统计学的数据则总是与客观的对象联系在一起。特别是统计学中的应用统计学与各不同领域的实质性学科有着非常密切的联系,是有具体对象的方法论。。从研究方法看,数学的研究方法主要是逻辑推理和演绎论证的方法,而统计的方法,本质上是归纳的方法。统计学家特别是应用统计学家则需要深入实际,进行调查或实...

统计学导论第二版课后答案-曾五一
1统计学导论(第二版)习题详解第一章一、判断题一、判断题1.统计学是数学的一个分支。答:错。统计学和数学都是研究数量关系的,两者虽然关系非常密切,但两个学科有不同的性质特点。数学撇开具体的对象,以最一般的形式研究数量的联系和空间形式;而统计学的数据则总是与客观的对象联系在一起。特别是统计学中的应用统计学与各不同领域的实质性学科有着非常密切的联系,是有具体对象的方法论。。从研究方法看,数学的研究方法主要是逻辑推理和演绎论证的方法,而统计的方法,本质上是归纳的方法。统计学家特别是应用统计学家则需要深入实际,进行调查或实验去取得数据,研究时不仅要运用统计的方法,而且还要掌握某一专门领域的知识,才能得到有意义的成果。从成果评价标准看,数学注意方法推导的严谨性和正确性。统计学则更加注意方法的适用性和可操作性。2.统计学是一门独立的社会科学。答:错。统计学是跨社会科学领域和自然科学领域的多学科性的科学。3.统计学是一门实质性科学。答:错。实质性的科学研究该领域现象的本质关系和变化规律;而统计学则是为研究认识这些关系和规律提供数量分析的方法。4.统计学是一门方法论科学。答:对。统计学是有关如何测定、收集和分析反映客观现象总体数量的数据,以帮助人们正确认识客观世界数量规律的方法论科学。5.描述统计是用文字和图表对客观世界进行描述。答:错。描述统计是对采集的数据进行登记、审核、整理、归类,在此基础上进一步计算出各种能反映总体数量特征的综合指标,并用图表的形式表示经过归纳分析而得到的各种有用信息。描述统计不仅仅使用文字和图表来描述,更重要的是要利用有关统计指标反映客观事物的数量特征。6.对于有限总体不必应用推断统计方法。答:错。一些有限总体,由于各种原因,并不一定都能采用全面调查的方法。例如,某一批电视机是有限总体,要检验其显像管的寿命。不可能每一台都去进行观察和实验,只能应用抽样调查方法。7.经济社会统计问题都属于有限总体的问题。答:错。不少社会经济的统计问题属于无限总体。例如要研究消费者的消费倾向,消费者不仅包括现在的消费者而且还包括未来的消费者,因而实际上是一个无限总体。8.理论统计学与应用统计学是两类性质不同的统计学。答:对。理论统计具有通用方法论的性质,而应用统计学则与各不同领域的实质性学科2有着非常密切的联系,具有复合型学科和边缘学科的性质。二、单项选择题1.社会经济统计学的研究对象是(A)。A.社会经济现象的数量方面B.统计工作C.社会经济的内在规律D.统计方法2.考察全国的工业企业的情况时,以下标志中属于不变标志的有(A)。A.产业分类B.职工人数C.劳动生产率D.所有制3.要考察全国居民的人均住房面积,其统计总体是(A)。A.全国所有居民户B.全国的住宅C.各省市自治区D.某一居民户4.最早使用统计学这一学术用语的是(B)。A.政治算术学派B.国势学派C.社会统计学派D.数理统计学派三、分析问答题1.试分析以下几种统计数据所采用的计量尺度属于何种计量尺度:人口、民族、信教人数、进出口总额、经济增长率。答:定类尺度的数学特征是“=”或“”,所以只可用来分类,民族就是定类尺度数据,它可以区分为汉、藏、回等民族。定序尺度的数学特征是“>”或“<”,所以它不但可以分类,还可以反映各类的优劣和顺序,教育程度属于定序尺度。定距尺度的主要数学特征是“+”或“-”,它不但可以排序,还可以用确切的数值反映现象在两方面的差异,所以,人口数、信教人数、进出口总额都是定距尺度数据;定比尺度的主要数学特征是“”或“”,它通常都是相对数或平均数,所以经济增长率是定比尺度数据。2.请举一个实例说明品质标志、数量标志、质量指标、数量指标之间有怎样的区别与联系。答:例如考察全国人口的情况,全国所有的人为统计总体,而每个人就是总体单位,每个人都有许多属性和特征,比如民族、性别、文化程度、年龄、身高、体重等,这些就是标志,标志可以分为品质标志和数量标志,性别、民族和文化程度都是品质标志,年龄、身高、体重等则是数量标志;而指标是说明统计总体数量特征的,用以说明全国人口的规模如人口总数等指标就是数量指标,而用以说明全国人口某一方面相对水平的相对量指标和平均量指标如死亡率、出生率等指标就是质量指标,质量指标通常是在数量指标的派生指标。3.请举一个实例说明统计总体、样本、单位的含义,并说明三者之间的联系。答:例如考察全国居民人均住房情况,全国所有居民构成统计总体,每一户居民是总体单位,抽查其中5000户,这被调查的5000户居民构成样本。3第二章一、单项选择题1.统计调查对象是(C)。A.总体各单位标志值B.总体单位C.现象总体D.统计指标2.我国统计调查体系中,作为“主体”的是(A)。A.经常性抽样调查B.必要的统计报表C.重点调查及估计推算等D.周期性普查3.要对某企业的生产设备的实际生产能力进行调查,则该企业的“生产设备”是(A)。A.调查对象B.调查单位C.调查项目D. 报告 软件系统测试报告下载sgs报告如何下载关于路面塌陷情况报告535n,sgs报告怎么下载竣工报告下载 单位二、多项选择题1.下面哪些现象适宜采用非全面调查?(A.B.C.D)A.企业经营管理中出现的新问题B.某型号日光灯耐用时数检查C.平均预期寿命D.某地区森林的木材积蓄量2.抽样调查(A.D)。A.是一种非全面调查B.是一种不连续性的调查C.可以消除抽样误差D.概率抽样应遵循随机原则3.洛伦茨曲线(A.B.C)。A.是一种累计曲线B.可用于反映财富分布的曲线C.用以衡量收入分配公平与否D.越接近对角线基尼系数越大三、分析判断题1.有人说抽样调查“以样本资料推断总体数量特征”肯定比全面调查的误差大,你认为呢?答:这种说法不对。从理论上分析,统计上的误差可分为登记性误差、代表性误差和推算误差。无论是全面调查还是抽样调查都会存在登记误差。而代表性误差和推算误差则是抽样调查所固有的。这样,从表面来看,似乎全面调查的准确性一定会高于统计估算。但是,在全面调查的登记误差特别是其中的系统误差相当大,而抽样调查实现了科学化和 规范 编程规范下载gsp规范下载钢格栅规范下载警徽规范下载建设厅规范下载 化的场合,后者的误差也有可能小于前者。我国农产量调查中,利用抽样调查资料估算的粮食产量数字的可信程度大于全面报表的可信程度,就是一个很有说服力的事例。2.过去统计报表在我国统计调查体系中占据统治地位多年,为什么现在要缩小其使用范围?答:经济体制改革以前,统计报表制度是我国统计调查最主要的方式,它在我国统计调查体4系中占据统治地位多年。近年来,随着社会主义市场经济的发展,统计调查单位变动频繁,再加上决策主体和利益主体的多层次化,各方面对统计报表数字真实性的干扰明显增加,从而不仅给报表调查带来不少困难,同时也影响了统计数据的准确性,统计报表的局限性日渐暴露。所以,为适应社会主义市场经济日新月异发展变化的需要,提高统计数据的准确性和时效性,现行的统计调查体系以抽样调查为主体,也就缩小了统计报表制度的使用范围。3.对足球赛观众按男、女、老、少分为四组以分析观众的结构,这种分组方法合适吗?答:这种分组方法不合适。统计分组应该遵循“互斥性原则”,本题所示的分组方式违反了“互斥性原则”,例如,一观众是少女,若按以上分组,她既可被分在女组,又可被分在少组。4.以一实例说明统计分组应遵循的原则。答:统计分组必须遵循两个原则:穷尽原则和互斥原则。穷尽原则要求总体中的每一个单位都应有组可归,互斥原则要求总体中的任何一个单位只能归属于某一组,而不能同时归属于几个组。例如,把从业人员按文化程度分组,分为小学毕业、中学毕业(含中专)和大学毕业三组,那么,文盲或识字不多的以及大学以上的学历者则无组可归,这就不符合穷尽原则。应该分为文盲或识字不多、小学毕业、中学毕业(含中专)和大专、大学以及研究生毕业四组,才符合穷尽原则。又如,商场把鞋子分为男鞋、女鞋和童鞋,这就不符合互斥原则,因为童鞋也有男、女鞋之分,一双女童鞋既可归属于童鞋组,又可属于女鞋。可以先按男鞋、女鞋分组,再分别对男鞋、女鞋分为成人鞋和童鞋,形成复合分组,这才符合互斥原则。四、计算题抽样调查某地区50户居民的月人均可支配收入(单位:元)数据资料如下:8869289999469508641050927949852102792897881610009181040854110090086690595489010069269009998861120893900800938864919863981916818946926895967921978821924651850要求:(可利用Excel)(1)试根据上述资料编制次(频)数分布和频率分布数列。(2)编制向上和向下累计频数、频率数列。(3)绘制直方图、折线图、曲线图和向上、向下累计图。(4)根据图形说明居民月人均可支配收入分布的特征。解:(1)编制次(频)数分布和频率分布数列。5次数分布表居民户月消费品支出额(元)次(频)数频率(%)800以下800~8508509~00900~950950~10001000~10501050~11001100以上141218841228243616824合计50100.00(2)编制向上和向下累计频数、频率数列。(3)绘制直方图、折线图、曲线图和向上、向下累计图。主要操作步骤:①次数和频率分布数列输入到Excel。②选定分布数列所在区域,并进入图表向导,在向导第1步中选定“簇状柱形图”类型,单击“完成”,即可绘制出次数和频率的柱形图。③将频率柱形图绘制在次坐标轴上,并将其改成折线图。主要操作步骤:在“直方图和折线图”基础上,将频率折线图改为“平滑线散点图”即可。主要操作步骤:①将下表数据输入到Excel。组限向上累计向下累计750050800149850545900173395035151000437105047311004821150500②选定所输入的数据,并进入图表向导,在向导第1步中选定“无数据点平滑线散点图”类型,单击“完成”,即可绘制出累计曲线图。67(4)曲线图说明居民月人均可支配收入分布呈钟型分布。五、案例分析收集有关统计数据,对我国近年来居民收入分配的状况进行统计分析。答:略第三章一、单项选择题1.由变量数列计算加权算术平均数时,直接体现权数的实质的是(D)。A总体单位数的多少B各组单位数的多少C各组变量值的大小D各组频率的大小2.若你正在筹划一次聚会,想知道该准备多少瓶饮料,你最希望得到所有客人需要饮料数量的(A)。A均值B中位数C众数D四分位数3.2004年某地区甲、乙两类职工的月平均收入分别为1060和3350元,标准差分别为230和680元,则职工平均收入的代表性(B)。A甲类较大B乙类较大C两类相同D在两类之间缺乏可比性4.假如学生测验成绩记录为优、良、及格和不及格,为了说明全班同学测验成绩的水平高低,其集中趋势的测度(B)。A可以采用算术平均数B可以采用众数或中位数C只能采用众数D只能采用四分位数5.一组数据呈微偏分布,且知其均值为510,中位数为516,则可推算众数为(A)。A528B526C513D5126.当分布曲线的峰度系数小于0时,该分布曲线称为(C)。8A正态曲线B尖顶曲线C平顶曲线D.U型曲线二、判断分析题1.有人调查了456位足球运动员某年的收入,发现他们的年收入以24.7万元为分布中心,但超过24.7万元的只有121人。试问,这里的24.7万元指的是哪一种集中趋势指标?你认为球员收入分布呈什么形状?为什么?答:均值。呈右偏分布。由于存在极大值,使均值高于中位数和众数,而只有较少的数据高于均值。2.任意一个变量数列都可以计算其算术平均数、中位数和众数,并用以衡量变量的集中趋势吗?答:不是。每个变量数列都可以计算其算术平均数和中位数,但众数的计算和应用是有前提条件的,存在极端值时,用算术平均数测度数据的集中趋势也有局限性。3.设一组数据的均值为100,标准差系数为10%,四阶中心矩为34800,是否可认为该组数据的分布为正态分布?答:峰度系数48.03%)10100(348003444mK,属于尖顶分布。4.某段时间内三类股票投资基金的年平均收益和标准差数据如下表:股票类别平均收益率(%)标准差(%)A5.632.71B6.944.65C8.239.07根据上表中平均收益和标准差的信息可以得出什么结论?假如你是一个稳健型的投资者,你倾向于购买哪一类投资基金?为什么?答:高收益往往伴随着高风险。稳健型的投资者应倾向于购买A类投资基金,因为其标准差最小,也就是风险最小。5.一般说来,一个城市的住房价格是高度偏态分布的,为了了解房屋价格变化的走势,应该选择住房价格的平均数还是中位数?如果为了确定交易税率,估计相应税收总额,又应该做何种选择?答:为了了解房屋价格变化的走势,宜选择住房价格的中位数来观察,因为均值受极端值影响;如果为了确定交易税率,估计相应税收总额,应利用均值,因为均值才能推算总体有关的总量。6.某企业员工的月薪在1000到4000元之间。现董事会决定给企业全体员工加薪。如果给每个员工增加200元,则:(1)全体员工薪金的均值、中位数和众数将分别增加多少?(2)用极差、四分位差、平均差和方差、标准差分别来衡量员工薪金的差异程度,加薪前后各个变异指标的数值会有什么变化?9(3)加薪前后员工薪金分布的偏度和峰度会有无变化?(4)如果每个员工加薪的幅度是各自薪金的5%,则上述三个问题的 答案 八年级地理上册填图题岩土工程勘察试题省略号的作用及举例应急救援安全知识车间5s试题及答案 又有什么不同?答:(1)都是增加200元。(2)都不变。(3)均无变化。(4)如果每个员工加薪的幅度是各自薪金的5%,则均值、中位数和众数都将增加5%;极差、四分位差、平均差和标准差也会相应增加5%,方差将增加10.25%;偏度和峰度都不变。三、计算题1.某公司下属两个企业生产同一种产品,其产量和成本资料如下:基期报告期单位成本(元)产量(吨)单位成本(元)产量(吨)甲企业60012006002400乙企业70018007001600试分别计算报告期和基期该公司生产这种产品的总平均成本,并从上述数据说明总平均成本变化的原因。解:基期总平均成本=1800120018007001200600=660报告期总平均成本=1600240016007002400600=640总平均成本下降的原因是该公司产品的生产结构发生了变化,即成本较低的甲企业产量占比上升而成本较高的乙企业产量占比相应下降所致。2.设某校某专业的学生分为甲、乙两个班,各班学生的数学成绩如下:甲班60,79,48,76,67,58,65,78,64,75,76,78,84,48,25,90,98,70,77,78,68,74,95,85,68,80,92,88,73,65,72,74,99,69,72,74,85,67,33,94,57,60,61,78,83,66,77,82,94,55,76,75,80,61乙班91,74,62,72,90,94,76,83,92,85,94,83,77,82,84,60,60,51,60,78,78,80,70,93,84,81,81,82,85,78,80,72,64,41,75,78,61,42,53,92,75,81,81,62,88,79,98,95,60,71,99,53,54,90,60,93要求:(1)分别计算描述两个班成绩分布特征的各种统计指标,并进行比较分析;(2)分别绘制两个班成绩分布的箱线图。解:利用EXCEL的“描述统计”可得两个班及全体学生的成绩分布特征的各种统计指标如下表(注:其中方差、标准差、峰度和偏度都是样本统计量)。甲班乙班全部平均72.70476.01874.391中位数74.578.576.5众数786078标准差14.68114.25714.496方差215.53203.25210.13峰度1.6636-0.3050.685偏度-0.83-0.59-0.69910区域745874最小值254125最大值999999求和392642578183观测数54561103.根据第2小题的数据,试求该专业全部学生的总平均成绩和方差,并利用本题数据验证:分组条件下,总体平均数与各组平均数的关系,以及总体方差与各组方差、组间方差的关系。解:根据总体方差的计算公式nxxnii122)(可得:5418.211542593.114232甲;6247.199569821.111782乙全部学生成绩的方差2199.208110193.229042全部4749.205110566247.199545418.2111122kiikiiinnkiikiiinnxxB1122)(11056)3909.740179.76(54)3909.747037.72(22=2.745总体方差(208.2199)=组内方差平均数(205.4749)+组间方差(2.745)4.根据第2小题的数据,分别编制两个班成绩的组距数列(组距为10),然后由组距数列计算反映数据分布特征的各个指标,并观察与第2题所得到的计算结果是否相同?为什么?解:两个班成绩的组距数列如下表所示:成绩甲班人数(人)乙班人数(人)40以下2040-502250-603460-7013970-80191480-9081590以上712合计5456由上述组距数列计算的主要分布特征指标如下表所示:平均成绩方差标准差甲班72.963207.61414.409乙班77.857186.89513.67111与第2题所得到的两个班的平均数都不相同,这是因为由组距数列计算时,用组中值代替组平均数,假定组内变量值均匀分布或对称分布,与实际分布情况有出入,所以计算结果是近似值。方差和标准差也与第2~3题所得到的计算结果不相同,这主要是因为由组距数列计算时,用组中值代替组内各变量值,忽略了组内差异,只考虑了组间差异;此外第2题利用EXCEL的“描述统计”得到的方差、标准差是样本统计量,与总体方差、标准差的计算公式有差异。5.某商贸公司从产地收购一批水果,分等级的收购价格和收购金额如下表,试求这批水果的平均收购价格。水果等级收购单价(元/千克)收购额(元)甲2.0012700乙1.6016640丙1.308320合计——37660解:(元)收购总量收购总额6268.130.1832060.11664000.21270083201664012700)()(11kiiiikiiiXfXfXX6.某中学校正在准备给一年级新生定制校服。男生校服分小号、中号和大号三种规格,分别适合于身高在160cm以下、160~168cm之间和168cm以上的男生。已知一年级新生中有1200名男生,估计他们身高的平均数为164cm,标准差为4cm。试由此粗略估算三种规格男生校服应该分别准备多少套(按每人1套计算)?解:身高分布通常为钟形分布,按经验法则近似估计结果如下:规格身高分布范围比重数量(套)小号160以下0.1585190.2≈190中号160-168均值±1*标准差0.6830819.6≈820大号168以上0.1585190.2≈190合计————1.000012007.平均数和方差一般只能对数值型变量进行计算。但若将是非变量(也称为是非标志)的两种情况分别用1和0来表示,则对是非变量也可以计算其平均数和对应的方差、标准差。试写出有关计算公式。解:用1代表“是”(即具有某种特征),0代表“非”(即不具有某种特征)。设总次数为N,1出现次数为N1,频率(N1/N)记为P。由加权公式来不难得出:是非变量的均值=P;方差=P(1-P);标准差=)1(PP。12第五章一、选择题(可选多项)1.以下属于概率抽样的有(B、C)。A.网民自由参加的网上调查B.体育彩票摇奖C.按随机原则组织的农产量调查D.街头随意的采访2.样本统计量的标准差与抽样极限误差间的关系是(D)。A.样本统计量的标准差大于极限误差B.样本统计量的标准差等于极限误差C.样本统计量的标准差小于极限误差D.样本统计量的标准差可能大于、等于或小于极限误差3.在其它条件不变的情况下,如果重复抽样的极限误差缩小为原来的二分之一,则样本容量(A)。A.扩大为原来的4倍B.扩大为原来的2倍C.缩小为原来的二分之一D.缩小为原来的四分之一4.当样本单位数充分大时,样本估计量充分地靠近总体指标的可能性趋于1,称为抽样估计的(B)。A.无偏性B.一致性C.有效性D.充分性5.抽样估计的误差(A、C)。A.是不可避免要产生的B.是可以通过改进调查方法消除的C.是可以事先计算的D.只有调查结束之后才能计算二、计算题1.根据长期实验,飞机的最大飞行速度服从正态分布。现对某新型飞机进行了15次试飞,测得各次试飞时的最大飞行速度(米/秒)为:422.2417.2425.6425.8423.1418.7428.2438.3434.0412.3431.5413.5441.3423.0420.3试对该飞机最大飞行速度的数学期望值进行区间估计(置信概率0.95)。解:样本平均数X=425XS=Sn=8.4882.1916151510.05/2()t2.144813==/2(n-1)Stn=2.1448×2.1916=4.7005所求μ的置信区间为:425-4.7005<μ<425+4.7005,即(420.2995,429.7005)。2.自动车床加工某种零件,零件的长度服从正态分布。现在加工过程中抽取16件,测得长度值(单位:毫米)为:12.1412.1212.0112.2812.0912.1612.0312.0112.0612.1312.0712.1112.0812.0112.0312.06试对该车床加工该种零件长度值的数学期望进行区间估计(置信概率0.95)。解:因为零件长度服从正态分布,95%置信区间为:1,12/2/ntnSXntnSX其中08687.12X,07068416.0s,151n,1315.215025.0t即:1315.2407068416.008687.12,1315.2407068416.008687.1212454.12,04913.123.用同样方式掷某骰子600次,各种点数出现频数如下:点数123456合计出现频数601001508090120600试对一次投掷中发生1点的概率进行区间估计(置信概率0.95)。解:n=600,p=0.1,nP=60≥5,可以认为n充分大,α=0.05,0.02521.96zz。0.10.91.960.0122600因此,一次投掷中发生1点的概率的置信区间为0.1-0.0122<<0.1+0.0122,即(0.0878,0.1122)。4.若在5.2题中,零件长度的技术标准为12.10毫米,公差范围规定为12.10±0.05毫米。试根据样本数据对该车床加工该种零件发生长度不合格的概率进行区间估计(置信概率0.95)。解:142020:H,2021:H标准差的2倍=0.05,标准差为0.025,16个数据的样本方差是var(X)=0.00499625在2020:H下1~122022nSn15*var(X)/(0.025^2)=119.91,落在95%置信区间(6.26,27.49)之外。拒绝零假设。5.某微波炉生产厂家想要了解微波炉进入居民家庭生活的深度。他们从某地区已购买了微波炉的2200个居民户中用简单随机不还原抽样方法以户为单位抽取了30户,询问每户一个月中使用微波炉的时间。调查结果依次为(分钟):30045090050700400520600340280380800750550201100440460580650430460450400360370560610710200试估计该地区已购买了微波炉的居民户平均一户一个月使用微波炉的时间。解:根据已知条件可以计算得:14820yn1ii8858600yn1i2i估计量nii11yyn=301*14820=494(分钟)估计量的估计方差2snv()v(y)(1)nN=301*291537520*)2200301(=1743.1653其中2n1i2in1i2i2yn-y1-n1y-y1-n1s=2494*308858600*1301=291537520156.某大学有本科学生4000名,从中用简单随机抽样方法抽出80人,询问各人是否有上因特网经历。调查结果为,其中有8人无此经历。试估计全校本科学生中无上网经历的学生所占比率。解:①计算样本数据n=80a=8p=a/n=8/80=0.1②估计量1.0ˆpP③估计量的估计方差001116.040008011809.01.011)1(Nnnpppv7.某中学老师想要考察该校学生英语考试成绩的离散程度,先随机抽取了41位考生,并求出它们成绩的标准差S=12.设全校学生英语成绩服从正态分布。试根据上述资料,对全校学生英语考试成绩的离散程度即总体方差进行置信度为95%的区间估计。解:2(40)0.97524.433,2(40)0.02559.342,置信度为0.95的置信区间为:221122212(1)(1),nnnSnS=2240124012,(97.064,235.747)59.34224.4338.某城市有非农业居民210万户,从中用简单随机抽样方法抽取出623户调查他们住宅装修的意向。调查结果表明,其中有350户已经装修完毕,近期不再有新的装修意向;有78户未装修也不打算装修;其余的有近期装修的意向。试估计该城市非农业居民中打算在近期进行住宅装修的居民户数。解:①计算样本数据n=623a=623-350-78=195p=a/n=8195/623=0.3130②估计量6573033130.02100000ˆNpA(户)③估计量的估计方差1524124413210000062311623)3130.01(3130.0210000011)1(ˆ22NnnppNAv9.一个市场分析人员想了解某一地区看过某一电视广告的家庭所占的比率。该地区共有居民1500户,分析人员希望以95%的置信度对总体比率进行估计,并要求估计的误差不16超过5个百分点。另外,根据先前所做的一个调查,有25%的家庭看过该广告。试根据上述资料,计算要进行总体比率的区间估计,应当抽取的样本单位数。解:22222222115001.960.25(10.25)115000.051.960.25(10.25)PNzPPnNzPP241.695应抽取242户进行调查。第六章一、单项选择题某种电子元件的使用者要求,一批元件的废品率不能超过2‰,否则拒收。1.使用者在决定是否接收而进行抽样检验时,提出的原假设是(B)。A.H0:P≥2‰B.H0:P≤2‰C.H0:P=2‰D.其他2.对上述检验问题,标准正态检验统计量的取值区域分成拒绝域和接受域两部分。拒绝域位于接受域之(B)。A.左侧B.右侧C.两侧D.前三种可能性都存在3.在上述检验中,0.05显著性水平对应的标准正态分布临界值是(A)。A.1.645B.±1.96C.-1.645D.±1.6454.若算得检验统计量的样本值为1.50,电子元件的实际废品率是3.5‰,则会出现-(D)。A.接受了正确的假设B.拒绝了错误的假设C.弃真错误D.取伪错误5.使用者偏重于担心出现取伪错误而造成的损失。那么他宁可把显著性水平定得(A)。A.大B.小C.大或小都可以D.先决条件不足,无法决定二、问答题1.某县要了解该县小学六年级学生语文理解程度是否达到及格水平(60分)。为此,从全体六年级学生中用简单随机放还抽样方法抽取了400人进行测试,得到平均成绩61.6分,标准差14.4分。要根据样本数据对总体参数的论断值(语文理解程度的期望值60分)作显著性检验,显著水平先后按α=0.05和α=0.01考虑。请就上面的工作任务回答下列问题:(1)指出由样本数据观测到何种差异;(2)指出出现这种差异的两种可能的原因;17(3)针对这两种可能的原因提出相应的两种假设(原假设和备择假设),指出所提出的假设对应着单侧检验还是双侧检验,说明为什么要用单侧检验或者双侧检验;(4)仿照式(6.7)构造检验统计量(如在那里说明过的:这个检验统计量服从t–分布。不过,由于我们在这里所使用的是一个400人的足够大的样本,因而可以用标准正态分布作为t–分布的近似);(5)计算检验统计量的样本值;(6)根据上述样本值查表确定观测到的显著性水平;(7)用观测到的显著性水平与检验所用的显著性水平标准比较(注意:如果是单侧检验,这个标准用值,如果是双侧检验,这个标准用/2值),并说明,通过比较,你是否认为得到了足以反对“观测到的差异纯属机会变异”这一论断(或是足以反对原假设)的足够的证据?为什么?(8)根据提出的显著性水平建立检验规则,然后用检验统计量的样本值与检验规则比较,重新回答上条的问题;(9)根据上面所做的工作,针对本题的研究任务给出结论性的表述。答:(1)由样本数据观察到的差异样本平均数61.6分,不同于对总体平均值的猜想(60分)。(2)出现这种差异的两种可能的原因第一种可能:总体平均值的确为60分,样本平均数与60分的差异纯属于抽样所产生的机会变异。第二种可能:总体平均值不是60分,样本平均数与60分的差异反映了总体平均值不同于60分的这种真实存在的差异。(3)建立假设①若想了解学生的语文理解程度是否为60分(后来通知学生改为这样写)60:0H等价于真实情况为第一种情况60:1H等价于真实情况为第二种情况上述一组假设对应着双尾检验。用双尾检验的理由是:我们所关心的仅仅是,是否等于60(将=60设为原假设)。若检验统计量的样本值落在检验统计量的概率分布曲线的左尾部(这意味着<60)或右尾部(这意味着>60),都属于我们所关心的情况的对立情况,都需要拒绝原假设。因而要把拒绝域同时放在左、右两个尾部,即,进行双尾检验。②若想了解学生的语文理解程度是否达到或超过60分(教材中原来只写“是否达到”,在理解上容易产生歧义,应加上“或超过”)60:0H其中的等于60等价于真实情况为第一种情况,其中的大于60等价于真实情况为第二种情况60:1H等价于真实情况为第二种情况18上述一组假设对应着左单尾检验。用左单尾检验的理由是:我们所关心的是,是否大于或等于60(将≥60设为原假设)。若检验统计量的样本值落在检验统计量的概率分布曲线的左尾部(这意味着<60),这属于我们所关心的情况的对立情况,需要拒绝原假设;至于检验统计量的样本值落在右尾部(这意味着>60)时,这属于我们所关心的情况,不需要拒绝原假设。因而只把拒绝域放在左尾部,即,进行左单尾检验。(4)构造检验统计量在原假设60:0H成立的条件下,有下列检验统计量服从自由度为n–1=400–1的t分布。由于自由度相当大,故这个分布同标准正态分布非常接近。)1400(~60tnsyt(5)计算检验统计量的样本值n=400y=61.6s=14.422.24004.14606.6160nsyt(6)观察到的显著水平(P-值)查标准正态分布表,z=2.22时阴影面积值为0.4868。故右尾P-值=P(2.22<z<∞)=0.5–0.4868=0.0132左尾P-值=P(2.22>z>–∞)=0.5+0.4868=0.9868(7)用P-值检验规则做检验①学生的语文理解程度是否为60分(0H:=60;1H:≠60)——双尾检验ⅰ)若规定=0.05检验用的显著水平标准为/2=0.05/2=0.025由于右尾P-值=0.0132<0.025,故拒绝原假设。ⅱ)若规定=0.01检验用的显著水平标准为/2=0.01/2=0.005由于右尾P-值=0.0132>0.025,故不能拒绝原假设。②学生的语文理解程度是否达到或超过60分(0H:≥60;1H:<60)——左单尾检验ⅰ)若规定=0.05检验用的显著水平标准为=0.05由于左尾P-值=0.9868>0.05,故不能拒绝原假设。ⅱ)若规定=0.01检验用的显著水平标准为=0.01由于左尾P-值=0.9868>0.01,故不能拒绝原假设。(8)用临界值值检验规则做检验①学生的语文理解程度是否为60分(0H:=60;1H:≠60)——双尾检验19ⅰ)若规定=0.05查标准正态分布表,z/2=z0.05/2=z0.025=1.96,故,拒绝域为96.1,和,96.1,接受域为96.1,96.1。由于z=2.22>1.96,检验统计量的样本值落在拒绝域,故拒绝原假设。ⅱ)若规定=0.01查标准正态分布表,z/2=z0.01/2=z0.005=2.575,故,拒绝域为575.2,和,575.2,接受域为575.2,575.2。由于z=2.22<2.575,检验统计量的样本值落在接受域,故不能拒绝原假设。②学生的语文理解程度是否达到或超过60分(0H:≥60;1H:<60)——左单尾检验ⅰ)若规定=0.05查标准正态分布表,在左尾部有z=z0.05=–1.645,故,拒绝域为645.1,,接受域为,645.1。由于z=2.22>–1.645,检验统计量的样本值落在接受域,故不能拒绝原假设。ⅱ)若规定=0.01查标准正态分布表,在左尾部有z=z0.01=–2.325,故,拒绝域为325.2,,接受域为,325.2。由于z=2.22>–2.325,检验统计量的样本值落在接受域,故不能拒绝原假设。(9)检验结论①学生的语文理解程度是否为60分ⅰ)若规定=0.05样本数据显著地表明,学生的语文理解程度并非恰好为60分。上述结论的双尾显著水平为0.05。ⅱ)若规定=0.01样本数据提供的证据不足以推翻学生的语文理解程度恰好为60分的假设,也就是说,学生的语文理解程度有可能恰好为60分。上述结论的双尾显著水平为0.01。②学生的语文理解程度是否达到或超过60分ⅰ)若规定=0.05样本数据提供的证据几乎完全没有理由推翻学生的语文理解程度达到或超过60分的假设,也就是说,可以认为学生的语文理解程度达到或超过了60分。上述结论的单尾显著水平为0.05。ⅱ)若规定=0.01样本数据提供的证据几乎完全没有理由推翻学生的语文理解程度达到或超过60分的假设,也就是说,可以认为学生的语文理解程度达到或超过了60分。上述结论的单尾显著水平为0.01。2.是否+=1?(这里的是犯弃真错误的概率,是犯取伪错误的概率)请说明为什么是或为什么不是?答:20是在0H成立的总体中检验统计量分布的概率密度曲线属于拒绝域的尾部(一个或两个)面积;是0H不成立的另外某个总体中与前述检验统计量相对应的另外一个统计量分布的概率密度曲线伸入接受域的尾部面积。由于和二者分别属于两个概率密度曲线,因此不会存在二者之和等于1的必然规律。人们熟知的必然关系是:在0H成立的总体的检验统计量分布的概率密度曲线下,有+(1–)=1。这里,和(1–)是上述同一概率密度曲线下分别属于拒绝域和接受域的两个部分的面积。(说明:拒绝域和接受域是实数轴的两个部分,而不是概率密度曲线下的这一部分面积或那一部分面积)3.据一个汽车制造厂家称,某种新型小汽车耗用每加仑汽油至少能行驶25公里,一个消费者研究小组对此感兴趣并进行检验。检验时的前提条件是已知生产此种小汽车的单位燃料行驶里程技术性能指标服从正态分布,总体方差为4。试回答下列问题:(1)对于由16辆小汽车所组成的一个简单随机样本,取显著性水平为0.01,则检验中根据x来确定是否拒绝制造家的宣称时,其依据是什么(即,检验规则是什么)?(2)按上述检验规则,当样本均值为每加仑23、24、25.5公里时,犯第一类错误的概率是多少?答:(1)拒绝域]33.2,(;(2)样本均值为23,24,25.5时,犯第一类错误的概率都是0.01。三、计算题1.一台自动机床加工零件的直径X服从正态分布,加工要求为E(X)=5cm。现从一天的产品中抽取50个,分别测量直径后算得cmx8.4,标准差0.6cm。试在显著性水平0.05的要求下检验这天的产品直径平均值是否处在控制状态(用临界值规则)?解:(1)提出假设5:0H5:1H(2)构造检验统计量并计算样本观测值在5:0H成立条件下:357.2506.058.422nsxZ(3)确定临界值和拒绝域96.1025.0Z21∴拒绝域为,96.196.1,(4)做出检验决策∵96.1357.2025.0ZZ检验统计量的样本观测值落在拒绝域。∴拒绝原假设0H,接受1H假设,认为生产控制水平不正常。2.已知初婚年龄服从正态分布。根据9个人的调查结果,样本均值5.23x岁,样本标准差(以9-1作为分母计算)3s岁。问是否可以认为该地区初婚年龄数学期望值已经超过20岁(05.0,用临界值规则)?解:(1)提出假设0:20H1:20H(2)构造检验统计量并计算样本观测值在0:20H成立条件下2223.5203.539xtsn(3)确定临界值和拒绝域0.05(8)1.86t拒绝域为,86.1(4)做出检验决策∵3.51.86t检验统计量的样本观测值落入拒绝域∴拒绝0H,接受1H,即可以认为该地区初婚年龄数学期望值已经超过20岁。3.从某县小学六年级男学生中用简单随机抽样方式抽取400名,测量他们的体重,算得平均值为61.6公斤,标准差是14.4公斤。如果不知六年级男生体重随机变量服从何种分布,可否用上述样本均值猜测该随机变量的数学期望值为60公斤?按显著性水平0.05和0.01分别进行检验(用临界值规则)。解:05.0时(1)提出假设60:0H2260:1H(2)构造检验统计量并计算样本观测值在60:0H成立条件下:222.24004.14606.6122nsxZ(3)确定临界值和拒绝域96.1025.0Z∴拒绝域为,96.196.1,(4)做出检验决策∵96.1222.2025.0ZZ检验统计量的样本观测值落在拒绝域。∴拒绝原假设0H,接受1H,认为该县六年级男生体重的数学期望不等于60公斤。01.0时(1)提出假设60:0H60:1H(2)构造检验统计量并计算样本观测值在60:0H成立条件下:222.24004.14606.6122nsxZ(3)确定临界值和拒绝域575.2005.0Z∴拒绝域为,575.2575.2,(4)做出检验决策∵575.2222.2005.0ZZ检验统计量的样本观测值落在接受域。∴不能拒绝0H,即没有显著证据表明该县六年级男生体重的数学期望不等于60公斤。234.某公司负责人发现开出去的发票有大量笔误,而且断定这些发票中,有笔误的发票占20%以上。随机抽取400张发票,检查后发现其中有笔误的占18%,这是否可以证明负责人的判断正确?(05.0,用临界值规则)解:(1)提出假设0:20%H1:20%H(2)构造检验统计量并计算样本观测值在0H成立条件下:18%20%1(1)20%80%400pZn(3)确定临界值和拒绝域0.051.645Z拒绝域为1.645,)(4)做出检验决策∵11.645Z检验统计量的样本观测值落在接受域∴接受0H,即不能证明负责人的判断正确。5.从某地区劳动者有限总体中用简单随机放回的方式抽取一个4900人的样本,其中具有大学毕业文化程度的为600人。我们猜测,在该地区劳动者随机试验中任意一人具有大学毕业文化程度的概率是11%。要求检验上述猜测(=0.05,用临界值规则)。解:(1)提出假设%11:0H%11:1H(2)构造检验统计量并计算样本观测值在%11:0H成立条件下:样本比例%2.1249006002468.2490089.011.011.0122.01npZ(3)确定临界值和拒绝域96.1025.0Z∴拒绝域为,96.196.1,(4)做出检验决策∵96.168.2025.0ZZ检验统计量的样本观测值落在拒绝域。∴拒绝原假设0H,接受1H假设,即能够推翻所作的猜测。6.从某市已办理购房贷款的全体居民中用简单随机不放回方式抽取了342户,其中,月收入5000元以下的有137户,户均借款额7.4635万元,各户借款额之间的方差24.999;月收入5000元及以上的有205户,户借款额8.9756万元,各户借款额之间的方差28.541。可见,在申请贷款的居民中,收入较高者,申请数额也较大。试问,收入水平不同的居民之间申请贷款水平的这种差别是一种必然规律,还是纯属偶然?(05.0,用P-值规则和临界值规则)解:205;137n21n;9756.8Y;4635.7X;541.28S;999.24S2221(1)0H和1H22210:H,22211:H检验统计量:1,1~//2122212221nnFSS由于24.999/28.541=0.8758978落在95%置信区间(0.7314319,1.354116)之内。不能拒绝零假设。(2)假设两个总体方差未知,但相等。210:H;211:H在0H下,有2~11212121nntnnSYXw其中25211212222112nnSnSnSw1242.27204136541.28204999.24136631032.2205113711242.279756.84635.7单边p-值:004450087.0340,631032.2pt小于0.05,即落在单边拒绝域649348.1,之内。拒绝0H(不属偶然)。7.用不放回简单随机抽样方法分别从甲、乙二地各抽取200名六年级学生进行数学测试,平均成绩分别为62分、67分,标准差分别为25分、20分,试以0.05的显著水平检验两地六年级数学教学水平是否显著地有差异。解:(1)提出假设210:H211:H(2)构造检验统计量并计算样本观测值在0H成立条件下:209.220020200256267nsnsyy2222212121Z(3)确定临界值和拒绝域96.1025.0Z∴拒绝域为,96.196.1,(4)做出检验决策∵96.1209.2025.0ZZ检验统计量的样本观测值落在拒绝域。∴拒绝原假设0H,接受1H,即两地的教育水平有差异。8.从成年居民有限总体中简单随机不放回地抽取228人,经调查登记知其中男性10026人,女性128人。就企业的促销活动(如折扣销售,抽奖销售,买几赠几,等等)是否会激发本人购买欲望这一问题请他(她)们发表意见。男性中有40%的人、女性中有43%的人回答说促销活动对自己影响不大或没有影响。试问,促销活动对不同性别的人购买欲望的影响是否有差别?(10.0,用临界值规则)解:0H:男女无差别1H:男女有差别128,43.0ˆ,100,4.0ˆ1211npnp两个比例的差的,03.0-ˆ-ˆ21pp1698692.01766065.003.02)ˆ1(ˆ)ˆ1(ˆ|ˆ-ˆ|2211121nppnpppp<1.96不能拒绝0H。9.从甲、乙两地区居民中用不放回简单随机抽样方法以户为单位从甲地抽取400户,从乙地抽取600户居民,询问对某电视节目的态度。询问结果,表示喜欢的分别为40户、30户。试以单侧0.05(双侧0.10)的显著水平检验甲、乙两地区居民对该电视节目的偏好是否显著地有差异。(用临界值规则)解:(1)提出假设210:H211:H(2)构造检验统计量并计算样本观测值在0H成立条件下:07.060040005.06001.0400212211nnnn036.3)60014001(93.0*07.01.005.01112112nnZ(3)确定临界值和拒绝域645.105.0Z∴拒绝域为,645.1645.1,(4)做出检验决策27∵645.1036.305.0ZZ检验统计量的样本观测值落在拒绝域。∴拒绝原假设0H,接受1H,即甲乙两地居民对该电视节目的偏好有差异。10.某企业为了扩大市场占有率,为开展产品促销活动,拟研究三种广告宣传形式即街头标牌广告、公交车广告和随报刊邮递广告对促销的效果,为此选择了三个人口规模和经济发展水平以及该企业产品过去的销售量类似的地区,然后随机地将三种广告宣传形式分别安排在其中一个地区进行试验,共试验了6周,各周销售量如下表。各种广告宣传方式的效果是否显著地有差异?(05.0,用P-值规则和临界值规则)三种广告宣传方式的销售量单位:箱地区和广告方式观测序号(周)123456甲地区:街头标牌广告乙地区:公交车广告丙地区:随报刊邮递广告536150524640665545624955515440585642解:将对街头标牌广告宣传效果(销售量)观测结果Y1的数学期望值E(Y1)记为1,将对公交车广告宣传效果(销售量)观测结果Y2的数学期望值E(Y2)记为2,将对随报刊邮递广告宣传效果(销售量)观测结果Y3的数学期望值E(Y3)记为3。首先计算样本数据(样本内数据顺序号记作j)组号i广告方式样本量niinjijy1injijy12iy2i
本文档为【统计学导论第二版课后答案-曾五一】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: ¥18.4 已有0 人下载
最新资料
资料动态
专题动态
个人认证用户
盼盼书屋
暂无简介~
格式:pdf
大小:1MB
软件:PDF阅读器
页数:0
分类:高中语文
上传时间:2019-11-27
浏览量:18