首页 第九章 假设检验课件

第九章 假设检验课件

举报
开通vip

第九章 假设检验课件第九章假设检验第一节假设检验的一般问题第二节单总体参数的假设检验本章内容第一节假设检验的一般问题假设检验(hypothesistext)是先对总体参数提出某种假设,然后进行随机抽样,并根据样本的信息来验证该假设是否成立。假设检验可分为参数检验和非参数检验两种。参数检验是对总体的参数进行检验,可进一步区分为单总体参数检验和多总体参数检验。而非参数检验是对总体的分布形式、随机变量独立性等方面进行检验。本章只讨论单总体均值、比例、方差等参数的检验。一、假设检验的一般原理假设检验的依据是小概率原理:在一个已知假设下,如果某...

第九章 假设检验课件
第九章假设检验第一节假设检验的一般问题第二节单总体参数的假设检验本章内容第一节假设检验的一般问题假设检验(hypothesistext)是先对总体参数提出某种假设,然后进行随机抽样,并根据样本的信息来验证该假设是否成立。假设检验可分为参数检验和非参数检验两种。参数检验是对总体的参数进行检验,可进一步区分为单总体参数检验和多总体参数检验。而非参数检验是对总体的分布形式、随机变量独立性等方面进行检验。本章只讨论单总体均值、比例、方差等参数的检验。一、假设检验的一般原理假设检验的依据是小概率原理:在一个已知假设下,如果某个事件发生的概率非常小,我们通常认为,这个假设可能是不成立的。小概率原理是对人们日常思维习惯的抽象概括。在日常生活中,人们习惯于把概率非常小的事件,当作在一次观察中是不可能出现的事件。当然,如果我们认为某个事件是小概率事件,但在一次观察中却发生了,合理的解释自然是我们原来的看法有问题,也就是说,我们原来认定的事件可能并不是小概率事件。例1:ProCareIndustries,Ltd.曾经提供了一种称为“性别选择”的产品,根据广告上的说法,这种产品可以使夫妇“将生一个男孩的概率增加到85%,生一个女孩的概率增加到80%。”对于想要男孩的夫妇,“性别选择”就装在一个蓝色的包装里,对于想要女孩的夫妇,“性别选择”就装在一个粉色的包装里。假设我们对100对想要女孩的夫妇进行了一项实验,他们都遵照了在“性别选择”粉色包装上描述的“户内方便使用说明”。使用常识和非正规统计学方法来判断,如果100个婴儿中包含以下数量的女孩,我们应该对“性别选择”的有效性得出什么结论?①52个女孩②97个女孩答:①在100个婴儿中,正常情况下会有大约50个女孩。52个女孩的结果接近于50,因此我们不应该认为“性别选择”产品是有效的。即使100对夫妇没有使用任何特殊的性别选择方法,52个女孩这个结果也可能很容易地发生。②在100个新生儿中有97个是女孩这个结果在偶然的情况下是非常不可能发生的。我们可以用两种方式来解释出现97个女孩这一现象:要么是极其罕见的事件偶然出现了,要么是“性别选择”产品是有效的。因为出现97个女孩的概率极低,所以更有可能的解释就是这种产品是有效的。理解了小概率原理,就理解了假设检验的思想:首先对总体参数建立某种假设(称为原假设)H0,然后经过随机抽样取得一组样本数据,如果根据样本数据计算的某个统计量(或多个统计量)在原假设H0成立的条件下发生的概率很小,就拒绝或否定这个原假设并继而接受其对立面——备择假设。反之,如果该统计量在原假设H0成立的条件下发生的可能性不是很小,那么就接受原假设。例2:假设某种饮料的商标上标明的容量为250毫升,MATCH_ word word文档格式规范word作业纸小票打印word模板word简历模板免费word简历 _1716854878015_0差为4毫升。如果你从市场上随机抽取50瓶,发现其平均含量为248毫升。据此,可否断定饮料厂商欺骗了消费者?分析:样本平均含量低于厂商声称的平均含量,其原因不外乎有两种:一是由抽样误差引起的。如果样本平均数与总体平均数之差不大,未超出抽样误差范围,则可认为两者之差就是由抽样误差引起的,饮料厂商不存在欺诈行为。二是由饮料厂商短斤少两引起的,即饮料厂商存在欺诈行为。在这种情况下,样本平均数与总体平均数之差就会超出抽样误差范围,因为其差异是厂商的有意行为。抽样误差范围是与概率保证程度相联系的。对于正态分布总体,若取概率保证程度为99%,则样本平均数与总体平均数μ之差大于抽样平均误差的2.33倍,即,也就是说,或发生的概率只有1%(见图9-1)。因此,是一个小概率事件,这一事件在100次抽样中只发生一次,而对于一次抽样而言,可认为小概率事件实际上不会发生。图9-11%概率示意图(α=0.01)解:在本例中,=248,σ=4,n=50,假设μ=250也就是说,对于一次抽样的结果,小概率事件发生了,这是不合常理的,所以可认为总体平均数μ=250这一假设不成立,即该包装饮料的容量不足250毫升,厂商有欺诈故意。二、假设检验的步骤1.建立假设2.选择检验统计量及其分布3.确定显著性水平、临界值、接受域、拒绝域,计算检验统计量的值,检验原假设是否成立。建立假设应注意的问题检验统计量的选择检验原假设是否成立三、两类错误假设检验容易犯两类错误:第一类错误(tapeⅠerror),即“弃真的错误”,是指根据小概率原理,当原假设真时拒绝原假设而犯的错误。犯第一类错误的概率为α,即显著性水平。第二类错误(tapeⅡerror),即“纳伪的错误”,是指原假设假时没有拒绝原假设所犯的错误。犯第二类错误的概率记为β。应当注意:只有当原假设被拒绝时,才会犯第一类错误;只有当原假设未被拒绝时,才会犯第二类错误。正确决策第一类错误α拒绝H0第二类错误β正确决策未拒绝H0原假设H0假原假设H0真实际情况决策结果两类错误的概率α和β存在着一定的关系:α增大,则β减小;α减小,则β增大。我们当然希望犯这两类错误的概率都尽可能的小,但实际上很难做到,唯一的办法是扩大样本容量,但扩大样本容量又受到各种因素的限制,因此我们往往是在两类错误之间进行平衡,以使α和β控制在能够接受的范围内。例3:某研究机构估计,某地大学生中手机保有率(大学生中拥有手机的比率)超过80%。为验证这一估计是否正确,该机构拟在该地大学生中抽取样本进行检验。建立的假设为:原假设H0:π≤80%备择假设H1:π>80%试描述第一类错误和第二类错误的含义。解:第一类错误意味着:该地大学生中手机实际保有率不到80%,但样本结果却拒绝了原假设,认为大学生手机保有率超过了80%。第二类错误意味着:该地大学生手机实际保有率超过了80%,但样本结果却接受了原假设,认为大学生手机保有率不到80%。四、利用P值进行假设检验在原假设成立的条件下,检验统计量在某样本中至少达到相应值的概率称为P值(P-value)。双侧检验:H0:μ=μ0H1:μ≠μ0P值=左侧检验:H0:μ≥μ0H1:μ<μ0P值=右侧检验:H0:μ≤μ0H1:μ>μ0P值=根据P值进行假设检验:通过样本观察数据计算检验统计量的值,查表得到该统计量值的概率即P值,然后将P值与所给的显著性水平α对比,如果P值小于α,则拒绝原假设;如果P值大于α,则接受原假设。第二节单总体参数的假设检验(一)总体满足正态分布N(μ,σ2),且方差σ2已知,小样本(n<30)时,统计量于是,总体均值μ的检验方法可采取Z检验法。原假设:H0:μ=μ0备择假设:H1:μ≠μ0检验统计量:拒绝域:双侧检验例4:根据长期经验,某厂生产的某产品的抗折能力服从正态分布N(μ,64kg2)。现从该厂所生产的一大批产品中随机地抽取10个样品,测得其抗折能力(单位:kg)分别为578,572,570,568,570,572,570,572,596,584。请问:这一批产品的平均抗折能力能否被认为是570kg(α=0.05)?解:根据题意,可建立假设如下:H0:μ=570kgH1:μ≠570kg查标准正态分布表可知,当显著性水平α=0.05时,双侧检验的临界值为1.96,则拒绝域为(-∞,-1.96)∪(1.96,+∞)。根据样本数据可知,样本均值,故检验统计量的值即检验统计量的值落入拒绝域之内,所以要拒绝原假设H0:μ=570kg,接受备择假设,也就是说,不能认为这一批产品的平均抗折能力是570kg。原假设:H0:μ≤μ0备择假设:H1:μ>μ0检验统计量:拒绝域:Z>Zα右侧检验例5:能否认为这批产品的平均抗折能力超过570kg(α=0.05)?解:根据题意可建立假设如下:H0:μ=570kgH1:μ>570kg显然这是一个右侧检验问题,拒绝域应在抽样分布的右端。查标准正态分布表可知,在显著性水平α=0.05下,临界值为Zα=1.65,即拒绝域为(1.65,+∞)。由于检验统计量的值Z=2.056>1.65,即落入拒绝域之内,故要拒绝原假设H0:μ=570kg,接受备择假设H1:μ>570kg,也就是说,可以认为这一批产品的平均抗折能力超过570kg。原假设:H0:μ≥μ0备择假设:H1:μ<μ0检验统计量:拒绝域:Z<-Zα左侧检验例6:某食品加工企业的质检部门规定,某种食品每包净重不得少于20kg。经验表明,该食品的净重近似服从标准差为1.5kg的正态分布。假定从一个由50包食品构成的随机样本中得到的平均重量为19.5kg,问:有无充分证据说明这些食品的平均重量减少了(α=0.05)?解:根据题意可建立假设如下:H0:μ≥20kgH1:μ<20kg这是一个左侧检验问题,拒绝域应在抽样分布的左端。查标准正态分布表可知,在显著性水平α=0.05下,临界值为-Zα=-1.65,即拒绝域为(-∞,-1.65)。由于样本均值kg,总体方差σ2=(1.5kg)2,故检验统计量的值为即检验统计量落入了拒绝域,所以要拒绝原假设H0:μ=20kg,转而接受备择假设H1:μ<20kg,即检验结果充分说明这些食品的平均净重减少了。Z检验可借助于Excel中的ZTEST函数来进行。步骤是:①打开Excel表,录入样本数据;②点击插入函数按钮“fx”,在出现的函数分类对话框中选择“统计”,并在函数名菜单中选择函数“ZTEST”,然后确定。③在所出现的对话框中,Array一栏输入样本数据所在区域;X一栏输入待检验参数μ0;Sigma一栏输入已知的总体标准差σ(若σ未知,则该栏可不填,系统自动以样本标准差S代替。④对话框中自动显示“计算结果=×××××”(或点击对话框中的“确定”按钮,在工作表会显示出计算结果)。⑤根据“计算结果”计算P值,并与显著性水平α比较。如果P值大于α,则接受原假设;如果P值小于α,则拒绝原假设,选择备择假设。前面双侧检验例子的Excel操作过程:P值=2×0.01991631≈0.0398小于显著性水平0.05,故拒绝原假设而选择备择假设。(二)总体满足正态分布N(μ,σ2),且方差σ2未知,小样本(n<30)时,统计量于是,对总体均值μ的检验应采取t检验法。其中,S为样本标准差原假设:H0:μ=μ0备择假设:H1:μ≠μ0检验统计量:拒绝域:双侧检验例7:某种板材的厚度要求为5mm,为了解板材生产设备的状况,随机抽取了18块板材进行检查,测得其厚度资料如下:已知板材厚度服从正态分布,试以0.05的显著性水平检验生产设备性能是否良好。5.055.115.014.864.934.965.034.694.804.995.035.024.914.874.914.894.914.60解:这是一个双侧检验的问题,可建立假设如下:H0:μ=5mmH1:μ≠5mm根据已知条件,选择检验统计量根据样本数据,可计算出样本均值=4.92mm,样本标准差S=0.128mm,则检验统计量的值为t=-2.632。当显著性水平α=0.05,自由度n-1=17时,查t分布表可知双侧检验临界值为tα/2(17)=2.1098。显然检验统计量的值落入拒绝域之内,因此要拒绝原假设,接受备择假设,说明该生产设备的性能不好。原假设:H0:μ≤μ0备择假设:H1:μ>μ0检验统计量:拒绝域:t>tα(n-1)右侧检验例8:从某种蔬菜中随机抽取9件样品检测其农药含量,测得某种农药成分的平均值为0.325mg/kg,标准差为0.068mg/kg,国家卫生标准规定,蔬菜中农药残留量应0.3mg/kg。假定蔬菜中该种农药残留量服从正态分布,问该种蔬菜中农药残留量是否超标(α=0.05)?解:根据题意可建立假设如下:H0:μ≤0.3mg/kgH1:μ>0.3mg/kg由已知条件可知,应进行右侧t检验,检验统计量根据t分布表可知,当显著性水平α=0.05时,右侧检验临界值为tα(8)=1.86,即拒绝域为(1.86,∞)。根据样本数据计算得检验统计量的值为1.1029<1.86,即落入接受域内,故要接受原假设H0:μ=0.3mg/kg,即没有充分的证据证明这种蔬菜中农药残留量超标。原假设:H0:μ≥μ0备择假设:H1:μ<μ0检验统计量:拒绝域:t<-tα(n-1)左侧检验t检验也可借助于Excel中的TDIST函数计算出P值进行检验:①打开Excel表格,点击“f(x)”命令。②在函数分类中点击“统计”,并在函数名菜单下选择“TDIST”,然后确定。③在出现的对话框中,X一栏填入检验统计量t的绝对值,Deg-freedom一栏填入t分布的自由度,Tails一栏填入“1”或“2”(如果是单侧检验填入“1”,如果是双侧检验则填入“2”)。④在对话框填入相应数据后,在下方会自动显示“计算结果=×××××”,此即P值。⑤将P值与显著性水平α对比,如果大于α则接受原假设,如果小于α则拒绝原假设而选择备择假设。前面例子中对板材厚度进行的t检验借助于TDIST函数计算的结果见上图,P值=0.017481965<0.05,故要拒绝原假设。(三)任意总体,大样本(n≥30)此时,根据中心极限定理可知(总体标准差σ已知)(总体标准差σ未知,以样本标准差S代替)或这时,均值的检验仍采取Z检验法。在二项分布中,当n很大,np和n(1-p)都大于5时,可用正态分布来逼近。也就是说,当n充分大时,样本成数p近似服从正态分布。基于此,当n充分大时,总体成数π的假设检验可采取Z检验法。原假设:H0:π=π0备择假设:H1:π≠π0检验统计量:拒绝域:双侧检验重复抽样条件下例9:某杂志声称其读者群中有80%为女性。为验证这一说法是否属实,某研究部门抽取了由200人组成的一个随机样本,发现有146个女性经常阅读该杂志。分别取显著性水平=0.05和=0.01,检验该杂志读者群中女性的比例是否为80%?解:根据题意和已知条件,可建立假设如下:H0:π=80%H1:π≠80%样本容量n=200,其中女性读者n0=146,故样本成数p=146/200=73%于是检验统计量的值为当显著性水平α=0.05时,查标准正态分布表可知双侧检验临界值为,即拒绝域为(-∞,-1.96)∪(1.96,+∞)。此时检验统计量的值落入拒绝域,要拒绝原假设而选择备择假设,即认为该杂志的读者中女性比例不是80%,该杂志的说法不实。原假设:H0:π≥π0备择假设:H1:π<π0检验统计量:拒绝域:Z<-Zα左侧检验重复抽样条件下例10:某地环保部门声称该地符合废气排放标准的工业企业至少达60%。但一个关心环境保护的社会团体不相信这个结论。于是从该地工业企业中随机抽出了60家进行检测,发现有33家企业符合废气排放标准。试以显著性水平0.05检验环保部门的结论是否属实?解:根据题意可建立假设如下:H0:π≥60%H1:π<60%n=60,n0=33,则样本成数p=33/60=55%计算检验统计量的值Z=-0.791当显著性水平α=0.05时,查标准正态分布表,可知左侧检验的临界值为-Zα=-1.65,即拒绝域为(-∞,-1.65)。由于检验统计量的值落入了接受域,所以没有充分的理由拒绝原假设,即必须接受原假设成立,可以认为该地符合废气排放标准的工业企业至少有60%,环保部门的结论是可信的。原假设:H0:π≤π0备择假设:H1:π>π0检验统计量:拒绝域:Z>Zα右侧检验重复抽样条件下在非重复抽样条件下,样本成数p的抽样分布为:这时检验统计量可选择仍然采取Z检验法进行检验。其中N为总体容量。如果满足条件N>>n,此时非重复抽样可近似地视作重复抽样,假设检验按重复抽样条件下的方法进行。(总体服从正态分布)原假设:H0:σ2=σ02备择假设:H1:σ2≠σ02检验统计量:拒绝域:或双侧检验例11:啤酒生产企业采用自动生产线灌装啤酒,每瓶的装填量为640ml,但由于受某些不可控因素的影响,每瓶的装填量会有差异。此时,不仅每瓶的平均装填量很重要,装填量的方差同样很重要。如果方差很大,会出现装填量太多或太少的情况,这样要么生产企业不划算,要么消费者不满意。假定生产标准规定每瓶装填量的标准差不应超过和不应低于4ml。企业质检部门抽取了10瓶啤酒进行检验,得到的样本标准差为S=3.8ml。试以0.10的显著性水平检验装填量的标准差是否符合要求?解:根据题意建立假设如下:H0:σ2=42H1:σ2≠42计算检验统计量的值当显著性水平α=0.1,自由度n-1=9时,查χ2分布表得双侧检验的临界值分别为和即拒绝域为(0,3.32511)∪(16.919,∞)。由于检验统计量的值落入接受域之内,所以不能拒绝原假设,可以认为啤酒装填量的标准差符合要求。χ2检验也可借助于Excel中的CHIDIST函数,通过计算检验统计量的P值来进行检验。上例的P值=2×(1-0.521849971)≈0.9563,远大于显著性水平0.1,故要接受原假设。原假设:H0:σ2≥σ02备择假设:H1:σ2<σ02检验统计量:拒绝域:左侧检验原假设:H0:σ2≤σ02备择假设:H1:σ2>σ02检验统计量:拒绝域:右侧检验例12:某厂要求原材料的抗拉强度的方差不超过5。今从一批新到的原材料中随机抽出25个样品进行检测,其方差为7。这个数据能否为厂家拒绝这批原材料提供充分的根据?设显著性水平α=0.05,并假定原材料的抗拉强度近似服从正态分布。解:根据题意建立假设如下:H0:σ2≤5H1:σ2>5这是一个右侧检验问题。当显著性水平α=0.05,自由度为n-1=24时,查χ2分布表得右侧检验的临界值为,即拒绝域为(36.42,∞)。检验统计量的值落入接受域之内,故要接受原假设,也就是说,样本数据不能为厂家拒绝原材料提供充分的根据。
本文档为【第九章 假设检验课件】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: ¥17.6 已有0 人下载
最新资料
资料动态
专题动态
个人认证用户
用户4371444094
一线资深教师
格式:ppt
大小:4MB
软件:PowerPoint
页数:0
分类:理学
上传时间:2020-12-11
浏览量:6