首页 假设检验与样本数量分析④——单比率检验、双比率检验

假设检验与样本数量分析④——单比率检验、双比率检验

举报
开通vip

假设检验与样本数量分析④——单比率检验、双比率检验假设检验及功效和样本数量分析④单比率检验双比率检验功效和样本数量(PowerandSampleSizeAnalysis)<1><‹#›>单比率检验双比率检验预备知识总体——研究的一类对象的全体组成的集合。个体——总体中的每一个考察的对象。样本——从总体中抽出的一部分个体的集合。样本数量——样本中包含的个体的数量。总体与样本噢!这么多健身球,应该全是合格的吧从中抽出几个,测量一下。看看废品率。?我们通过样本来了解总体由样本信息作为总体信息估计值统计推断是由样本的信息来推测总体性能的一种方法。在...

假设检验与样本数量分析④——单比率检验、双比率检验
假设检验及功效和样本数量 分析 定性数据统计分析pdf销售业绩分析模板建筑结构震害分析销售进度分析表京东商城竞争战略分析 ④单比率检验双比率检验功效和样本数量(PowerandSampleSizeAnalysis)<1><‹#›>单比率检验双比率检验预备知识总体——研究的一类对象的全体组成的集合。个体——总体中的每一个考察的对象。样本——从总体中抽出的一部分个体的集合。样本数量——样本中包含的个体的数量。总体与样本噢!这么多健身球,应该全是合格的吧从中抽出几个,测量一下。看看废品率。?我们通过样本来了解总体由样本信息作为总体信息估计值统计推断是由样本的信息来推测总体性能的一种方法。在通过样本获得一批数据后,要对总体的某一参数进行估计和检验。建立检验假设(如双侧检验)单样本例如,我们想了解一种健身球生产过程的不合格品率p是否为p0=2%,通过对样本的测量获得一批数据,然后对健身球不合格品率p进行推断,这是单样本检验的问题。H0:p=p0H1:p≠p0H0:p=0.02H1:p≠0.02不合格品率为2%不合格品率不是2%<‹#›>单比率检验双比率检验预备知识总体与样本2种健身球生产过程的不合格品率应该一样吧,?我们通过2个样本来了解2个总体由样本信息推断2个总体相比是否有差异统计推断是由2个样本的信息来推测2个总体性能,推断特征相比是否有显著差异。建立检验假设(如双侧检验)双样本例如,直径为65cm的健身球,新研制出健身球2#生产成本较低,如果生产过程的不合格品率与原来的1#产品一致,则用2#产品替代1#产品。通过对2个样本的测量获得两部分数据,然后对两种健身球(1#产品和2#产品)的不合格品率进行是否存在差异进行推断(或推断1#产品的不合格品率是否大或小于2#产品的不合格品率),这是双样本比率检验的问题。健身球1#健身球2#样本间的差异是由抽样误差引起的样本与样本所代表的总体间存在显著差异不合格品率无差异不合格品率有差异H0:p1=p2H1:p1≠p2<‹#›>单比率检验双比率检验预备知识二项分布的概念二项分布(binominaldistribution)是一种重要的离散型分布。数据属于只有两个可能结果的独立实验的结果,一个表示希望的“事件”,另一个表示“非事件”(每一观察只具有相互独立的一种结果),如,通过与失败、合格与报废、有效或无效、是或否、0或1等。通常,1代表抽到不合格品,0代表抽到合格品。总体不合格品比率记作p,样本不合格品比率记作其中n——总体中随机抽取样本个数X——出现不合格品数(X=0,1,2,3,…,n)<‹#›>单比率检验双比率检验二项分布p=0.1,n=5概率分布图n=30n=50n=100p=0.1,n=30、50、100二项分布的概率分布图形预备知识质量部门对一批产品进行了检验,长期以来生产过程的不合格品率=10%,检验员检测了5件产品(有放回抽样),求检验到的不合格品数。n=总体中随机抽取样本个数X=出现不合格品数二项分布的概率不合格品数是0的概率=0.59049不合格品数是1的概率=0.32805同理计算不合格品数为2、3、4、5的概率X=012345p=0.590490.328050.07290.00810.000450.000010.590490.328050.07290.00810.000450.00001n足够大,分布近似正态分布.<‹#›>单比率检验双比率检验预备知识比率检验比率检验单比率检验1Proportion-test一个总体双比率检验2Proportion-test精确检验超几何分布两个总体Z检验正态近似检验精确检验二项分布Z检验正态近似检验总体服从二项分布两个总体服从二项分布Z检验的适用条件:样本含量n足够大,与均大于5,此时样本率的分布近似正态分布,可利用正态分布的原理作Z检验。 当两样本含量n1及n2足够大,及均大于5可根据正态分布原理,进行Z检验。 Z检验的适用条件:<‹#›>单比率检验双比率检验单比率检验单比率检验统计量式中:单比率检验1Proportion-test双侧检验左侧检验右侧检验检验假设H0:p=p0H1:p≠p0H0:pp0H1:p<p0H0:pp0H1:p>p0拒绝域|Z|Z1-a/2ZZaZZ1-aP值决策P值<α拒绝H0样本含量n足够大n:样本数:样本的比率p0:比率参考值Z检验正态近似检验样本比率=x÷n其中x是观察到的”成功”数单比率检验用于根据样本数据对总体比率进行推断<‹#›>单比率检验双比率检验确定临界值H1:p≠p0H1:p<p0H1:p>p0双侧检验左侧检验右侧检验单比率检验单比率检验显著性水平α与拒绝域=0.025=0.025临界值临界值1-α=95%拒绝零假设拒绝零假设不拒绝H0范围Z1-a/2Za/2α=0.05临界值1-α=95%拒绝零假设不拒绝零假设α=0.05Z检验正态近似检验Zaα=0.05临界值1-α=95%Z1-a不拒绝零假设拒绝零假设Z0.975=1.96Z0.025=-1.96Z0.05=-1.645Z0.95=1.645α=0.05α=0.05<‹#›>单比率检验双比率检验假设检验的例子(16)我们长园集团有个公司的一台注塑机加工某种电缆附件产品,长期以来生产过程的不合格品率p0=2%,估计当前生产过程的不合格品率仍为2%。随机抽取500个产品,测量得到不合格品数为9。建立检验假设给定显著水平α=0.0512计算统计量3——双侧检验H0:p=0.02H1:p≠0.02n=500x=9单比率检验单比率检验本例样本比率提供了总体比率的估计值样本比率=x÷n=9÷500=0.018比率参考值p0=0.02(2%)1-p=0.982,=-0.3194<‹#›>单比率检验双比率检验接上页如果|Z|=0.319Z1-a/24用算得的统计量与相应的临界值作比较则拒绝原假设;否则无法拒绝原假设。单比率检验反查正态分布表(右尾概率)Z临界值为:Z0.025=1.96Z-Value0.000.010.020.030.040.050.060.070.080.090.30.3820.3780.3740.3710.3670.3630.3590.3560.3520.3480.40.3450.3410.3370.3340.3300.3260.3230.3190.3160.312……………………………1.90.0290.0280.0270.0270.0260.0260.0250.0240.0240.0232.00.0230.0220.0220.0210.0210.0200.0200.0190.0190.018Z0.025=1.96用算得的统计量与相应的临界值作比较|Z|=0.319<Z0.025=1.965作出不拒绝零假设的统计结论即:当前生产过程的不合格品率仍为2%。计算检验P-值Z-Value0.000.010.020.030.040.050.060.070.080.090.30.3820.3780.3740.3710.3670.3630.3590.3560.3520.3480.40.3450.3410.3370.3340.3300.3260.3230.3190.3160.312……………………………1.90.0290.0280.0270.0270.0260.0260.0250.0240.0240.0232.00.0230.0220.0220.0210.0210.0200.0200.0190.0190.018P(Z﹤-0.31或Z>0.31)=0.378×2=0.756P=P(Z<-0.31及Z>0.31)=0.378×2=0.756P=0.748>α=0.05按α=0.05的水平无法拒绝零假设H0查正态分布表查不到|Z|=0.3194P=P(Z<-0.32及Z>0.32)=0.374×2=0.748P(Z<-0.32及Z>0.32)=0.374×2=0.748|Z|<临界值、未落入拒绝域及P>0.05是对应的见下页图示<‹#›>单比率检验双比率检验接上页单比率检验单比率检验Z检验正态近似检验Z=1.96Z=-1.96=0.025=0.025不拒绝零假设拒绝零假设拒绝零假设临界值临界值双侧检验示意图(显著性水平α与拒绝域)H01–α=0.95Z=0.319Z=-0.319=0.3747Z=-0.319Z=0.319=0.3747P=0.7494|Z|<临界值则未落入拒绝域此处Z的绝对值=0.319小于临界值1.96样本观测值落在“不拒绝零假设”范围内|Z|<临界值则P>0.05(直观易见)此处Z的绝对值=0.319小于临界值1.96假设检验的P值=0.7494直观易见0.050.7494|Z|=0.319P=0.7494<‹#›>单比率检验双比率检验检验功效和样本数量分析评价检验功效假设检验的例子16,Z的绝对值=0.319小于临界值Z0.025=1.96(P值=P=0.7494>α=0.05)出了不拒绝零假设的统计结论。——当H0为假时正确否定它的概率(p=1–β)双侧检验Power=1–Φ[(0.02-0.018+1.96×0.0063)/0.0059]+Φ[(0.02-0.018-1.96×0.0063)/0.0059]=1–Φ(2.4319)+Φ(-1.7539)=0.0075+0.03972=0.0472检验功效Power=0.0472——双侧检验单比率检验Power=1–Φ()+Φ()参考比率 标准 excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载 误样本比率标准误将P0=0.02、=0.018、Zα/2=1.96(右尾概率分位数、当α=0.05)=0.0063=0.0059及σp=0.0063、Sp=0.0059代入上式。Φ:标准正态分布的累积分布函数za/2=uppera/2pointofthestandardnormaldistribution<‹#›>单比率检验双比率检验样本数量假设检验的例子16中,如果总体比率实际为0.02但在样本比率=0.018时,则检测到差异的可能性为4.72%如果我们仍然规定可以检测到的最小差值δ=0.002,并希望功效Power=0.9需要抽取产品样本多少个?将Zα/2=Z0.05/2=1.96、Zβ=Z0.1=1.28及P0=0.02、=0.018代入上式双侧检验容许差值越小,需要样本量越大。(为使差值符合选择,δ有时需主观规定)检验功效和样本数量分析——双侧检验单比率检验接上页sin-1θ:反正弦三角函数采用弧度计算公式中=48882.71733需要抽取产品样本48883个<‹#›>单比率检验双比率检验假设检验的例子(17)我们有一个公司生产继电保护装置,所在的主板生产中一次通过率只在97%。为了提高主板的一次通过率,六西格玛项目组对流程进行了改进。为确定改进后主板的一次通过率是否>97%。随机抽取800个产品,测量得到不合格品数为16。建立检验假设1——单侧检验(左)H0:p0.03H1:p<0.03(希望被证明)单比率检验n=800x=16样本比率=x÷n=16÷800=0.02比率参考值p0=0.03(3%)本例用不合格品率计算可用正态近似检验给定显著水平α=0.052计算统计量3=-1.66用通过率计算结果是一样的,不合格率是小数值,一般会将小数值定义为p。<‹#›>单比率检验双比率检验接上页如果|Z|=1.66Z1-a4用算得的统计量与相应的临界值作比较则拒绝原假设;否则无法拒绝原假设。单比率检验反查正态分布表(右尾概率)Z临界值为:Zα=Z0.05=1.64Z-Value0.000.010.020.030.040.050.060.070.080.090.30.3820.3780.3740.3710.3670.3630.3590.3560.3520.3480.40.3450.3410.3370.3340.3300.3260.3230.3190.3160.312……………………………1.50.0670.0660.0640.0630.0620.0610.0590.0580.0570.0561.60.0550.0540.0530.0520.0510.0490.0480.0470.0460.046Z0.05=1.64用算得的统计量与相应的临界值作比较|Z|=1.66>Z0.05=1.645作出拒绝零假设的统计结论:不合格品率<0.03即:改进后主板的一次通过率>97%计算检验P-值Z-Value0.000.010.020.030.040.050.060.070.080.090.30.3820.3780.3740.3710.3670.3630.3590.3560.3520.3480.40.3450.3410.3370.3340.3300.3260.3230.3190.3160.312……………………………1.50.0670.0660.0640.0630.0620.0610.0590.0580.0570.0561.60.0550.0540.0530.0520.0510.0490.0480.0470.0460.046P(Z<-1.66)=0.048P=P(Z<-1.66)=0.048P=0.048<α=0.05按α=0.05的水平拒绝零假设H0查正态分布表查到|Z|=1.66|Z|临界值、落入拒绝域及P<0.05是对应的见下页图示<‹#›>单比率检验双比率检验接上页单比率检验单比率检验Z检验正态近似检验α=0.05拒绝零假设不拒绝零假设左侧检验示意图(显著性水平α与拒绝域)H01–α=0.95P=0.048Z=-0.319Z=0.319=0.3747左侧检验Z=-1.66Zα-1.64则落入拒绝域左侧检验Z=-1.66Zα-1.64则P=0.048<0.05(直观易见)直观易见0.050.048Z=-1.66P(Z<-1.66)=0.048临界值Zα=-1.64<‹#›>单比率检验双比率检验检验功效和样本数量分析评价检验功效假设检验的例子17中,检验功效有多大?——当H0为假时正确否定它的概率(p=1–β)左侧检验Power=Φ[(0.03-0.02-1.64×0.00603)/0.00495]=Φ[0.022384]=0.5089检验功效Power=0.5089(50.89%)——左侧检验单比率检验Power=Φ()参考比率标准误样本比率标准误将P0=0.03、=0.02、Zα=1.64(右尾概率分位数、当α=0.05)=0.00603=0.00495及σp=0.00603、Sp=0.00495代入上式。za=one-sidedcriticalvalue(upperapointofthestandardnormaldistribution)<‹#›>单比率检验双比率检验样本数量上页的例子中,检验功效Power=0.5089(50.89%),如果我们仍然规定δ=0.01差异可以检测到,并希望检测功效Power=0.9需要抽取产品样本多少个?(Power=1-β=0.9即β=0.1)将Zα=1.64、Zβ=Z0.1=1.28及P0=0.03、=0.02代入上式检验功效和样本数量分析单比率检验接上页sin-1θ:反正弦三角函数采用弧度计算公式中=2057.656537需要抽取产品样本2058个β:犯第II类错误(当H0为伪时我们接受H0)的概率左侧检验或右侧检验<‹#›>单比率检验双比率检验单比率检验式中:单比率检验1Proportion-test双侧检验左侧检验右侧检验检验假设H0:p=p0H1:p≠p0H0:pp0H1:p<p0H0:pp0H1:p>p0P值<α拒绝H0p值=P{X<yorX>n-y|p=po}y=min{x,n-x}.p值=P{X<x|p=po}p值=P{X>x|p=po}单比率检验用于根据样本数据对总体比率进行推断精确检验二项分布不可以做正态近似检验n=总体中随机抽取样本个数x=出现不合格品数二项分布概率大多数教科书都使用正态近似方法,此处,补充阅读仅为对精确检验进行手动计算的理解.精确检验补充阅读<‹#›>单比率检验双比率检验假设检验的例子(18)我们有一个公司对新员工的培养周期大约为60天左右,通过率(一次上岗,不需补习)一般在92%。为了适应目前公司的发展需要,对现有培训模式做出优化并缩短培训周期。为确定改进后的培训通过率是否不低于92%。对50培训后的新员工的考核记录不记名整理如下。建立检验假设1——单侧检验(左)H0:p0.92H1:p<0.92单比率检验样本比率=x÷n=48÷50=0.96比率参考值p0=0.92(92%)给定显著水平α=0.052计算概率值3合格合格合格合格合格合格合格合格合格合格合格合格合格合格合格合格合格不及格合格合格合格合格合格合格合格不及格合格合格合格合格合格合格合格合格合格合格合格合格合格合格合格合格合格合格合格合格合格合格合格合格不可以做正态近似检验事件=合格先计算大于48的单侧概率根据二项分布=0.06725=0.01547精确检验<‹#›>单比率检验双比率检验接上页由于计算小于等于48的单侧累积概率计算量较大结论:P=0.91728>α=0.05显著性水平,不拒绝H0。即:不能拒绝改进后的培训通过率0.924——单侧检验单比率检验0.067250.01547计算p值p值=P{X<x|p=po}x=0、1、2、…、48我们利用总概率等于1计算小于等于48的单侧累积概率=1-0.06725-0.01547=0.91728见前页计算大于48的(49、50)单侧概率<‹#›>单比率检验双比率检验假设检验的例子(18)我们有一个公司对新员工的培养周期大约为60天左右,通过率(一次上岗,不需补习)一般在92%。为了适应目前公司的发展需要,对现有培训模式做出优化并缩短培训周期。为确定改进后的培训通过率是否不低于92%。对50培训后的新员工的考核记录不记名整理如下。建立检验假设1——单侧检验(右)单比率检验样本比率=x÷n=2÷50=0.04比率参考值p0=0.08(8%)给定显著水平α=0.052计算概率值3合格合格合格合格合格合格合格合格合格合格合格合格合格合格合格合格合格不及格合格合格合格合格合格合格合格不及格合格合格合格合格合格合格合格合格合格合格合格合格合格合格合格合格合格合格合格合格合格合格合格合格不可以做正态近似检验事件=不及格先计算小于2的单侧概率根据二项分布=0.06725=0.01547例子(18)用不及格率计算一般会将小数量值定义为pH0:p0.08H1:p>0.08精确检验<‹#›>单比率检验双比率检验接上页结论:P=0.91728>α=0.05显著性水平下不拒绝H0即:不能拒绝改进后的培训不及格率0.084——单侧检验(右)单比率检验0.067250.01547计算p值与前两页(不能拒绝改进后的培训通过率0.92)意义相同p值=P{X>x|p=po}由于计算大于等于2的单侧累积概率计算量较大x=2、3、…、50利用总概率等于1=1-0.01547-0.06725=0.91728见前页计算小于2的(0、1)单侧概率<‹#›>单比率检验双比率检验检验功效和样本数量分析单比率检验精确检验补充阅读精确检验对于所有样本数量都是准确有效的<‹#›>单比率检验双比率检验双比率检验双比率检验2Proportion-testZ检验正态近似检验两个总体服从二项分布当两样本含量n1及n2足够大 Z检验的适用条件可进行Z检验大于5大于5统计量式中:双侧检验左侧检验右侧检验检验假设H0:p1-p2=dH1:p1-p2≠dH0:p1-p2dH1:p1-p2<dH0:p1-p2dH1:p1-p2>d拒绝域|Z|Z1-a/2ZZaZZ1-aP值决策P值<α拒绝H0n1:样本1个数n2:样本2个数样本公共比率其中X1和X2是样本1和样本2中的”成功”数d:两总体比率差值:样本1的比率:样本2的比率当检验两总体比率差值d=0时式中:双比率检验用于根据两个随机样本中的数据对两个总体比率之间的差值进行推断。<‹#›>单比率检验双比率检验双比率检验检验两总体比率差值d=p1–p2=0假设检验的例子(19)——双侧检验有两台波峰焊设备,1号设备生产的板件中随机抽取1600个产品,得到优等品的件数为320;2号设备生产的板件中随机抽取2000个产品,得到优等品的件数为360。为确定两台波峰焊设备产出优等品率是否一致,采用双比率检验。用显著性水平α=0.05进行检验可用正态近似检验大于5大于5=x1÷n1=320÷1600=0.2=x2÷n2=360÷2000=0.18两总体”成功”比率合并估计值:样本1的比率样本2的比率=0.189H0:p1-p2=0H1:p1-p2≠01给定显著水平α=0.052计算统计量3建立检验假设(两个总体比率相等)(两个总体比率存在差异)=1.523<‹#›>单比率检验双比率检验接上页4查临界值反查正态分布表(右尾概率)Z临界值为:Z0.025=1.96Z-Value0.000.010.020.030.040.050.060.070.080.090.30.3820.3780.3740.3710.3670.3630.3590.3560.3520.3480.40.3450.3410.3370.3340.3300.3260.3230.3190.3160.312……………………………1.90.0290.0280.0270.0270.0260.0260.0250.0240.0240.0232.00.0230.0220.0220.0210.0210.0200.0200.0190.0190.018Z0.025=1.96用算得的统计量与相应的临界值作比较∵|Z|=1.523<Z0.025=1.965作出不拒绝零假设的统计结论两台波峰焊设产出优等品率是一致的计算检验P-值Z-Value0.000.010.020.030.040.050.060.070.080.090.30.3820.3780.3740.3710.3670.3630.3590.3560.3520.3480.40.3450.3410.3370.3340.3300.3260.3230.3190.3160.312……………………………1.40.0810.0810.0810.0810.0810.0810.0810.0810.0810.0811.50.0670.0670.0670.0670.0670.0670.0670.0670.0670.067P=P(Z>1.52)=0.067P=P(Z<-1.52及Z>1.52)=0.067×2=0.134∵P值=0.134>α=0.05按α=0.05的水平无法拒绝零假设H0查正态分布表|Z|=1.52双比率检验——双侧检验/2=0.025双侧检验临界值=±1.96显著性水平=0.05、/2=0.025(右尾概率)|Z|临界值与P值>0.05是对应的两台波峰焊设产出优等品率是一致的<‹#›>单比率检验双比率检验双比率检验假设检验的例子(20)——右单侧检验有两台相同设备,1号设备和2号设备生产相同产品且质量无差异, 工程 路基工程安全技术交底工程项目施工成本控制工程量增项单年度零星工程技术标正投影法基本原理 师在2号设备换上新设计的刀具,由于新刀具使用价格较贵的合金材料;希望使用新刀具能使废品率有所下降,预计废品率至少会降低0.5%。使用原来刀具的1号设备生产的零件中和换上新刀具的2号设备生产的零件中各分别随机抽取3000个;经测量得出:1号设备生产的零件中废品数是75个,2号设备生产的零件中废品数是21个。检验使用新刀具使废品率至少会降低0.5%可用正态近似检验大于5大于5=x1÷n1=75÷3000=0.025=x2÷n2=21÷3000=0.007样本1的比率样本2的比率1给定显著水平α=0.052计算统计量3建立检验假设(想要证明)Z=4.023样本n1=n2=n=3000H0:p1-p20.005H1:p1-p2>0.005我们将预期效果(想要证明的假设)作为备择假设H1,因为只有当检验结果与原假设有明显差别时才能拒绝原假设而接受备择假设,拒绝是有说服力的,减少结论错误。(两总体比率差值d不为时)<‹#›>单比率检验双比率检验接上页4查临界值反查正态分布表(右尾概率)Z临界值为:Z0.05=1.645用算得的统计量与相应的临界值作比较∵Z=4.023>Z0.025=1.6455使用原来刀具比换上新刀具生产的零件废品率多0.5%以上或者说:“使用新刀具使废品率至少会降低0.5%”双比率检验=0.05单侧检验临界值=±1.645显著性水平=0.05Z0.000.010.020.030.040.050.060.070.080.09……………………………1.60.0550.0540.0530.0520.0510.0490.0480.0470.0461.600……………………………1.90.0290.0280.0270.0270.0260.0260.0250.0240.0240.0232.00.0230.0220.0220.0210.0210.0200.0200.0190.0190.018Z0.051=1.64Z0.049=1.65结论:拒绝零假设——右单侧检验(α=0.05)α=0.05临界值拒绝H01-α=95%H0Zα(α=0.05)=1.6451.645Z=4.0234.023计算检验P-值Z0.000.010.020.030.040.050.060.070.080.09……………………………4.00.000030.000030.000030.000030.000030.000030.000020.000020.000020.00002P=P(Z=4.02)=0.00003查正态分布表Z=4.02∵P值=0.00003<α=0.05按α=0.05的水平拒绝零假设H0Z>临界值与P<0.05是对应的<‹#›>单比率检验双比率检验检验功效和样本数量分析评价检验功效①计算在假设检验的例子20中的检验功效,先计算“使用原来刀具比换上新刀具生产的零件废品率多”的检验功效——当H0为假时正确否定它的概率(p=1–β)Power==0.00229=0.00323双比率检验样本n1=n2=n=3000H1:p1>p2——右单侧检验——右单侧检验zα=one-sidedcriticalvalue(upperpointofthestandardnormaldistribution)将、Zα=1.645及右面计算值代入上式Power=1-Φ[(0.007-0.025+1.645×0.00229)÷0.00323]=1-Φ[-4.40649]=0.99999<‹#›>单比率检验双比率检验检验功效和样本数量分析评价检验功效②计算在假设检验的例子20中的检验功效,计算“使用原来刀具比换上新刀具生产的零件废品率多0.5%以上”的检验功效——当H0为假时正确否定它的概率(p=1–β)Power==0.00229=0.00323双比率检验样本n1=n2=n=3000——右单侧检验——右单侧检验zα=one-sidedcriticalvalue(upperpointofthestandardnormaldistribution)将、Zα=1.645及右面计算值代入上式Power=1-Φ[(0.007+0.05-0.025+1.645×0.00229)÷0.00323]=1-Φ[-2.85864]=0.9977H1:p1-p2>0.05<‹#›>单比率检验双比率检验检验功效和样本数量分析评价检验功效双侧检验Power=za/2=uppera/2pointofthestandardnormaldistribution双比率检验左单侧检验Power=zα=one-sidedcriticalvalue(upperpointofthestandardnormaldistribution)H1:p1<p2H1:p1≠p2样本数量n是指每个组的<‹#›>单比率检验双比率检验样本数量①将Zα=1.645、Zβ=Z0.1=1.28及代入上式检验功效和样本数量分析sin-1θ:反正弦三角函数采用弧度计算公式中=2184.713656需要抽取产品样本数量n=2185个单侧检验左或右侧检验双比率检验计算在假设检验的例子20中的检验是“使用原来刀具比换上新刀具生产的零件废品率多0.5%以上”的检验使用原来刀具生产的零件废品率如果使用新刀具生产的零件废品率比原来低0.013时,差异可以检测到,我们规定基线比率若希望检测功效Power=0.9,需要抽取产品样本多少个?样本数量n是指每个组的<‹#›>单比率检验双比率检验样本数量②将Zα=1.645、Zβ=Z0.1=1.28及代入上式检验功效和样本数量分析sin-1θ:反正弦三角函数采用弧度计算公式中=18414.18704需要抽取产品样本数量n=18415个单侧检验左或右侧检验双比率检验计算在假设检验的例子20中的检验是“使用原来刀具比换上新刀具生产的零件废品率多0.5%以上”的检验使用原来刀具生产的零件废品率如果使用新刀具生产的零件废品率比原来低0.005(0.5%)时,差异可以检测到,我们规定基线比率若希望检测功效Power=0.9,需要抽取产品样本多少个?样本数量n是指每个组的<‹#›>单比率检验双比率检验双比率检验样本数量的估计公式(2)将Zα=1.645、Zβ=Z0.1=1.28及代入上式=1834.194需要抽取产品样本数量n=1835个32页上计算的样本数量n=2185用另一个公式计算一下32页计算n=2185用不同的的估计公式计算的样本数量会有差异双比率检验样本数量<‹#›>单比率检验双比率检验式中:双比率检验1Proportion-test双侧检验左侧检验右侧检验检验假设H0:p1=p2H1:p1≠p2H0:p1=p2H1:p1<p2H0:p1=p2H1:p1>p2P值<α拒绝H0p值=分3种情形p值=F(x1)p值=1-F(x1–1)精确检验Fisher精确检验不可以做正态近似检验大多数教科书都使用正态近似方法,此处,补充阅读仅为对精确检验进行手动计算的理解.精确检验补充阅读双比率检验双比率检验用于根据两个随机样本中的数据对两个总体比率之间的差值进行推断。Fisher精确检验基于超几何分布N=批量事件数M=批量中成功事件数n=观测数(不放回抽样)x=观测出现成功事件数超几何分布概率<‹#›>单比率检验双比率检验补充阅读超几何分布超几何分布(Hypergeometricdistribution)是一种重要的离散概率分布。例如:有N件产品,其中M件为次品,抽检n件时所得次品数X=x的概率。它描述的是由有限个物件中抽出n个物件,成功抽出指定种类的物件的次数(这里是指不放回抽样,如果是有放回抽样,概率分布属于二项分布)。<‹#›>单比率检验双比率检验一批产品20件,其中5件为优等品,检验员检测了4件产品(不放回抽样),求检验到优等品的概率分布。超几何分布的概率优等品数是0的概率=0.28173同理计算优等品数为1、2、3、4的概率X=01234P=超几何分布(X=0,1,2,3,4)X=01234p=0.281730.469560.216720.030960.00103事件=优等品N=20,M=5,n=4,X=0,1,2,3,4超几何分布的概率分布图<‹#›>单比率检验双比率检验双比率检验补充阅读Fisher精确检验Fisher精确检验基于超几何分布Fisher精确检验中原假设假定两个总体比率是相等的H0:p1=p2假设检验的例子(21)有两台相同注橡设备,生产相同老产品时,1号设备和2号设备生产产品质量无差异,投入新产品,工程师分别在1号、2号设备换上新设计的模具,2号设备新模具B使用可降低材料浪费(流道、飞边等);希望使用新模具B能与使用传统方法设计的新模具A生产的部件在外观质量(关键质量)上相同。由于每个部件的生产周期较长,不能收集大量数据,1号设备生产的部件16件,2号设备生产的部件15件。判断标准:优——外观质量评分值大于等于90分非优优模具A610模具B411<‹#›>单比率检验双比率检验双比率检验Fisher精确检验Fisher精确检验中原假设假定两个总体比率是相等的H0:p1=p2非优优合计模具A61016模具B41115合计102131接上页回顾,假设检验的基本思想是找到一个在原假设成立时的概率分布的检验统计量,再根据统计量的值是否为小概率事件来判定原假设成立是否成立。*每个事件(非优)出现的可能性相等列出事件(非优)的所有取值求出事件(非优)的每一个取值的概率总样本量N=n1+n2=16+15=31事件(非优)的所有取值M=x1+x2=6+4=10Samplesize=n1补充阅读<‹#›>单比率检验双比率检验双比率检验Fisher精确检验非优优合计模具A61016模具B41115合计102131接上页列出事件发生的所有取值事件发生事件不发生合计Ain1-in1BM-in2+i-Mn2合计MN-MN在四格表周边和(即边际分布)计数固定不变的条件下,可得到多种不同组合的四格表。为方便起见,选定行合计与列合计(n1、n2、M、N-M)均最小所对应的格子为基础。本例以i所在格子为基础,其取值的变动范围从0到对应的最小周边合计数。本例i格可变范围为0—10,可得到11个四格表。01610511596214873137841269511510610411793128821397114106015Fisher精确检验基于超几何分布(0)(1)(2)(4)(3)(5)(7)(6)(8)(9)(10)<‹#›>单比率检验双比率检验双比率检验Fisher精确检验非优优合计模具A61016模具B41115合计102131接上页事件发生事件不发生合计Ain1-in1BM-in2+i-Mn2合计MN-MN注:Fisher精确检验基于超几何分布求出事件(非优)的每一个取值的概率总样本量N=n1+n2=16+15=31事件(非优)的值M=x1+x2=6+4=10Samplesize=n1四格表周边和(即边际分布)计数固定不变,本例中:(i=0,1,2,3,……,M)我们用更一般的表达式见下页<‹#›>单比率检验双比率检验双比率检验Fisher精确检验非优优合计模具A61016模具B41115合计102131接上页事件发生事件不发生合计Aaba+bBcdc+d合计a+cb+dN一般的表达求出事件发生的每一个取值的概率(a=0,1,2,3,……,a+c)见41页,11个四格表第一个:(0)号本例中:=0.000068016105a是0的概率见41页,11个四格表第二个;(1)号=0.001806a是1的概率(0)11596(1)<‹#›>单比率检验双比率检验双比率检验Fisher精确检验接上页求出事件发生的每一个取值的概率同理运用上页公式计算a数值为2、3、……、10的概率并整理成表格如下:列出事件发生的取值(见41页11个四格表)概率paabcd0161050.000068115960.001806214870.017411313780.081250412690.2053815115100.2957496104110.246457793120.117361882130.030469971140.0038691060150.000181概率表a、b、c、d组合见41页,11个四格表(0)——(10)号<‹#›>单比率检验双比率检验双比率检验Fisher精确检验接上页事件发生的取值paabcd01610500.6667-0.6670.000068115960.06250.6-0.5380.001806214870.1250.5333-0.4080.017411313780.18750.4667-0.2790.081250412690.250.4-0.150.2053815115100.31250.3333-0.0210.2957496104110.3750.26670.10830.246457793120.43750.20.23750.117361882130.50.13330.36670.030469971140.56250.06670.49580.0038691060150.62500.6250.000181模具A生产的非优品比率为设:模具B生产的非优品比率为1给定显著水平α=0.052计算P值3建立检验假设H0:p1=p2H1:p1>p2模具A与B生产的部件在外观质量上相同模具A生产的非优品比率比B要大在周边(合计数)不变的条件下,表内四个数据还有其它组合使其非优品比率差值≥0.1083。非优优合计非优品比率模具A610160.375模具B411150.2667合计102131上表中两组非优品比率差值=0.375-0.2667=0.1083所有比上面样本表更极端的情况都应考虑进去,因为这些极端情况都可能发生,右单侧p值=F(a)=p6+p7+p8+p9+p10计算累计概率≥0.1083的有a=6,7,8、9、100.246457+0.117361+0.030469+0.003869+0.000181=0.398337∵P值=0.398337>α=0.05按α=0.05的水平无法拒绝H0右单侧检验P值:在H0成立时,出现目前状况或对原假设更不利状况的概率<‹#›>单比率检验双比率检验双比率检验Fisher精确检验事件发生的取值paabcd01610500.66670.6670.000068115960.06250.60.5380.001806214870.1250.53330.4080.017411313780.18750.46670.2790.081250412690.250.40.150.2053815115100.31250.33330.0210.2957496104110.3750.26670.10830.246457793120.43750.20.23750.117361882130.50.13330.36670.030469971140.56250.06670.49580.0038691060150.62500.6250.0001811给定显著水平α=0.052计算P值3建立检验假设H0:p1=p2H1:p1≠p2模具A与B生产的部件在外观质量上相同在周边(合计数)不变的条件下,表内四个数据还有其它组合使其非优品比率差值绝对值≥0.1083。非优优合计非优品比率模具A610160.375模具B411150.2667合计102131上表中两组非优品比率差值的绝对值=|0.375-0.2667|=0.1083双侧p值=F(a)=1-p5=1-0.295749计算累计概率差值绝对值≥0.1083的有10组(发生的取值11种)=0.704251∵P值>0.05按α=0.05的水平无法拒绝H0双侧检验模具A与B生产的部件在外观质量不同上页的右单侧检验例子中,检验P值>0.05无法拒绝H0;为了增多了解我们再来计算双侧检验P值<‹#›>单比率检验双比率检验双比率检验Fisher精确检验事件发生的取值paabcd01610500.6667-0.6670.000068115960.06250.6-0.5380.001806214870.1250.5333-0.4080.017411313780.18750.4667-0.2790.081250412690.250.4-0.150.2053815115100.31250.3333-0.0210.2957496104110.3750.26670.10830.246457793120.43750.20.23750.117361882130.50.13330.36670.030469971140.56250.06670.49580.0038691060150.62500.6250.000181α=0.05计算P值在周边(合计数)不变的条件下,表内四个数据还有其它组合使其非优品比率差值0.1083。上表中两组非优品比率差值=0.375-0.2667=0.1083左单侧p值=F(x1)=F(a)=p0+p1+p2+p3+p4+p5+p6计算累计概率0.1083的有:当a=0,1,2、3、4、5、60.000068+……+0.246457=0.848122∵P值=0.848122>α=0.05按α=0.05的水平无法拒绝H0非优优合计非优品比率模具A610160.375模具B411150.2667合计102131左单侧检验我们再来计算左单侧检验P值H0:p1=p2H1:p1<p2即先算出左侧与样本四格表情况及更极端情况的分表的概率累计<‹#›>单比率检验双比率检验双比率检验Fisher精确检验批量事件数N=n1+n2=31批量中成功事件数M=x1+x2=10观测数=n1=16观测出现成功事件数x1=6(x1=0,1,2,…、10)超几何分布的概率分布图x1012345678910当前x1=6的概率0.246457当前左单侧概率(不包括当前)当前右单侧概率(不包括当前)<‹#›>单比率检验双比率检验双比率检验补充阅读Fisher精确检验事件发生的取值paxi00.00006810.00180620.01741130.08125040.20538150.29574960.24645770.11736180.03046990.003869100.000181发生的取值i种(本例11种)中位数记作xM(本例xM=5)回顾假设检验的例子(21)H1:p1<p2p值=F(x1)=p0+p1+p2+p3+p4+p5+p6x1=6事件发生的取值paxi00.00006810.00180620.01741130.08125040.20538150.29574960.24645770.11736180.03046990.003869100.000181x1=6H1:p1>p2p值=1-F(x1-1)=1-(p0+p1+p2+p3+p4+p5)(=p6+p7+p8+p9+p10)H1:p1≠p2情形1:x1<xMp值=F(x1)+1-F(y-1)y是小于xM最大整数,当p(y)p(x1)。情形2:x1>xMp值=F(y)+1-F(x1-1)y是大于xM最小整数,当p(y)p(x1)。情形3:x1=xMp值=1p值=F(y)+1-F(x1-1)=p0+p1+p2+p3+p4+1-(p0+p1+p2+p3+p4+p5)(本例x1=6>xM=5)事件发生的取值paxi00.00006810.00180620.01741130.08125040.20538150.29574960.24645770.11736180.03046990.003869100.000181F(y)F(x1-1)1-F(x1-1)xMxMxMx1=6<‹#›>单比率检验双比率检验双比率检验补充阅读Fisher精确检验假设检验的例子(22)判断标准:不合格合格A114B69某产品断裂强度执行新标准,工程师分别开发了两种材料配方,为了解两种材料配方生产的产品在断裂强方面是否不同,A材料配方和B材料配方各生产了产品15件。(新标准:≥12MPa)合格:大于等于13MPa不合格合格合计A11415B6915合计72330列出事件发生的所有取值本例以x1为基础,可变范围为0-7,可得到8个四格表。x1=1abcdabcd015781146921351031241141131251021369114780158个四格表的组合<‹#›>单比率检验双比率检验双比率检验补充阅读Fisher精确检验abcd01578114692135103124114113125102136911478015(a=0,1,2,…,7)本例中:=0.003161是0的概率是1的概率1给定显著水平α=0.052A材料配方比B材料配方产品不合格率低左单侧检验H0:p1=p2H1:p1<p2A材料配方和B材料配方生产的产品不合格率相同p值=F(x1)=p0+p13计算p值x1=1=0.036877xipa00.00316110.03687720.15488530.30507740.30507750.15488560.03687770.003161事件发生的每一个取值的概率∵P值=0.040038<α=0.05按α=0.05的水平拒绝零假设H0p值=F(x1)=p0+p1=0.003161+0.036877=0.040038即:A材料配方比B材料配方产品不合格率低<‹#›>单比率检验双比率检验双比率检验补充阅读Fisher精确检验abcd01578114692135103124114113125102136911478015(a=0,1,2,…,7)本例中:=0.003161是0的概率1给定显著水平α=0.052A材料配方比B材料配方产品不合格率要高右单侧检验A材料配方和B材料配方生产的产品不合格率相同3计算p值x1=1xipa00.00316110.03687720.15488530.30507740.30507750.15488560.03687770.003161事件发生的每一个取值的概率∵P值=0.996839>α=0.05按α=0.05的水平不拒绝零假设H0p值=1-p0=1-0.003161=0.996839H0:p1=p2H1:p1>p2练习右单侧检验p值=1-F(x1-1)=1-(p0)<‹#›>单比率检验双比率检验双比率检验补充阅读Fisher精确检验abcd015781146921351031241141131251021369114780151给定显著水平α=0.052双侧检验A材料配方和B材料配方生产的产品不合格率相同3计算p值x1=1xipa00.00316110.03687720.15488530.30507740.30507750.15488560.03687770.003161∵P值=0.080076>α=0.05按α=0.05的水平不拒绝零假设H0=0.080076练习双侧检验H0:p1=p2H1:p1≠p2A材料配方和B材料配方生产的产品不合格率不同p值=F(x1)+1-F(y–1)=p0+p1+1-(p0+p1+p2+p3+p4+p5)=p0+p1+p6+p7y是大于xM最小整数,当p(y)p(x1)。而p(6)p(x1)即:y是6(本例x1=1<xM=3.5)=(0.003161+0.036877)×2<‹#›>单比率检验双比率检验双比率检验Fisher精确检验如果两组数相等n1=n2,则列出的超几何分布的概率分布表是对称的,可以简化计算,即先算出一侧与样本四格表情况及比其更极端情况的分表的概率,再乘以2便为所求概率。如果是单侧检验,只求与样本四格表情况相同及比其更极端情况一侧的概率。x101234567当前x1=1的概率当前左单侧更极端情况的概左侧更极端情况的概率当前右单侧更极端情况的概n1=n2分布对称<‹#›>单比率检验双比率检验检验功效和样本数量分析补充阅读精确检验对于所有样本数量都是准确有效的双比率检验Fisher精确检验精确检验(直接计算概率法)单比率检验二项分布的概率计算法双比率检验超几何分布的概率计算法样本含量n足够大,与均大于5,可利用正态分布的原理作
本文档为【假设检验与样本数量分析④——单比率检验、双比率检验】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
机构认证用户
夕夕资料
拥有专业强大的教研实力和完善的师资团队,专注为用户提供合同简历、论文写作、PPT设计、计划书、策划案、各类模板等,同时素材和资料部分来自网络,仅供参考.
格式:ppt
大小:2MB
软件:PowerPoint
页数:0
分类:其他高等教育
上传时间:2021-06-21
浏览量:95