首页 第七章节 假设检验

第七章节 假设检验

举报
开通vip

第七章节 假设检验第七章假设检验 第一节假设检验基本原理 第二节总体参数假设检验 第三节非参数检验第一节假设检验基本原理 假设检验(HypothesisTesting)也称为显著性检验。是事先作出一个关于总体参数的假设,然后利用样本信息来判断原假设是否合理,即判断样本信息与原假设是否有显著差异,从而决定应接受或否定原假设的统计推断方法。 特点:1)采用逻辑上的反证法 􀂄􀂄2)依据统计上的小概率原理假设检验的过程和思路——概率意义下的反证法总体假设总体的平均年龄是20岁样本均值是18岁样本假设检验中的小概率...

第七章节 假设检验
第七章假设检验 第一节假设检验基本原理 第二节总体参数假设检验 第三节非参数检验第一节假设检验基本原理 假设检验(HypothesisTesting)也称为显著性检验。是事先作出一个关于总体参数的假设,然后利用样本信息来判断原假设是否合理,即判断样本信息与原假设是否有显著差异,从而决定应接受或否定原假设的统计推断 方法 快递客服问题件处理详细方法山木方法pdf计算方法pdf华与华方法下载八字理论方法下载 。 特点:1)采用逻辑上的反证法 􀂄􀂄2)依据统计上的小概率原理假设检验的过程和思路——概率意义下的反证法总体假设总体的平均年龄是20岁样本均值是18岁样本假设检验中的小概率原理 什么小概率? 1.在一次试验中,一个几乎不可能发生的 事件发生的概率 2.在一次试验中小概率事件一旦发生,我 们就有理由拒绝原假设 3.小概率由研究者事先确定。 假设检验中把这个小概率称为显著性水平, 关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf 示为。常见的取值有1%,5%,10%。这个值越小,拒绝原假设的判断的说服力越强。􀂨􀂨假设检验的步骤 提出原假设和备择假设 􀂃􀂃确定适当的检验统计量 􀂃􀂃规定显著性水平α 􀂃􀂃计算检验统计量的值 􀂃􀂃作出统计决策提出原假设和备择假设 什么是原假设?(NullHypothesis) 1.待检验的假设,又称“0假设” 2.如果错误地作出决策会导致一系列后果 3.总是有等号=,≤或≥ 4.表示为H0 􀂄􀂄H0:μ=某一数值 􀂄􀂄指定为=号,即≤或≥ 􀂄􀂄例如,H0:μ=3190(克)提出原假设和备择假设 什么是备择假设?(AlternativeHypothesis) 1.与原假设对立的假设 2.总是有不等号:≠,<或> 3.表示为H1 􀂄􀂄H1:μ<某一数值,或μ>某一数值 􀂄􀂄例如,H1:μ<3910(克),或μ>3910(克)确定适当的检验统计量 􀂨什么检验统计量? 1.用于假设检验问题的统计量 2.选择统计量的方法与参数估计相同,需考虑 􀂄􀂄是大样本还是小样本 􀂄􀂄总体方差已知还是未知 3.检验统计量的基本形式: 规定显著性水平α 􀂨􀂨什么显著性水平?1.是一个概率值2.原假设为真时,拒绝原假设的概率􀂄􀂄被称为抽样分布的拒绝域3.表示为α(alpha)􀂄􀂄常用的α值有0.01,0.05,0.104.由研究者事先确定作出统计决策 1.计算检验的统计量 2.根据给定的显著性水平α,查表得出相应 的临界值Ζα或Ζα/2从而确定H0的接受域和拒绝域 3.将检验统计量的值与α水平的临界值进 行比较 4.得出接受或拒绝原假设的结论(统计量的值落在H0的拒绝域,拒绝原假设,落在接受域,接受原假设。) 对于不同形式的假设,H0的接受域和拒绝域也有所不同。如图所示,双侧检验的拒绝域位于统计量分布曲线的两侧,左单侧检验的拒绝域位于统计量分布曲线的左侧,右单侧检验的拒绝域位于统计量分布曲线的右侧。双侧检验与单侧检验 双侧检验、单侧检验与原假设形式的关系。(以总体均值的假设为例)双侧检验(原假设与备择假设的确定) 1.双侧检验属于决策中的假设检验。也就是说,不论是拒绝H0还是接受H0,我们都必需 采取相应的行动措施 2.例如,某种零件的尺寸,要求其平均长度为10厘米,大于或小于10厘米均属于不合格 3.建立的原假设与备择假设应为 H0:μ=10H1:μ≠10双侧检验(确定假设的步骤) 1.例如问题为:检验该企业生产的零件平均 长度为4厘米 2.步骤 􀂄􀂄从统计角度陈述问题(μ=4) 􀂄􀂄从统计角度提出相反的问题(μ≠4) 􀁺􀁺必需互斥和穷尽 􀂄􀂄提出原假设(μ=4) 􀂄􀂄提出备择假设(μ≠4) 􀁺􀁺有≠符号双侧检验(例子) 该企业生产的零件平均长度是4厘米吗? (属于决策中的假设) 提出原假设:H0:μ=4 提出备择假设:H1:μ≠4双侧检验(显著性水平与拒绝域)双侧检验(显著性水平与拒绝域)单侧检验(原假设与备择假设的确定) 􀂨􀂨检验研究中的假设 1.将所研究的假设作为备择假设H1 2.将认为研究结果是无效的说法或理论作为原假设H0。或者说,把希望(想要)证明的假设作为备择假设 3.先确立备择假设H1单侧检验(原假设与备择假设的确定) 例如,采用新技术生产后,将会使产品的使用寿命明显延长到1500小时以上􀂄􀂄属于研究中的假设 建立的原假设与备择假设应为H0:μ≤1500H1:μ>1500 例如,改进生产工艺后,会使产品的废品率降低到2%以下􀂄属于研究中的假设 建立的原假设与备择假设应为H0:μ≥2%H1:μ<2%单侧检验(原假设与备择假设的确定) 􀂨检验某项声明的有效性 1.将所作出的说明(声明)作为原假设 2.对该说明的质疑作为备择假设 3.先确立原假设H0 􀂄􀂄除非我们有证据表明“声明”无效,否则就应认为该“声明”是有效的 例如,某灯泡制造商声称,该企业所生产的灯泡的平均使用寿命在1000小时以上 除非样本能提供证据表明使用寿命在1000小时以下,否则就应认为厂商的声称是正确的 建立的原假设与备择假设应为H0:μ≥1000H1:μ<1000单侧检验(例子) 学生中经常上网的人数超过25%吗?(属于研究中的假设,先提出备择假设)提出原假设:H0:μ≤25选择备择假设:H1::μ>25 该批产品的平均使用寿命超过1000小时吗?(属于检验声明的有效性,先提出原假设)提出原假设:H0:μ≥1000选择备择假设:H1:μ<1000 左侧检验(显著性水平与拒绝域)左侧检验(显著性水平与拒绝域)右侧检验(显著性水平与拒绝域)右侧检验(显著性水平与拒绝域)假设检验中的P值 P值(P-value)是指在原假设为真时,所得到的样本观察结果或更极端结果的概率,即样本统计量落在观察值以外的概率。 根据“小概率原理”,如果P值非常小,就有理由拒绝原假设,且P值越小,拒绝的理由就越充分。 实际应用中,多数统计软件直接给出P值,其检验判断规则如下: 1.单侧检验 􀂄􀂄若p-值≥α,不能拒绝H0 􀂄􀂄若p-值<α,拒绝H0 2.双侧检验 􀂄􀂄若p-值≥α/2,不能拒绝H0 􀂄􀂄若p-值<α/2,拒绝H0 。假设检验中的两类错误 1.第一类错误(弃真错误) 􀂄􀂄原假设为真时拒绝原假设 􀂄􀂄会产生一系列后果 􀂄􀂄第一类错误的概率为α 􀁺􀁺被称为显著性水平 2.第二类错误(取伪错误) 􀂄􀂄原假设为假时接受原假设 􀂄􀂄第二类错误的概率为β(Beta)假设检验中的两类错误(决策结果) 影响β错误的因素 1.总体参数的真值 􀂄􀂄随着假设的总体参数的减少而增大 2.显著性水平α 􀂄􀂄当α减少时增大 3.总体标准差σ 􀂄􀂄当σ增大时增大 4.样本容量n 􀂄􀂄当n减少时增大检验功效 在犯第一类错误概率得到控制的条件下,犯取伪错误的概率也要尽可能地小,或者说,不取伪的概率1-β应尽可能增大。1-β越大,意味着当原假设不真实时,检验判断出原假设不真实的概率越大,检验的判别能力就越好;1-β越小,意味着当原假设不真实时,检验结论判断出原假设不真实的概率越小,检验的判别能力就越差。可见1-β是反映统计检验判别能力大小的重要标志,我们称之为检验功效或检验力。第二节总体参数的假设检验假设检验总体均值的假设检验总体比例(单样本、两个样本)的假设检验总体方差的假设检验s未知s已知两个总体均值差的假设检验Z检验(单尾、双尾)T检验(单尾、双尾)Z检验(单尾、双尾)一个总体方差比开方检验F检验(单尾双尾)F(n1,n2)均值已知F(n1-1,n2-1)均值未知方差已知方差未知但相等Z检验(单尾、双尾)T检验(单尾、双尾)总体均值的双尾Z检验(σ2已知) 1.假定条件􀂄􀂄总体服从正态分布􀂄若不服从正态分布,可用正态分布来近似(n≥30) 2.原假设为:H0:μ=μ0;备择假设为:H1:μ≠μ0 3.使用z-统计量总体均值的双尾Z检验(实例) 【例】某机床厂加工一种零件,根据经验知道,该厂加工零件的椭圆度近似服从正态分布,其总体均值为μ0=0.081mm,总体标准差为σ=0.025。今换一种新机床进行加工,抽取n=200个零件进行检验,得到的椭圆度为0.076mm。试问新机床加工零件的椭圆度的均值与以前有无显著差异?(α=0.05)总体均值的双尾Z检验(计算结果)均值的单尾Z检验(σ2已知) 1.假定条件􀂄􀂄总体服从正态分布􀂄􀂄若不服从正态分布,可以用正态分布来近似(n≥30) 2.备择假设有<或>符号 3.使用z-统计量实例 【例】某批发商欲从生产厂家购进一批灯泡,根据 合同 劳动合同范本免费下载装修合同范本免费下载租赁合同免费下载房屋买卖合同下载劳务合同范本下载 规定,灯泡的使用寿命平均不能低于1000小时。已知灯泡使用寿命服从正态分布,标准差为20小时。在总体中随机抽取100只灯泡,测得样本均值为960小时。批发商是否应该购买这批灯泡?(α=0.05) 【例】根据过去大量资料,某厂生产的灯泡的使用寿命服从正态分布N~(1020,1002)。现从最近生产的一批产品中随机抽取16只,测得样本平均寿命为1080小时。试在0.05的显著性水平下判断这批产品的使用寿命是否有显著提高?(α=0.05)总体均值的双尾t检验(σ2未知)-小样本 1.假定条件 􀂄􀂄总体为正态分布 2.使用t统计量 【例】某厂采用自动包装机分装产品,假定每包产品的重量服从正态分布,每包标准重量为1000克。某日随机抽查9包,测得样本平均重量为986克,样本标准差为24克。试问在0.05的显著性水平上,能否认为这天自动包装机工作正常?一个总体比例的Z检验 1.假定条件 􀂄􀂄有两类结果 􀂄􀂄总体服从二项分布 􀂄􀂄可用正态分布来近似 2.比例检验的z统计量 【例】某研究者估计本市居民家庭的电脑拥有率为30%。现随机抽查了200的家庭,其中68个家庭拥有电脑。试问研究者的估计是否可信?(α=0.05)方差的卡方(χ2)检验 1.检验一个总体的方差或标准差 2.假设总体近似服从正态分布 3.原假设为H0:σ2=σ02 4.检验统计量 【例】根据长期正常生产的资料可知,某厂所产维尼纶的纤度服从正态分布,其方差为0.0025。现从某日产品中随机抽取20根,测得样本方差为0.0042。试判断该日纤度的波动与平日有无显著差异?(α=0.05)两个总体均值之差的Z检验(方差已知) 1.假定条件 􀂄􀂄两个样本是独立的随机样本 􀂄􀂄两个总体都是正态分布 􀂄􀂄若不是正态分布,可以用正态分布来近似(n1≥30和n2≥30) 2.原假设:H0:μ1−μ2=0;备择假设:H1:μ1−μ2≠0 3.检验统计量为 【例】有两种方法可用于制造某种以抗拉强度为重要特征的产品。根据以往的资料得知,第一种方法生产出的产品其抗拉强度的标准差为8公斤,第二种方法的标准差为10公斤。从两种方法生产的产品中各抽取一个随机样本,样本容量分别为n1=32,n2=40,测得⎯x2=50公斤,⎯x1=44公斤。问这两种方法生产的产品平均抗拉强度是否有显著差别?(α=0.05)两个总体均值之差的t检验(方差未知但相等) 1.检验具有等方差的两个总体的均值 2.假定条件 􀂄􀂄两个样本是独立的随机样本 􀂄􀂄两个总体都是正态分布 􀂄􀂄两个总体方差未知但相等 3.检验统计量 【例】一个车间研究用两种不同的工艺组装某种产品所用的时间是否相同。让一个组的10名工人用第一种工艺组装该产品,平均所需时间为26.1分钟,样本标准差为12分钟;另一组8名工人用第二种工艺组装,平均所需时间为17.6分钟,样本标准差为10.5分钟。已知用两种工艺组装产品所用时间服从正态分布,且σ12=σ22。试问能否认为用第二种方法组装比用第一中方法组装更好?(α=0.05)两个总体比例之差的Z检验 1.假定条件 􀂄􀂄两个总体是独立的 􀂄􀂄两个总体都服从二项分布 􀂄􀂄可以用正态分布来近似 2.检验统计量 【例】对两个大型企业青年工人参加技术培训的情况进行调查,调查结果如下:甲厂:调查60人,18人参加技术培训。乙厂调查40人,14人参加技术培训。能否根据以上调查结果认为乙厂工人参加技术培训的人数比例高于甲厂?(α=0.05)第三节非参数检验(了解) 非参数检验是对总体的分布不作任何限制的统计检验。故非参数检验又称为自由分布检验。正因为如此,非参数检验成为管理科学中应用较为广泛的一种统计检验方法。一检验 列联表的独立性检验 检验的一项重要应用是检验两属性的关系,我们按照两种标准分组的N个观测值,希望了解这两种标准是相关的还是独立的。 样本数据按两种属性双向分类表——列联表 在列联表中,人们关心的问题是两个特性是否独立,称这类问题为列联表的独立性检验。一检验 一检验 例4(P99)调查房屋类型与每周去邮局有无关联,结果如下。在α=0.005下检验房屋类型与每周去邮局的次数有无关联。 每周去邮局次数 房屋类型 复式结构 公寓 平房 其他 行和ni. <1 30 5 4 1 40 1 110 80 8 2 200 2 5 10 33 2 50 >2 5 5 0 0 10 列和n.j 150 100 45 5 300一检验 例4解:计算每小格中理论值 每周去邮局次数 房屋类型 复式结构 公寓 平房 其他 行和ni. <1 30(20) 5(13.3) 4(6) 1(0.7) 40 1 110(100) 80(66.7) 8(30) 2(3.3) 200 2 5(25) 10(16.7) 33(7.5) 2(0.8) 50 >2 5(5) 5(3.3) 0(1.5) 0(0.2) 10 列和n.j 150 100 45 5 300一检验 合并原有小格,使合并后每小格的E5。 去邮局次数 复式结构 公寓 平房等 行和ni. <1 30(20) 5(13.3) 5(6.7) 40 1 110(100) 80(66.7) 10(33.3) 200 2 10(30) 15(20) 35(10) 60 列和n.j 150 100 50 300二、符号检验 该方法是建立在以正、负号表示样本数据与假设参数值差异关系基础上的,因此称之为符号检验。该方法既适用于单样本场合,也适用于配对样本场合。(一)单样本场合的符号检验 中位数检验: :=A 样本每个数据都减去A,只记录其差数的符号。n+与n-分别是正、负符号的个数,当原假设为真是时,n+与n-应该很接近;若两者相差太远,就有有理由拒绝原假设。 例4:设有20个工人,他们一天生产的产品件数,抽样结果如下: 168,163,160,172,162,168,152,153,167,165,164,142,173,166,160,165,171,186,167,170。 试以α=0.10的检验水平,判定总体中位数是否是160。 解:第一步:作出假设。 :=160,:160 由备选假设知,这个检验是双侧的。 第二步:计数。 对样本数据,大于160的记下“+”,小于160的记下“-”,等于160的,予以剔除(以0记之),结果如下: ++0+++--+++-++0+++++ 计数以上“+”的个数是n+=15,“-”的个数n-=3,剔除数据2个。最后有效的样本个数为n=n++n-=18。 第三步:确定拒绝域。 显著水平α=0.10,由于进行双侧检验,拒绝域分布在两边,每侧概率α/2=0.05,查二项分布临界值表,得到拒绝域的临界值是13。 第四步:选择n+、n-较大者,再与临界值比较。 结果是15>13。 第五步:判断。 由于上一步的比较结果可知,样本落入拒绝域,所以拒绝原假设,认为样本数据不能证明总体中位数等于160件。(二)配对样本场合的符号检验 样本配对场合与单样本场合的符号检验,基本原理是一致的。设从两个总体中分别抽出一个容量相等的样本,然后将两样本的数据进行一一配对,得到一组配对值。再将各对配对值相减,记录下差数的符号,计算出“+”的个数n+与“-”的个数n-。如果两个样本的总体差异不显著,配对值之差的正负号出现的概率各是1/2,则n+与n-应当非常接近;如果n+、n-相差太大的话,说明两总体存在显著差异。例子见 关于书的成语关于读书的排比句社区图书漂流公约怎么写关于读书的小报汉书pdf 上的。三、秩和检验 秩和检验也称Wilcoxon-Man-Whitney检验。该检验方法可用于检验两个独立的样本是否来自同一个总体,或判断总体间是否存在显著性的差异。它和符号检验最主要的区别是,符号检验只考虑样本间差数的符号,而秩和检验还要考虑差数的顺序,比符号检验利用数据信息更加充分,因此,检验功效就更强。 秩和检验原理: 设分别从两个未知的总体独立、随机地抽取容量为n1和n2的样本,把样本容量较小的总体称为总体Ⅰ。如果两样本容量相等,就把任意一个总体称作总体Ⅰ,另一个总体称作总体Ⅱ,这里不妨设n1<n2。 现将两个样本混合起来,并按数据的大小,从小到大排列编号,每个数值的编号就是它的秩次。如果混合样本中有若干个相同的数值,则把它们的秩次进行简单算术平均,用此平均值作为这些数值的秩次,计算来自总体Ⅰ的n1个数据在混合样本中的秩次之和,记为T。 显然T最小的可能值是: T1=1+2+3+…+n1=[n1(n1+1)]/2; 最大的可能值是 T2=(n2+1)+(n2+2)+…+(n2+n1)=n1[(n2+1)+(n2+n1)]/2。 如果两个总体分布无显著差异,则T值不应太大或太小,等于中间值(T1+T2)/2;如果总体Ⅰ分布于总体Ⅱ的右边,T将接近其最大值T2;如果总体Ⅰ位于总体Ⅱ的左边,T将接近于它的最小值T1。因此,我们可以用秩和T作为检验的统计量。 第一种方法,当n1和n2都不超过10时,查“秩和检验表”确定临界值; 第二种方法,当n1和n2都超过10时,秩和T服从正态分布: 先对T进行标准化变换,再利用标准正态分布表,确定检验的临界值。 例5:有A、B两家厂商供应同一种商品,两家商品价格与性能一致,但使用寿命是否一致有待检验。今分别从两家生产产品中抽出样本,测定产品使用寿命(见下表,单位:小时): 试以0.05的显著性水平,检验两厂商产品寿命是否有差异?Sheet1 A厂商产品: 5 11 6 9 7 10 B厂商产品: 8 6 10 7 8 解:第一步:作出假设。 H0:MA=MB,H1: 原假设是两厂商生产的产品没有差异,平均寿命相同,备选假设是平均寿命不相同,是双侧检验。 第二步:求秩和。 将样本混合、排列:Sheet1 数据: 5 6 6 7 7 8 8 9 10 10 11 秩号: 1 2.5 2.5 4.5 4.5 6.5 6.5 8 9.5 9.5 11 以上数据下面划横线的为B厂商产品寿命。B厂商产品样本容量小,看做总体Ⅰ,n1=5。A厂商产品是总体Ⅱ,n2=6。总体Ⅰ的秩和T=2.5+4.5+6.5+6.5+9.5=29.5。 第三步:确定拒绝域。 显著水平α=0.05,进行双侧检验,查“秩和检验表”,n1=5,n2=6,得临界值T1(α)=20,T2(α)=40。 第四步:比较秩和与临界值大小。 结果是:20<29.5<40,即T1(α)<T<T2(α)。 第五步:判断。 样本落入接受域,所以接受原假设,样本数据证明A、B两厂商产品的寿命也是一致的。
本文档为【第七章节 假设检验】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: ¥17.91 已有0 人下载
最新资料
资料动态
专题动态
个人认证用户
伊人
暂无简介~
格式:ppt
大小:910KB
软件:PowerPoint
页数:0
分类:交通与物流
上传时间:2018-12-04
浏览量:17