首页 第十一章非参数检验

第十一章非参数检验

举报
开通vip

第十一章非参数检验第十一章非参数检验为什么用非参数方法?经典统计的多数检验都假定了总体的背景分布。但也有些没有假定总体分布的具体形式,仅仅依赖于数据观测值的相对大小(秩)或零假设下等可能的概率等和数据本身的具体总体分布无关的性质进行检验。这都称为非参数检验。非参数检验是不依赖于总体分布的统计检验方法。在总体分布未知时有很大的优越性。非参数检验总是比传统检验安全。它的假设前提比参数检验要少得多,它不要求总体分布具有特定的形式,只对总体作些很一般的假定。比如:分布函数连续、对称、有密度或具有某阶矩等。因此它适用于计算信息较弱的资料且计算...

第十一章非参数检验
第十一章非参数检验为什么用非参数 方法 快递客服问题件处理详细方法山木方法pdf计算方法pdf华与华方法下载八字理论方法下载 ?经典统计的多数检验都假定了总体的背景分布。但也有些没有假定总体分布的具体形式,仅仅依赖于数据观测值的相对大小(秩)或零假设下等可能的概率等和数据本身的具体总体分布无关的性质进行检验。这都称为非参数检验。非参数检验是不依赖于总体分布的统计检验方法。在总体分布未知时有很大的优越性。非参数检验总是比传统检验安全。它的假设前提比参数检验要少得多,它不要求总体分布具有特定的形式,只对总体作些很一般的假定。比如:分布函数连续、对称、有密度或具有某阶矩等。因此它适用于计算信息较弱的资料且计算方法比较简单。但是在总体分布形式已知时,非参数检验就不如传统方法效率高。是否用非参数统计方法,要根据对总体分布的了解程度来确定。 非参数检验方法:Chi—Squaretest卡方检验Binominaltest二项式检验Runstest游程检验1—SampleK—Stest一个样本的柯尔莫果洛夫—斯米尔诺夫检验2—IndependentSamplestest两个独立样本检验KIndependentSamplestestK个(多个)独立样本检验2RelatedSamplestest两个相关样本检验KRelatedSamplestestK个(多个)相关样本检验第一节卡方检验一、基本问 快递公司问题件快递公司问题件货款处理关于圆的周长面积重点题型关于解方程组的题及答案关于南海问题 设总体X的分布函数为,而是一个未知的分布函数,为某一给定(即已知)的分布函数。欲检验:数据资料是从总体X中抽取的样本。二、基本原理1、基本思想:若样本的频率分布与总体概率分布相差不大时,则认为成立;反之,不成立。2、具体做法:(1)问题的转换取,把分为k组,记第i组的频数为,要求(否则合并相邻组);于是得第i组的频率为:在第i段的概率。可由计算第i组的概率:则问题转换为:(2)构造统计量称为皮尔逊统计量。其中 关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf 示期望频数(为实际频数)。(3)统计量的分布可 证明 住所证明下载场所使用证明下载诊断证明下载住所证明下载爱问住所证明下载爱问 ,当成立时(4)判断若,则拒绝;否则,接受。注:若含有未知参数(如:,其中未知),不能计算;此时,先由样本对未知参数求出最大似然估计量,并用最大似然估计代替未知参数,从而计算。三、基本计算1、建立数据文件(1)、变量与数据;定义变量x,频数变量weight。(2)、确定weight为频数变量。2、选择统计方法依次选择Analyze→Nonparametrictests→Chisquare。3、结果说明解释输出结果的统计意义。例10.1.1从随机数表抽取200个观察数据,经整理列入下面的观察数据的组下限与频数表中组下限00.10.20.30.40.50.60.70.80.9频数23212617151525142519试检验从该数据表中抽取的数否服从[0,1]上的均匀分布。第二节二项分布检验一、基本问题1、二分值变量--变量只取0、1两个值。2、二分值问题--只有两种可能结果的问题。如:掷一枚硬币有两种可能的结果:出现正面、反面。考察一个人是否色盲,有两种可能结果:色盲、正常。3、对一个二分值问题,总可以用一个二分值变量表示。一般对一个二分值问题的两种可能结果,其中某一种结果称为“成功”,另一种称为“失败”,则其相应的二分值变量为X,“X=1”:表示试验的结果为“成功”;“X=2”:表示试验的结果为“失败”。记,即表示“成功”的概率。对做如下检验:双侧检验:单侧检验:数据资料是,每个都是二分值变量。二、基本原理1、统计量表示n次试验中成功的次数,在成立的条件下,服从二项分布,即2、具体判断计算的值,并根据二项分布计算相应的显著性概率Sig.。若Sig.<给定的显著水平,则拒绝;否则,接受。当试验总次数n较大时近似服从正态分布,所以往往根据正态分布计算Sig.的近似值。注:系统默认设置为当时,进行双侧检验;当是其它任意值时,进行单侧检验。三、基本计算1、建立数据文件(1)、变量与数据;定义二分值变量x,频数变量frequenc。(2)、确定frequenc为频数变量。2、选择统计方法依次选择Analyze→Nonparametrictests→Binomial。3、结果说明解释输出结果的统计意义。例10.2.2对一项教育措施实施后检查教学效果,学生中有进步的有78人,没有进步的有52人。问此项教育措施是否有效?第三节游程检验游程检验(Runs)亦称连贯检验或串检验Wald-Wolfowtiz游程检验。它是利用游程的总个数获得统计推断结论的方法。游程就是在0,1序列中0或1的连续段,即0或1的每个连续段称为一个游程。如:0111010111110的0,1序列中,第1个游程为0,第2个游程为111,第3个游程为0,第4个游程为1,第5个游程为0,第6个游程为11111,第7个游程为0,共7个游程。一、基本问题检验多个二分值问题之间是否相互独立?即假设:多个二分值问题之间独立。二、基本原理1、构造统计量一般地,对一个0,1序列,令U=游程的总个数。若成立,则在0,1序列中,0和1出现相互交替比较均匀,如010101…,从而游程总个数U较大。若不成立,则在0,1序列中0和1出现相互交替不均匀,如0000111……,从而游程总个数U较小。因此U就是用来解决问题的统计量。2、统计量的分布(1)当较小时,U有游程检验表;(2)当较大时,U近似服从正态分布,即其中,表示0的个数,表示1的个数。3、具体判断计算出U或Z的值,并根据相应分布计算显著性概率Sig.,若Sig.<给定的显著性水平,拒绝;否则接受。三、基本计算1、建立数据文件定义变量x。2、选择统计方法依次选择Analyze→Nonparametrictests→Runtest。3、结果说明解释输出结果的统计意义。例10.3.1设天气预报记录20天是否下雪的情况,得到以下序列(1表示下雪,0表示没下雪):01111111010111111100。研究者想知道到某一天下雪或不下雪对以后的天气是否下雪有无影响。第四节单样本的Komogorov-Smirnov检验一、基本问题设总体X的分布函数为,而是一个未知的分布函数,为某一给定(即已知)的分布函数。欲检验:数据资料是从总体X中抽取的样本。二、基本原理1、基本思想:若样本的经验分布函数与总体分布函数相差不大时,则认为成立;反之,不成立。2、具体做法:(1)问题的转换当为真时,总体X的分布可以认为是,所抽取的n个样本可以认为是来自于分布函数,利用这n个样本构造经验分布函数,则有;从而,问题转换为:(2)构造统计量(3)统计量的分布可证明,当成立时(4)具体判断若,则拒绝;否则,接受。三、基本计算1、建立数据文件(1)、变量与数据;定义变量x,频数变量weight。(2)、确定weight为频数变量。2、选择统计方法依次选择Analyze→Nonparametrictests→1-sampleK-Stest。3、结果说明解释输出结果的统计意义。例10.4.1某维尼纶车间生产纤维,现从该车间生产的产品中抽测50个样本得到纤维的强力指标如下:6.47.25.66.27.14.86.17.58.26.17.28.05.84.74.56.66.26.77.77.06.79.67.36.25.74.47.37.65.86.47.16.65.55.76.05.54.75.67.06.75.78.16.45.94.86.66.87.35.68.2试检验纤维的强力指标是否服从正态分布。注:以上几节介绍了用于单样本非参数检验的四个过程。其中Runs是二分变量的两个值是否随机地出现。当检验假设是要考察样本是否来自指定分布的总体时,可采用二项检验、—检验、和K—S检验。当数据的分类只有两类时,用二项检验;当样本容量小到—检验不能应用时,二项检验是唯一可用的。K—S检验要求总体分布必须假定为连续的。在所有能用的情况中,K—S检验是所讲到检验中功效最强的拟合优度检验。第五节两个独立样本的检验一、基本问题设总体X的分布函数为,总体Y的分布函数为;其中总体X与总体Y相互独立,且,均是未知的分布函数。欲检验:数据资料是从总体X中抽取的样本;以及从总体Y中抽取的样本。二、基本原理1、秩和检验秩的定义:将两组样本与按从小到大顺序排列,并重新编号为:;规定每个数据在上面排列中所对应的序号为该数据的秩,相同数值的数据用它们的序号的平均值作为秩。(1)问题的转换令总体X的样本数据的秩的和,总体Y的样本数据的秩的和。则有当成立时,值不应靠近上式左、右两端,因此问题转换为:值不能过大或过小。(2)、构造统计量a、当较小时,令b、当较大时,令(3)、统计量的分布当为真时:a、U有秩和检验表;b、,由中心极限定理。(4)、具体判断计算出U或Z的值,并根据相应分布计算显著性概率Sig.,若Sig.<给定的显著性水平,拒绝;否则接受。2、Kolmogorov-SmirnovZ法(1)问题的转换:当为真时,,因而因此,问题转换为(2)、构造统计量可证明,当成立时,D偏小;当不成立时,D偏大。从而,令(3)统计量的分布当为真时:Z服从分布。(4)、具体判断计算出D的值(或Z的值)和相应的显著性概率Sig.,若Sig.<给定的显著性水平,则拒绝;否则接受。3、Moseextremereactions法(即极端反应法)目的:研究者希望实验组在接受某种处理后,有些对象有某种反应,而另一些对象有相反的反应,因此,实验组测量的散布范围比控制组(或对比组)来得广(大)。(1)问题的转换实验组F(X):控制组G(X):问题转换为检验,H0:实验组无极端反应。(1)构造统计量将两组样本按从小到大排列,找出控制组(对照组)的两个极端位置,即该组数据的最小位置和最大位置。令W0=控制组的两个极端位置之差W1=去掉两个极端位置后控制组的极端位置之差类似地定义W2、W3、…等。若成立,那么样本和在排序中交错比较均匀,此时W0偏大。因此如果W0偏小,则拒绝H0。由于仅用极端值的信息,感觉到此法粗糙,所以除用W0外,还用W1进行判断。⑵具体判断计算出W0的值和相应的显著性概率Sig.。若Sig.<给定的显著性水平,则拒绝H0;否则接受H0。用W1、W2、…判断亦类似。4、Wald—Wolfowiz法(也称游程检验法)将总体X的样本和总体Y的样本一起按从小到大排列,凡是总体X的数据以0记,凡是总体Y的数据以1记,则得到一个0,1序列。从而转换为二分值问题。如果H0成立,则0,1序列中0和1交错出现比较均匀,即0和1出现是相互独立的。因此,(10.5.1)的假设就等于(10.3.1)的假设,从而可使用游程检验法(即Runs法)。注:上述几种方法都可以用来检验独立样本之间的“差异显著性”,但各种方法对不同种类的差异敏感程度不一样。例如,若检验两个样本是否抽自代表位置(集中趋势)有差异的总体,就应该选择对这种差异最敏感的检验方法,如Mann-WhitneyU法;如果研究者感兴趣的是确定两个样本是否来自任何一个方面(如位置、跨度、偏度等)有差异的总体,就应选择Kolmogorov-SmirnovZ法,Wald-Wolfowitz法;Moseextremereactions法检验唯一适合于检验一个实验样本与对照样本相比,是否表现出最极端的或防御性的反应。三、基本计算1、建立数据文件2、选择统计方法依次选择Analyze→Nonparametrictests→2-IndependentSamplestest。3、结果说明解释输出结果的统计意义。例10.5.1某实验室观察局部温热治疗小鼠移植肿瘤的疗效,以生存日数作为观察指标,得如下数据:实验组(n1=10):10121515161718202390对照组(n2=12):2345678910111213试检验两组小鼠生存日数有无显著差异。第六节k个独立样本的检验一、基本问题设有K个总体,各个总体的分布函数分别为,这些分布的具体形式是未知的。欲检验:设k个独立样本的大小分别为。二、基本原理在SPSS中提供了可用来检验的两种方法,分别为Kruskal-WallisH法和Median法。1、Kruskal—wallisH检验法(简称为克氏检验)设为k个总体,抽取的样本为:欲检验:总体来自相同的分布。(1)将k个总体的所有样本数据按某种 标准 excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载 排列顺序并赋予秩,设为的秩,的秩和的平均秩当为真时,即所有样本均抽自同一总体,于是与相差不应太大,从而,问题转换为:不应太大。(2)、构造统计量(3)、统计量的分布当为真时(4)具体判断计算出H的值(记为H值)和相应的显著性概率p=Sig.=P(H>H值)。对任给定的显著性水平,若Sig.>,表明H是一个较小的数值,接受H0:k个样本之间无显著差异;若Sig.<,则拒绝H0。2、Median检验法(1)统计量Median检验法亦称中位数检验法,设k个总体记为。将k个总体的所有样本数据合并在一起,按从小到大排列,找出此序列中的中位数M,计算出各个总体在这个中位数M左右两边的样本数和,得到如下数据表G1G2…Gk大于中位数f11f21…fk1小于等于中位数f12f22…fk2如果H0成立,那么k个样本在排列中相互交错比较均匀,从而对每个总体Gi而言,它落在中位数M的左右两边的频数基本相同,即此时就是观测频数,利用卡方检验法(本章第一节),构造统计量当H0成立时,统计量的值偏小;反之,如果统计量的值偏大,则H0不成立。因此可以用来判断H0是否成立。(4)具体判断若,则拒绝,否则,接受。三、基本计算1、建立数据文件2、选择统计方法依次选择Analyze→Nonparametrictests→K-Independentsamplestest。3、结果说明解释输出结果的统计意义。例10.6.1某车间用4种不同的操作方法独立地各做若干批实验,实验中优等品率(%)数据资料如下表,试问操作方法对优等品率是否有显著影响?实验批号操作方法1操作方法2操作方法3操作方法4112.118.312.77.3214.849.625.11.9315.310.147.05.8411.435.616.310.1510.826.230.49.468.9第七节两个相关样本的检验一、基本问题设有两个不独立的总体X与Y,随机从两个总体中分别抽取n个观察值,得到n个数据对,。欲检验两总体分布无显著差异。二、基本原理1、Wilcoxon法此法称为符号秩检验(SignedRank法)。对配对样本(i=1,…,n),计算按差的绝对值的大小排列(从小到大),排序中的序号称为相应差值的秩。对相同的绝对差,取它们的序号的平均值为该差的秩。令所有正差相应秩的总和,所有负差相应秩的总和,构造统计量如果H0成立,则和几乎是等可能的,从而,所以统计量,或者说T的值不会太小。反之,如果T的值偏小,则说明H0不成立。当样本数n较大时,为了方便计算T的分布的概率,将这转化为此时Z近似服从正态分布。2、Sign法(符号检验法)所有正差的个数,所有负差的个数。选用统计量类似于前面的叙述,可用统计量S来判断H0是否成立。当样本数n较小时,S的分布可用二项分布来刻划;当n较大时,S近似服从正态分布。3、McNemar法McNemar法检验以研究对象作为自身对照,观测每个个体在对照前后是否发生变化,以此检验其“前后”的变化是否显著。因此,McNemar检验法是处理二分值问题,与本章第二节处理的问题完全一样。因此当样本个数n不大时,McNemar法完全使用二项分布检验法;当n较大时,它改用Yates的连续校正统计量进行检验,这里不再详述。注:上述三种检验,当观测数据只能按类区别,而这些类别间并没有大小关系(如性别、职业等名称变量或定类变量)时,无论大样本还是小样本都应当用McNemar检验;对于有初略的大小顺序关系,即可用“优于”、“大于”、“高于”等表示变量之间的关系时,应该用符号检验;对于有更精细测量的情形,选择Wilcoxon符号秩检验较为恰当。并且由于Wilcoxon符号秩检验两种条件下差较大的配对赋予较大的权,而给差小的配对以较小的权,故此法是一种较精确又有用的检验。三、基本计算1、建立数据文件2、选择统计方法依次选择Analyze→NonparametricTests→2-relatedsamples。3、结果说明解释输出结果的统计意义。例10.7.2用二乙胺化学法与气相色谱法测定车间空气中CS2的含量如下所示。样品号12345678910化学法50.73.328.846.21.125.52.95.43.81.0色谱法60.03.330.043.22.227.54.95.03.24.0问:这两种方法所得的结果有无差异?例10.7.2一班50人对某干部前后两次评价结果如下,问前后评价结果是否有显著差异?如果在第一次评价后,对干部采取了一定帮助措施,问该措施是否有效?前测结果:13个拥护,37个反对;后测结果:23个拥护,27个反对。(=0.05)第八节多个相关样本的检验一、基本问题设有K个相关总体,各个总体的分布函数分别为,这些分布的具体形式是未知的。欲检验:或:这K个总体的分布相同。设k个相关样本的大小分别为。表10.8.1原始样本数据总体观察X1X2…XK1x11x12…x1k2x21x22…x2k……………nxn1xn2…xnk二、基本原理在SPSS中提供了可用来检验的三种方法,分别为Friedman(佛利得曼)检验,Kendall(肯德尔)检验和Cochran(克库兰)检验。1、Friedman(佛利得曼)检验分别对每一个样本数据(即表10.8.2中每一行)计算它们的秩,记为,得到表10.8.3的秩数据。表中各列的和记为,即且表10.8.3秩数据总体观察X1X2…XK1r11r12…r1k2r21r22…r2k……………nrn1rn2…rnk合计R1R2…RK(1)问题的转换如果H0成立,那么表10.8.2中每一行的数据可以被看作是从同一个总体中抽取的数字,从而每一行中各秩次的出现应该是随机的,这就导致各列的秩和几乎相等,此时之间差异较小;反之,如果H0完全不成立,即总体差别很大,表10.8.2中每一列的n个数完全一样,其相应的秩完全一致,那么各列的和()是的一个排列,此时之间的差异最大。从而问题转换为:之间差异最小。(2)构造统计量之间的差异程度为S的最大值是当()为的一个排列时达到,所以构造统计量令(3)统计量的分布(4)具体判断计算值和相应的显著性概率。对给定的显著性水平,若p=Sig.<,则拒绝H0,否则接受H0。2、Kendall(肯德尔)检验Kendall检验法所处理的问题和解决办法都与Friedman检验法基本一致,它主要用于检验n个评判者对k个对象的观测评分之间是否一致;W愈大,表示这k个总体的差异愈大,评判者的一致性越高;反之,则评判的一致性越低。3、Cochran(克库兰)检验Cochran(克库兰)检验主要用于检验n个评判者对k件产品的优、劣判定是否一致;即对二分值问题进行检验,则表10.8.2中的样本数据只取0(合格)和1(不合格)两个值。(1)问题的转换记即第i个检查员判定这k个产品中不合格品的个数。记即n个检查员判定第j个产品为不合格品的人数。a、之间的差异:其中b、随机误差:设为一个随机变量,第i个产品为合格品第i个产品为不合格品则而,所以。于是,总的随机误差为:因此,评判结果是否一致只要看上述两个评判结果之间的差异哪个为主要的即可。(2)、构造统计量(3)、统计量的分布(4)、具体判断计算Q值和相应的显著性概率。对给定的显著性水平,若p=Sig.<,则拒绝H0,否则接受H0。三、基本计算1、建立数据文件2、选择统计方法依次选择Analyze→NonparametricTests→k-relatedsamples。3、结果说明解释输出结果的统计意义。
本文档为【第十一章非参数检验】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: ¥17.6 已有0 人下载
最新资料
资料动态
专题动态
个人认证用户
拍拍£宝贝
有多年的行政人事工作经验,现负责公司员工招聘,筛选,面试,培训等管理
格式:ppt
大小:2MB
软件:PowerPoint
页数:0
分类:企业经营
上传时间:2018-05-29
浏览量:44