首页 统计学第十一章非参数检验

统计学第十一章非参数检验

统计学第十一章非参数检验null第十一章非参数检验第十一章非参数检验区别：区别：参数检验方法：前面学习过的t检验和方差分析等,都是在假定总体为正态分布的基础上推导出来的,称为参数检验方法（parametric test). 如果总体严重偏离正态性,或还不了解其分布，即任意分布（distribution free）,这时应该采用非参数检验方法（nonparametric test).null例如要比较两个班级同学的身高,可以先让两班同学站在一起,按高矮排队后连续报数(秩),然后将两班同学分开,每个班分别将自己班上同学所报数的数字相加(...

null第十一章非参数检验第十一章非参数检验区别：区别：参数检验方法：前面学习过的t检验和方差分析等,都是在假定总体为正态分布的基础上推导出来的,称为参数检验方法（parametric test). 如果总体严重偏离正态性,或还不了解其分布，即任意分布（distribution free）,这时应该采用非参数检验方法（nonparametric test).null例如要比较两个班级同学的身高,可以先让两班同学站在一起,按高矮排队后连续报数(秩),然后将两班同学分开,每个班分别将自己班上同学所报数的数字相加(秩和),再除以班级人数(平均秩),可以想象,如果两班身高相近,则排队时他们会比较均匀地交错地排在队伍中,其结果是两班所报数字的平均数(平均秩)应该是接近的.如果两班的平均秩相差很大,则有理由相信其中一个班同学的身高比另一个班高.第一节两组配对设计的计量资料的比较第一节两组配对设计的计量资料的比较假设检验方法: 符号检验 Wilcoxon符号秩检验（Wilcoxon Sign-rank Test）null例11-1. 第五章的例5-3是一个配对设计的计量资料，如果服从正态分布，则可以采用配对t检验（属于参数检验）．现在假定该资料的分布类型未明，这时可以用非参数检验方法进行比较．原始数据见教材134页表 11-1，原始数据在表的左边2-3列，右边的5列是假设检验用的．注意改错：第６列|d|的排序以及第７列秩次:第１及第３行都改为10.5. nullnullnullWilcoxon符号秩检验步骤: 1.提出检验假设 Ho:先出生与后出生体重的总体分布相同. H1:两个总体分布不同. 检验水准alpha=双侧0.05 2.计算检验统计量(小于等于30的小样本检验统计量为R,大于30 的样本按照正态近似法其检验统计量为u) (1)计算各对子测量值之差d=x1-x2.null(2)去掉d=0的对子后,用绝对值|d|编稚次,如果出现绝对值|d|相等时(这种现象称为结ties),则将它们的平均稚次作为稚次. (3)把差值的正负符号标在稚次上,d>0的稚次写为+, d<0的稚次写为-. (4)分别计算正负稚次的和R+及 R-,小样本以R为检验统计量, R=n(n+1)/4. 3.确定概率P,并作出统计学推断在Ho成立时,即两个总体有相同的分布时,null理论上R=n(n+1)/4.当n比较小(n<30)时可以查附表11:Wilcoxon符号稚检验临界值表,得到无效假设成立的概率P值,然后作出推断.本例题 R+=97.5, R-=22.5, n=15, R=n(n+1)/4=15(15+1)/4=60. 用查表法确定概率P值查临界值:Ralpha/2(n)= R0.05/2(15)=(25,95),两端都未包括R+=97.5及 R-=22.5,或者说R+=97.5及 R-=22.5两端都在临界值之外,所以P1.96,所以按照alpha=0.05的检验水准,拒绝无效假设,接受备择假设:两个总体分布不同. 专业推断:根据样本数据,先出生者体重大于后出生者. 注:本例题的样本量只有15对,应该用查表法,不应该用正态近似法. 第二节两样本成组比较第二节两样本成组比较中位数检验 Wilcoxon秩和检验(Wilcoxon Rank-sum Test) Menn-whitney检验null在理论上检验假设H0应为两个总体分布相同，即两个样本来自同一总体。但由于秩和检验对于两个总体分布的形状差别不敏感，对于位置相同、形状不同但类似的两个总体，如均数相等、方差不等的两个正态分布，推断不出两个总体分布（形状）有差别，只能推断其两个总体分布位置是否相同。故无效假设H0可写作两个总体分布位置相同，对立的备择假设H1不能为两个总体分布不同，而只能为两个总体分布位置不同（对单侧检验可写作某个总体分布位置比另一个总体分布位置要右或要左一些）。例11-2例11-2某医生观察中药与西药对照治疗慢性阻塞性肺疾病（COPD）的临床疗效，将22例患者随机分配到中药组和西药组，用ELISA法测得10例中药组患者和12例西药组患者的外周血中白细胞介素-8（IL-8）的疗效(治疗前后的差值)，资料如下。试检验两组患者的IL-8的疗效是否有差别？表11-2 10例中药组与12例西药组COPD患者疗后的IL-8疗效值比较表11-2 10例中药组与12例西药组COPD患者疗后的IL-8疗效值比较解题分析解题分析　本例属于两个随机样本的比较，经方差齐性检验，推断得两总体方差不等（F=5.11，P=0.0351<0.05）,所以不能用参数检验(成组t检验), 而用非参数检验(选用Wilcoxon秩和检验)。解题步骤：解题步骤： 1.建立检验假设、确定检验水准α=0.05 H0：中药组与西药组COPD患者的IL-8疗效值总体分布位置相同 H1：中药组与西药组COPD患者的IL-8疗效值总体分布位置不同 2.计算u统计量(样本量小于等于10例可以用查表法;附表12) （1）编秩：把两样本数据混合从小到大编秩。遇数据相等者分两种情况处理：①相同数据在同一组内，可不编平均秩次，如中药组有两个0.111，其秩次按位置顺序编为1、2即可；②相同数据分在两组里，则应编平均秩次，如中药组与西药组各有一个0.236，其位置顺序为9和10，故取平均秩次为（9+10）/2=9.5；（2）求秩和：以样本例数小者为n1，其秩和（T1）为统计量T，若两样本例数相等，可任取一样本的秩和（T1或T2）为T，本例T=62.5； null（3）计算u统计量式中（j=1，2，…）,tj为第j个相同秩的个数。同组有节因未编平均稚,可不算节. 本例中本例中 null统计学推断: 因为|u|>1.96,所以拒绝无效假设,接受备择假设,两组总体疗效值分布位置不同. 专业推断:根据样本数据,西药组的平均稚次(190.5/12)较大, COPD患者的IL-8疗效较好.第三节多个样本之间的比较第三节多个样本之间的比较在完全随机分组设计中，如果从多个不同的总体中分别获得随机样本，它们不滿足正态分布或虽满足正态分布，但方差不齐，可用Kruskal-Walls 法的H检验（Kruskal-Walls H test）以推断它们的总体分布位置是否存在差异。 Kruskal-Walls H 检验用于推断计量资料或等级资料的多个独立样本所来自的多个总体分布是否有差别。在理论上无效假设H0应为多个总体分布相同，即多个样本来自同一总体。由于H检验对多个总体分布的形状差别不敏感，故在实际应用中无效假设H0为多个总体分布位置相同，对立的备择假设H1为多个总体分布位置不同或不全相同。例11-3例11-330只大鼠进行抑郁造模，造模成功后，随机分配到三个组中去。每组10只，一组给予逍遥散治疗，一组给予西药治疗，一组为空白对照。治疗前三组鼠的进水进食量假定相同.三周后测得其1小时糖水进食量，资料如下，试检验三组大鼠治疗后的糖水进食量是否有差别？表11-3 三组大鼠糖水进食量（g）比较表11-3 三组大鼠糖水进食量（g）比较解题分析　解题分析　本例属于多个随机样本的比较，经方差齐性检验，推断得三个总体方差不等（F=4.08，P=0.0284<0.05）,宜用非参数统计，现用Kruskal-Walls H 检验。解题步骤：解题步骤：1.建立假设、确定检验水准α=0.05 H0：三组大鼠糖水进食量总体分布位置相同 H1：三组大鼠糖水进食量总体分布位置不同或不全相同 2.计算H 统计量（1）编秩：把三个样本数据混合从小到大编秩。遇数据相等者分两种情况处理：①相同数据在同一组内，可不编平均秩次，如空白对照组有两个16.9，其秩次按位置顺序编为16和17即可；②相同数据分在两组里，则应编平均秩次，如西药组与空白对照组各有一个14.6，其位置顺序为5和6，故取平均秩次为（5+6）/2=5.5；（2）求秩和：设各样本例数为ni（∑ni =N）、秩和为Ri 计算H统计量计算H统计量本例中本例中 null3.确定P值查卡方界值表卡方0.05(2)=5.99, Hc=8.6>5.99,所以P<0.05,统计学推断:三组大鼠糖水进食量总体分布位置不同或不全相同. 根据样本数据可以做专业推断. 第三节续：多个组间的多重比较第三节续：多个组间的多重比较多个独立样本比较的Kruskal-Walls H检验只能总的判断各组是否来自同一总体。在H检验拒绝H0，接受H1，认为多个总体分布位置不全相同时，若要进一步推断是哪两个总体分布位置不同，可用推广了的t 检验，各组例数相等或不相等均适用。注意：此时若采用本章第二节介绍的两个样本比较的秩和检验进行两两比较，将会加大犯Ⅰ类错误（即假阳性错误,即把本无差别的两个总体分布位置判为有差别,其概率为检验水准alpha设为0.05,做k次假设检验,其alpha就变为1-(0.95)k ,不断增大.例11-4 对例11-3资料作三个样本间的两两比较例11-4 对例11-3资料作三个样本间的两两比较解题步骤： 1.建立假设、确定检验水准α=0.05 H0：任意两组大鼠糖水进食量总体分布位置相同 H1：任意两组大鼠糖水进食量总体分布位置不同 2.计算t 统计量 null（1）计算各组的平均秩次：（2）列出两两比较的计算表：见表11-7中第（5）栏为按上述公式计算的t 值。如本例N=30，k=处理组数=3，求得校正的统计量Hc=8.6，故1与2比较时的t 值为：表11-7 三个样本间两两比较表11-7 三个样本间两两比较 null查t界值表,设alpha=0.05,v=N-k=30-3=27, t0.05(27)=2.052 . （1）与（2）比较：P>0.05 （1）与（3）比较： P<0.01 （2）与（3）比较： P<0.05 统计学推断：按alpha=0.05的检验水准拒绝无效假设，接受备择假设：专业推断：参照样本数据做出。第四节 Ridit分析第四节 Ridit分析Ridit 分析是Relative to identified distribution unit 的缩写，用于处理有序分类资料的一种统计分析方法。比较所学习过的多分类资料统计分析方法： 1.行*列表资料的卡方检验：适用于双向无序多分类资料的差异性检验。null2.列联表资料的卡方检验：适用于双向有序多分类资料的相关性检验。 3. Ridit分析：适用于单向有序多分类资料的差异性检验。 SAS统计分析软件用cmh卡方检验，可以得到3项统计量，分别适用于上述3种分析结果： 1.General Association统计量； 2.Nonezero Correlation统计量。 3.Row Mean Scores Differ统计量；null Ridit分析的用途有三：一、样本与总体比较；二、两组平均Ridit值比较；三、多组平均Ridit值比较。教材的正文只介绍了两组平均Ridit值比较,而书末练习题要求做多组平均Ridit值比较;因此本讲义对二和三都讲. 两组平均Ridit值比较两组平均Ridit值比较例题1. 表1是研究慢性支气管炎疗效与病程长短的关系的资料，已将病程年份分组。表1慢支病程长短与疗效的关系 nullnull步骤：建立检验假设，确定检验水准无效假设：不同病程的疗效无显著差别备择假设：不同病程的疗效有显著差别 Alpha=0.05 计算检验统计量、P值和统计学推断。 null1.将对比两组的频数合并，作为标准频数分布，计算各等级的Ridit值。表2.表1资料各等级Ridit值计算 nullnull2.以各等级Ridit值作标准，分别计算显效组及无效组的平均Ridit值。平均R显效=（7*0.0600+21*0.2700+25*0.5467 +29*0.8367）/ 82 =0.5368；平均R无效=（11*0.0600+24*0.2700+13*0.5467 +20*0.8367）/ 68 =0.4556. null3.用下方公式作各病程的疗效差别的统计学意义检验为简化手工运算，可用近似法公式： U=(平均R1 - 平均R2) / [（1/12）(n1+n2)/(n1*n2)]0.5 ；代入： U=（0.5368-0.4556）/ [（1/12）（82+68）/（82*68）]0.5 =1.71 null4.统计学推断：因为u=1.71<1.96,所以无效假设成立的概率P值>0.05,按alpha=0.05的检验水准不拒绝无效假设：各病程的疗效差别无统计学意义。多组平均Ridit值得比较多组平均Ridit值得比较例2.是表3资料。表3.石苇冲剂治疗慢支病型与疗效的关系 nullnull步骤 1.建立检验假设，确定检验水准alpha=0.05; 无效假设：各病型组的总体平均Ridit值相同；备择假设：各病型组的总体平均Ridit值不完全相同。 null2.将各组病例数按等级合并求得合计数，如65+77+42+94=278等（见表2最后一列数字）。 3.以此合计数作为标准，计算各等级Ridit 值，计算结果见表4. 表4.各等级Ridit值的计算nullnull4.计算标准组的平均Ridit值，核对计算有无错误。标准组的R平均值=（278*0.256+51*0.559+136*0.731 +78*0.928）/ 543 =271.477/543=0.500 标准组的R平均值=0.5，说明计算无误。 null5.计算各组的平均Ridit值平均R1=（65*0.256+18*0.559+30*0.731 +13*0.928）/126=0.482；平均R2= （77*0.256+16*0.559+36*0.731 +18*0.928）/147=0.488； null平均R3= （42*0.256+6*0.559+23*0.731 +11*0.928）/82=0.502；平均R4= （94*0.256+11*0.559+47*0.731 +36*0.928）/188=0.521 . null6.作卡方检验据数理统计学研究结果， Χ2k-1=12∑ni(平均Ri-0.5)2 近似服从自由度为k-1的Χ2分布，这里K为组数。本例， Χ2k-1=12[126（0.482-0.5）2 +147（0.488-0.5）2 +82（0.502-0.5）2 +188（0.521-0.5）2 =1.742736 null本例为4组，k=4,自由度=4-1=3，查Χ2界值表： Χ20.05（3）=7.815， 7.求P值并做统计学和专业推断: 因为Χ2k-1=1.74 < Χ20.05（3）=7.815，所以无效假设成立的概率P值>0.05, 四组病型的疗效差别无统计学意义。

                    本文档为【统计学第十一章 非参数检验】，请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑，
                    图片更改请在作品中右键图片并更换，文字修改请直接点击文字进行修改，也可以新增和删除文档中的内容。 
 该文档来自用户分享，如有侵权行为请发邮件ishare@vip.sina.com联系网站客服，我们会及时删除。

                    [版权声明] 本站所有资料为用户分享产生，若发现您的权利被侵害，请联系客服邮件isharekefu@iask.cn，我们尽快处理。

                    本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用。

                    网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
                

下载需要：免费已有0 人下载

立即下载

统计学第十一章 非参数检验

你可能还喜欢

统计学第十一章非参数检验