首页 统计学 秩和检验

统计学 秩和检验

举报
开通vip

统计学 秩和检验等级资料的秩和检验陈涛DepartmentofEpidemiology&Biostatistics,SchoolofPublicHealthNanjingMedicalUniversityRankSumTestofRankedDataBiostatisticsBiostatistics*资料的分类数值变量资料 分类资料二分类多分类无序多分类有序多分类(等级资料)BiostatisticsBiostatistics*内容提要: 1医学研究中的等级资料 2秩次与秩和 3两样本比较的秩和检验 4多样本比较的秩和检...

统计学 秩和检验
等级资料的秩和检验陈涛DepartmentofEpidemiology&Biostatistics,SchoolofPublicHealthNanjingMedicalUniversityRankSumTestofRankedDataBiostatisticsBiostatistics*资料的分类数值变量资料 分类资料二分类多分类无序多分类有序多分类(等级资料)BiostatisticsBiostatistics*内容提要: 1医学研究中的等级资料 2秩次与秩和 3两样本比较的秩和检验 4多样本比较的秩和检验 5配对 设计 领导形象设计圆作业设计ao工艺污水处理厂设计附属工程施工组织设计清扫机器人结构设计 的秩和检验 6配伍组比较的秩和检验 7秩和检验的正确应用 BiostatisticsBiostatistics*1医学研究中的等级资料 疗效:痊愈、显效、有效、无效、恶化 化验结果:-、、+、++ 体格发育:下等、中下、中等、中上、上等 心功能分级:I、II、III、IV 文化程度:小学、中学、大学、研究生 营养水平:差、一般、好BiostatisticsBiostatistics*等级资料的特点 既非呈连续分布的定量资料,也非仅按性质归属于独立的若干类的定性资料; 比“定量”粗,而比一般的“定性”细; 等级间既非等距,亦不能度量。BiostatisticsBiostatistics*2秩次与秩和 Wilcoxon在1945年首先提出了比较两个总体分布函数的秩和检验。秩和检验以及其它的秩检验法,都是建立在秩及秩统计量基础上的非参数方法。 秩次(rank),秩统计量是指全部观察值按某种顺序排列的位序; 秩和(ranksum)同组秩次之和。BiostatisticsBiostatistics*例1编秩(page86)A组:-、、+、+、+、++B组:+、++、++、++、+++、+++A:-+++++B:+++++++++++++123457689101112124.54.54.58.54.58.58.58.51112124.54.54.574.589101112124.54.54.58.54.58.58.58.511.511.5尿白细胞:等级相同(tie)取平均秩次!!BiostatisticsBiostatistics*秩和 A组:-、、+、+、+、++秩和:124.54.54.58.5TA=25 B组:+、++、++、++、+++、+++秩和:4.58.58.58.511.511.5TB=53TA+TB=N(N+1)/2=78BiostatisticsBiostatistics* 秩次:在一定程度上反映了等级的高低; 秩和:在一定程度上反映了等级的分布位置。 对等级的 分析 定性数据统计分析pdf销售业绩分析模板建筑结构震害分析销售进度分析表京东商城竞争战略分析 ,转化为对秩次的分析。 秩和检验就是通过秩次的排列求出秩和,进行假设检验。2秩次与秩和Biostatistics*假如两组等级分布相同理论上两组秩和相近.A两样本合并排序示例BBiostatistics*3两样本比较的秩和检验 检验假设 H0:A、B两组等级分布相同; H1:A、B两组等级分布不同。=0.05。BiostatisticsDistributionoftwopopulationswhentheirlocationsaresame分布情况第1种情形…第2种情形…ABBA*Biostatistics*基本思想 如果H0成立,即两组分布位置相同,则A组的实际秩和应接近理论秩和n1(N+1)/2;(B组的实际秩和应接近理论秩和n2(N+1)/2).或相差不大,差值很大的概率应很小。 如果相差较大,超出了预定的界值,则可认为H0不成立。BiostatisticsBiostatistics*A组B组和 实际秩和255378 理论秩和n1(N+1)/2n2(N+1)/2N(N+1)/2393978 差值-14140抽样误差? 如果H0成立,则理论秩和与实际秩和之差纯粹由抽样误差造成。基本思想BiostatisticsBiostatistics*两样本秩和检验T界值n1=6,n2-n1=0双侧单侧28~500.100.0526~520.050.02524~540.020.0123~550.010.005间距222630326(12+1)/2=39(理论值)BiostatisticsBiostatistics*检验结果 如果H0成立,则按0.05水准,A组秩和之界值为26~52。 现A组的实际秩和为25,在界值之外,故拒绝H0,接受H1,认为两组的分布位置不同。BiostatisticsBiostatistics*秩和检验的结论判断 A组的实际秩在界值之外,(小于或等于下界,大于或等于上界)则拒绝H0,接受H1。 A组的实际秩在界值之内, (大于下界且小于上界) 则不拒绝H0。BiostatisticsBiostatistics*例题【例】某实验室观察在缺氧条件下猫和兔的生存时间,结果见 关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf ,试检验在缺氧条件下猫和兔的生存时间有无差别?BiostatisticsBiostatistics*例题Biostatistics表缺氧条件下猫和兔的生存时间 猫 兔 生存时间(min) 秩次 生存时间(min) 秩次 25 9.5 14 1 34 13 15 2 44 15 16 3 46 16 17 4 46 17 19 5 48 18 21 6 49 19 21 7 50 20 23 8 25 9.5 28 11 30 12 35 14 n1=8 T1=127.5 n2=12 T2=82.5Biostatistics* 检验假设H0:猫和兔在缺氧条件下生存时间总体分布相同; H1:猫和兔在缺氧条件下生存时间总体分布不同。=0.05。 检验统计量T值n1=8,n2=12,检验统计量T=127.5 确定P值和作出推断结论查附表10得T界值是58~110。则双侧P<0.05,按=0.05水准,拒绝H0,接受H1,差异有统计学意义,故可认为在缺氧条件下猫的生存时间较兔长。例题BiostatisticsBiostatistics* 例8.2用复方猪胆胶囊治疗老年性慢性支气管炎患者403例,疗效见表8.1第(1)~(3)栏。问该药对此两型支气管炎疗效是否相同?例题(page87)BiostatisticsBiostatistics*例题(page87)Biostatistics表8.1复方猪胆胶囊治疗两型老年性慢性支气管炎疗效比较 疗效 人数 喘息型 单纯型 合计 (1) (2) (3) (4) 控制 23 60 83 显效 83 98 181 好转 65 51 116 无效 11 12 23 合计 n1=182 n2=221 403Biostatistics*例题(page87)Biostatistics表8.1复方猪胆胶囊治疗两型老年性慢性支气管炎疗效比较 疗效 人数 秩次范围 平均秩次 秩和 喘息型 单纯型 合计 喘息型 单纯型 (1) (2) (3) (4) (5) (6) (7) (8) 治愈 23 60 83 1~83 42 966 2520 显效 83 98 181 84~264 174 14442 17052 好转 65 51 116 265~380 322.5 20962.5 16447.5 无效 11 12 23 381~403 392 4312 合计 n1=182 n2=221 403 T1=40682.5 T2=40723.5Biostatistics* 建立检验假设H0:两型老慢支疗效分布相同;H1:两型老慢支疗效分布不同;=0.05。 检验统计量n1=182,n2=221,检验统计量T=40682.5。例题(page88)BiostatisticsBiostatistics*样本含量较大时,用u检验相同秩次较多时需要校正BiostatisticsBiostatistics* 确定P值和作出推断结论P<0.01,按=0.05水准,拒绝H0,接受H1,差异有统计学意义。可认为复方猪胆胶囊治疗老年性慢性支气管炎喘息型与单纯型的疗效有差别。例题(page88)BiostatisticsBiostatistics*4多组比较的秩和检验 Kruskal-Wallis法 先对所有数据编秩,求各组秩和; 计算H统计量; 查H界值表,或用近似2检验,计算P值; 界定P值,作出结论。注:相同观察值不同组时取平均;相同组时,按位置顺序编号BiostatisticsBiostatistics*【例】某医生在研究再生障碍性贫血时,测得不同程度再生障碍性贫血患者血清中可溶性CD8抗原水平(U/ml),问不同程度再生障碍性贫血患者血清中可溶性CD8抗原水平有无差别?例题BiostatisticsBiostatistics*例题(假设不满足参数检验的要求)Biostatistics表不同程度再障患者血清中CD8抗原水平(U/ml) 正常组 轻度组 重度组 (1) (3) (5) 42 448 562 51 555 631 98 585 653 141 620 712 141 712 762 318 753 843 382 758 849 408 845 896 620 896 901Biostatistics*例题Biostatistics表不同程度再障患者血清中CD8抗原水平(U/ml) 正常组 秩次 轻度组 秩次 重度组 秩次 (1) (2) (3) (4) (5) (6) 42 1 448 9 562 11 51 2 555 10 631 15 98 3 585 12 653 16 141 4 620 13.5 712 17.5 141 5 712 17.5 762 21 318 6 753 19 843 22 382 7 758 20 849 24 408 8 845 23 896 25.5 620 13.5 896 25.5 901 27 Ri 49.5 149.5 179 ni 9 9 9Biostatistics*多组等级比较的检验假设 建立检验假设H0:各组总体的等级分布相同;H1:各组总体的等级分布不同或不全相同。=0.05。 计算检验统计量H值BiostatisticsBiostatistics*多组等级比较的检验假设 若组数k=3,每组例数ni≤9,可查附表11,H界值表得出P值。 若组数k≥3,有ni≥10,则H近似服从=k1的2分布。BiostatisticsBiostatistics* 确定P值和作出推断结论本例k=3,查附表12,得P<0.001。按=0.05水准拒绝H0,接受H1,差异有统计学意义,可认为不同程度再生障碍性贫血患者血清中可溶性CD8抗原水平有差别。多组等级比较的检验假设BiostatisticsBiostatistics*H的校正 当有相同秩次时,H需校正: BiostatisticsBiostatistics* 例8.3某医院用三种复方小叶枇杷治疗老年性慢性支气管炎,数据见表8.2第(1)~(4)栏,试比较其疗效有无差异。例题(page89)BiostatisticsBiostatistics*例题(page89)Biostatistics表8.2三种复方小叶枇杷治疗老年性慢性支气管炎疗效比较 疗效 例数 合计 秩次范围 平均秩次 秩和 老复方 复方I 复方II 老复方 复方I 复方II (1) (2) (3) (4) (5) (6) (7) (8) (9) 控制 36 4 1 41 1~41 21.0 756.0 84 21 显效 115 18 9 142 42~183 112.5 12937.5 2025 1012.5 好转 184 44 25 253 184~436 310.0 57040.0 13640 7750 无效 47 35 4 86 437~522 479.5 22536.5 16782.5 1918 合计 382 101 39 522 93270.0 32531.5 10701.5Biostatistics* 建立检验假设H0:三药疗效总体分布相同;H1:三药疗效总体分布不同或不全相同;=0.05。例题(page89)BiostatisticsBiostatistics* 计算检验统计量H值例题(page89)BiostatisticsBiostatistics*由于此资料的相同秩次很多,须校正:例题BiostatisticsBiostatistics* 确定P值和作出推断结论 故按=k1=31=2查2界值表,得20.005,2=10.60,Hc>20.005,2,P<0.005。按=0.05水准拒绝H0,接受H1,差异有统计学意义。认为三药疗效有差别。例题BiostatisticsBiostatistics*多组间的两两比较 如果多组等级比较拒绝H0,认为组间存在差异,则需进行两两比较。 两两比较的方法很多。BiostatisticsBiostatistics*5配对符号秩和检验(page91) Wilcoxon符号秩和检验 计算等级之差值,对差值进行编秩,并冠以差值的符号。 查T界值表,或用近似u检验,计算P值; 界定P值,作出结论。注:1,差数等于0,舍掉2,差值的绝对值排序,并冠以差值的符号3,差值的绝对值相等,取平均秩次BiostatisticsBiostatistics*符号秩和检验的假设H0:差值的总体中位数为0;H1:差值的总体中位数不为0。=0.05。当n≤50时,查T界值表当n>50时,用u近似BiostatisticsBiostatistics*扁平足疗效例(page91)用配对设计观察两种方法治疗扁平足效果 记录 混凝土 养护记录下载土方回填监理旁站记录免费下载集备记录下载集备记录下载集备记录下载 如下,问那种方法好。(好=3中=1差=0)病例号12345678910111213141516A法好好好好差中好好中差好差好中好中B法差好差中中差中差中差好差中差中差差值2021-111200001111BiostatisticsBiostatistics*符号秩和检验病例号 A法 B法 差值 秩次 (1) (2) (3) (4) (5) 1 3 1 2 10 2 3 3 0 — 3 3 1 2 10 4 3 2 1 4.5 5 1 2 -1 -4.5 6 2 1 1 4.5 7 3 2 1 4.5 8 3 1 2 10 9 2 2 0 — 10 1 1 0 — 11 3 3 0 — 12 1 1 0 — 13 3 2 1 4.5 14 2 1 1 4.5 15 3 2 1 4.5 16 2 1 1 4.5T+=61.5T-=4.5BiostatisticsBiostatistics*符号秩和检验的基本思想 总秩和为T=N(N+1)/2 如H0成立,则正负各半,T+与T-均接近N(N+1)/4。 如果相差太大,超出了事先规定的界值,则H0不成立。BiostatisticsBiostatistics*符号秩和检验T界值表N=11双侧单侧13~530.100.0510~560.050.0257~590.020.015~610.010.005间距4046525611(11+1)/4=33(理论值)BiostatisticsBiostatistics* 本例T+=61.5,T-=4.5,已超出附表10中双侧P0.01相对应的界值5~61,故得P0.01。按=0.05水准拒绝H0,接受H1,认为两种方法疗效的总体分布不同。结合资料可认为A法优于B法。扁平足疗效例BiostatisticsBiostatistics*u的校正 当重复的秩次较多时,u需要校正:BiostatisticsBiostatistics* 【例】某医院检验科试用新旧两种方法检测谷-草转氨酶,新方法的检测时间由20分钟缩短为10分钟。用两种方法测一份血清,结果见表第(2)、(3)栏,问两法所得结果有无差别?例题(假设不满足参数检验的要求)BiostatisticsBiostatistics*例题Biostatistics表两种方法测定血清谷-草转氨酶(nmol.s-1.L-1) 样品号 旧法 新法 差值 秩次 (1) (2) (3) (4) (5) 1 40 60 -20 -8 2 132 142 -10 -6 3 212 210 2 1.5 4 80 82 -2 -1.5 5 38 25 13 7 6 212 243 -31 -9 7 230 237 -7 -5 8 95 100 -5 -3 9 236 200 36 10 10 38 43 -5 -4 T+=18.5T-=36.5Biostatistics* 建立检验假设H0:差值总体中位数Md=0;H1:差值总体中位数Md≠0;=0.05。 求检验统计量T值T+=18.5,T-=36.5,其和为55,n(n+1)/2=10(10+1)/2=55。例题BiostatisticsBiostatistics*符号秩和检验T界值表N=10双侧单侧10~450.100.058~470.050.0255~500.020.013~520.010.005间距4046525610(10+1)/4=27.5(理论值)BiostatisticsBiostatistics* 确定P值和作出推断结论本例n=10,T=18.5,查附表10,得=0.05时的T界值为8~47,T在双侧界值范围内,故P>0.05。按双侧0.05水准,不拒绝H0,差异无统计学意义,故尚不能认为两法测定血清中谷-丙转氨酶含量有差别。查表时,若T在T上、下界值范围外,则P<;若T在T上、下界值范围内,则P>。例题BiostatisticsBiostatistics*6配伍组比较的秩和检验(page93) Friedman法 分别对每一配伍组中的观察值进行编秩; 按处理组求各组秩和 计算FriedmanM统计量; 查M界值表,或用近似2检验,计算P值; 界定P值,作出结论。BiostatisticsBiostatistics*葡萄酒的等级例: 白兰地 评委 W X Y Z A 四 二 一 三 B 四 一 二 三 C 三 一 二 四 D 四 二 三 一 E 三 一 二 四 Ri (4) (2) (1) (3) (4) (1) (2) (3) (3) (1) (2) (4) (4) (2) (3) (1) (3) (1) (2) (4) 18 7 10 15BiostatisticsBiostatistics*葡萄酒等级资料的分析 H0:对四种葡萄酒评判结果的总体分布相同;H1:评判结果的总体分布不同或不全相同。=0.05。 式中b为配伍组数,k为处理组数。本例b=5,k=4。BiostatisticsBiostatistics*检验结果 本例b=5,k=4,查M界值表得:M0.05=7.80,M0.01=9.96。M0.05<M<M0.01,0.01<P<0.05。按=0.05水准拒绝H0,接受H1,差异有统计学意义,即可认为四种酒的等级有差别。BiostatisticsBiostatistics*7秩和检验的正确应用 主要对等级资料进行分析; 秩和检验可用于任意分布(distributionfree)的资料; 非参数统计的主要优点是不受总体分布的限制,适用范围广。 非参数统计的主要缺点是符合参数检验的资料(如两样本均数比较的t检验),如用非参数检验,因没有充分利用资料提供的信息,检验效率降低。Biostatistics已知总体分布类型,对未知参数进行统计推断依赖于特定分布类型,比较的是参数参数检验(parametrictest)非参数检验(nonparametrictest)对总体的分布类型不作严格要求不受分布类型的影响,比较的是总体分布位置优点:方法简便、易学易用,易于推广使用、应用范围广;可用于参数检验难以处理的资料(如等级资料,或含数值“>50mg”等)缺点:方法比较粗糙,对于符合参数检验条件者,采用非参数检验会损失部分信息,其检验效能较低;样本含量较大时,两者结论常相同。Biostatistics*秩和检验用于定量资料 计量资料中: 极度偏态资料,或个别数值偏离过大 各组离散度相差悬殊 资料中含有不确定值 大于5年 <0.001 1:1024以上 兼有等级和定量性质的资料BiostatisticsBiostatistics*心肌坏死面积例用二种食物配方饲养大白鼠,观察心肌坏死面积。分析二组间的差异。A组:(n=29,mean=3.61)0,0,0,0,0,0,0,0,0,0,0.2,0.3,0.4,0.4,0.6,1,1.6,2.2,2.6,3.3,4.3,5.1,5.4,5.5,6.1,6.2,9.7,13.8,36 B组:(n=28,mean=1.06)0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0.2,0.2,0.20.3,0.4,0.4,0.9,0.9,1.3,1.7,2.8,7.4,13 BiostatisticsBiostatistics*特点: 0特别多,无论用什么变换均不可能改变分布的偏性; 0与其它数的区别是质的区别。BiostatisticsBiostatistics*分析一:二组心肌坏死率比较,按四格表作2检验: 无心肌坏死有心肌坏死合计心肌坏死率 甲组10192965.5% 乙组15132846.4% 2=2.1081,P=0.147BiostatisticsBiostatistics*分析二:二组平均心肌坏死面积的比较二组平均心肌坏死面积的t检验:t=-1.7755,P=0.0814BiostatisticsBiostatistics*分析三:按等级资料处理:两组秩和检验:n秩和理论秩和A组 29968841B组 28685812合计 5716531653u=2.119,P=0.0341。BiostatisticsBiostatistics*成组设计两样本比较 如资料满足t检验的条件,应该用t检验进行分析。此时,如果对这类资料用Wilcoxon秩和检验,实际上是将观察单位的具体数值舍弃不用,只保留了秩次的信息,使检验功效降低;尤其样本含量较小时,降低更加明显。 如资料不满足t检验的条件,而用了t检验,同样降低了检验效能。BiostatisticsBiostatistics*秩变换检验 基本思想: 将等级转换为秩次; 对秩次作效应的参数检验(t检验,方差分析,相关等)。 在样本含量较大时,秩变换检验与秩和检验结果相同或相近。BiostatisticsBiostatistics*Biostatistics
本文档为【统计学 秩和检验】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
个人认证用户
Refild_983
从教多年
格式:ppt
大小:678KB
软件:PowerPoint
页数:0
分类:其他高等教育
上传时间:2018-12-09
浏览量:42