首页 第七章卡方检验

第七章卡方检验

举报
开通vip

第七章卡方检验null第七章 检验第七章 检验 第一节 四格表资料的 检验 一、 检验的基本思想 1. 分布 (1) 分布的定义: n个u值的平方总和为 值, 值的分布称为 分布。null(2) 分布的图形: ①当自由度 时,曲线呈L型; ② 随着自由度增加,曲线趋向对称; ③当自由度 时, 分布接近正态分布。 自由度为1的2分布...

第七章卡方检验
null第七章 检验第七章 检验 第一节 四格表资料的 检验 一、 检验的基本思想 1. 分布 (1) 分布的定义: n个u值的平方总和为 值, 值的分布称为 分布。null(2) 分布的图形: ①当自由度 时,曲线呈L型; ② 随着自由度增加,曲线趋向对称; ③当自由度 时, 分布接近正态分布。 自由度为1的2分布界值自由度为1的2分布界值0.00.10.20.30.40.5自由度为2的2分布界值自由度为2的2分布界值null0.00.10.20.30.40.5χ2分布与自由度有关null0.050.0250.0251.96-1.96χ2分布与正态分布的关系null(3) 分布的可加性: 如果两个独立的随机变量 分别服从自由度 的 分布,那么它们的和 服从自由度 为 的 分布。 (4) 分布的分位数: 界值表,附表8,823页。null 检验的基本思想 例7-1 某医院欲比较异梨醇口服液(试验组) 和氢氯噻嗪+地塞米松(对照组)降低颅内压的疗 效。将200例颅内压增高症患者随机分为两组,结 果见表7-1。问两组降低颅内压的总体有效率有无 差别? 表7-1 两组降低颅内压有效率的比较 组别 有效 无效 合计 有效率(%) 试验组 99(90.48) 5(13.52) 104 95.20 对照组 75(83.52) 21(12.48) 96 78.13 合计 174 26 200 87.00null 四格表资料的模式 四格表资料的模式 分组 A+ A- 合计 甲组 a b a+b 乙组 c d c+d 合计 a+c b+d nnull式中A为实际频数,T为理论频数。null 检验的基本思想: 值反映了实际频数和理论频数的吻合程度。 如果检验假设成立,A和T的相差会小,即 值 不应该过大,如果 值大于理论值,则有理由 拒绝检验假设。 值的大小还取决于格子数的多少,即自 由度的大小。null3.四格表资料的 分析 定性数据统计分析pdf销售业绩分析模板建筑结构震害分析销售进度分析表京东商城竞争战略分析 ——基本公式法: 适用于n ≥ 40,理论数(T)≥ 5。 1. H0:π1=π2 ; H1: π1≠π2 , α= 0.05。 2. 计算理论数: 3. 计算 值: null4. 确定P值: 自由度==(2- 1)×(2-1)= 1 查 值表, 本例12.86>7.88,P<0.005,拒绝H0 ,接受 H1 ,说明异梨醇口服液降低颅内压的有效率高于 氢氯噻嗪+地塞米松组。null二、四格表资料的分析——专用公式法: 适用于n ≥ 40,理论数(T)≥ 5。 注意:专用公式无须求理论数T,但应求最小理论数以决定是否符合应用条件。 最小理论数的求法: null 三、四格表资料的分析——校正公式法: 适用于n ≥ 40,理论数 5>T≥1 。 基本公式校正为: 专用公式校正为: null 表7-2 两种药物治疗脑血管疾病有效率的比较 组别 有效数 无效数 合计 有效率(%) 胞磷胆碱 46 6 52 88.46 神经节苷酯 18 8(4.67) 26 69.23 合计 64 14 78 82.05null 第二节 配对四格表资料的 检验 配对四格表模式 乙法 + - + a b a+b - c d c+d 合计 a+c b+d n甲法合计 a为两种方法均为阳性;d为两种方法均为阴性; b为甲法阳性而乙法阴性;c为乙法阳性而甲法阴性。 a、d为结果相同部分,b、c为结果不同部分。null注意:当 n 较大而 b、c 较小时,结果的判断应考虑差别的实际意义。null 例7-3 某实验室分别用乳胶凝集法和免疫荧 光法对58名可疑系统红斑狼疮患者血清中抗核抗 体进行测定,结果见表7-3。问两种方法的检测结 果有无差别? 表7-3 两种方法的检测结果 乳胶凝集法 + - + 11(a) 12(b) 23 - 2(c) 33(d) 35 合计 13 45 58合计免疫荧光法null H0:B=C; H1:B≠C ,α=0.05。 5.79>3.84,P<0.05,拒绝H0 ,接受H1 ,说明免疫荧光法阳性率高于乳胶凝集法。 免疫荧光法阳性率:23/58 =39.7%, 乳胶凝集法阳性率:13/58=22.4%。 第三节 四格表资料的Fisher确切概率法第三节 四格表资料的Fisher确切概率法 四格表资料如果n<40,或有T< 1,则应采用确切概率法,又称直接计算概率法。 当用基本公式和校正公式求得 值接近理论 值,即 时,也可采用本法。 本法是用公式直接求得确切的概率,然后与 比较并作出相应的判断。 null 例7-4 某医师为研究乙肝免疫球蛋白预防胎儿 宫内感染HBV的效果,将33例HBsAg阳性孕妇随 机分为预防注射组和非预防组,结果见表7-4。问 两组新生儿的HBV总体感染率有无差别? 表7-4 两组新生儿HBV感染率的比较 组别 阳性 阴性 合计 感染率(%) 注射组 4 18 22 18.18 对照组 5 6 11 45.45 合计 9 24 33 27.27 null一、 本法基本思想: 在四格表周边合计数不变的条件下,表中a、b、 c、d 有多种组合,组合数为周边合计数中最小数 +1种(本例为9+1=10种)。 用公式计算实际四格表的概率和各所需组合表 的概率总和,与检验水准比较作出推断结论。 所需组合表是指概率小于等于实际四格表概率 的组合表,也可以是 大于等于实 际四格表 的组合表。 null0 22 9 28 14 1 106 16 3 87 15 2 99 15 0 111 21 8 32 20 7 43 19 6 44 18 5 65 17 4 7ad-bc -198 -165 -132 -99 -66 P值 0.00000143 0.00009412 0.00197656 0.01844785 0.08762728 A-T 6 5 4 3 2ad-bc -33 0 33 66 99 P值 0.225327286 0.319213656 0.243210404 0.09120390 0.01289752 A-T 1 0 -1 -2 -3null 双侧检验应求双侧累计概率;单侧检验只需求 单侧累计概率。 当a、b、c、d 中有0,则该组合为最外侧的组合。 如果 ,则所有组合的概率对称分布, 故双侧检验时,求得单侧累计概率×2即为双侧累 计概率。 如果实际四格表的概率已经大于检验水准,则 无需再求其它所需概率便可拒绝检验假设。null二、本例分析方法如下: H0:π1 =π2;H1:π1 ≠ π2 ,α=0.05, 双侧检验。(本例可用单侧检验) (2)求实际四格表的概率: (3)判别结论:P>α,不拒绝H0 ,还不能认为两组新 生儿的HBV总体感染率有差别。null 例7-5 某单位研究胆囊腺癌、腺瘤的P53基因表 达,对同期手术切除的胆囊腺癌、腺瘤标本各10 份,用免疫组化法检测P53基因,资料见表7-6。问 胆囊腺癌和胆囊腺瘤的P53基因表达阳性率有无差 别? 表7-6 胆囊腺癌与胆囊腺瘤P53基因表达阳性率的比较 病种 阳性 阴性 合计 胆囊腺癌 6 4 10 胆囊腺瘤 1 9 10 合计 7 13 20null 本例分析方法如下: (1)H0:π1 =π2;H1:π≠π2 ,α=0.05, 双侧检验。 (2)计算实际四格表的概率: null(3)计算累计概率: 一侧比实际组合更外侧的仅有一种,即a、b、 c、d为7、3、0、10的组合,其概率为: 本例两组例数相等,故累计概率为: (4)判别结论:P>α,不拒绝H0 ,还不能认为 两组P53基因表达阳性率有差别。 null本例如可采用单侧检验则: P<α,拒绝H0 ,可以认为两组P53基因表达阳性 率差别有统计学意义,胆囊腺癌的P53基因表达阳 性率高于胆囊腺瘤。 第四节 行×列表资料的 检验第四节 行×列表资料的 检验 行×列表是指行数或者列数超过 2 的资料, 实际工作中为多组率、两组或多组构成比的比较。 计算公式为: 基本公式 专用公式 一、 多个样本率的比较一、 多个样本率的比较 例7-6 某医师研究物理疗法、药物治疗和外用 膏药三种疗法治疗周围性面神经麻痹的疗效,资 料见表7-8。问三种疗法的有效率有无差别? 表7-8 三种疗法有效率的比较 疗法 有效 无效 合计 有效率(%) 物理疗法组 199 7 206 96.60 药物治疗组 164 18 182 90.11 外用膏药组 118 26(13.8) 144 81.94 合计 481 51 532 90.41nullnull H0:π1=π2=π3 ; H1: π1、π2、π3不等或 不全相等, α=0.05。 自由度= ( 3 - 1)×( 2 - 1) = 2, 查表得 , 21.04 > 5.99, P<0.05,拒绝H0 ,接受H1 , 说明三种疗法的有效率不同或不全相同。 null二、两组构成比的比较 例7-7 某医师在研究血管紧张素I转化酶(ACE) 基因I/D多态与2型糖尿病肾病(DN)的关系时,将 249例2型糖尿病患者按有无糖尿病肾病分为两 组,资料见表7-9,问两组2型糖尿病患者的ACE基 因型总体分布有无差别? 表7-9 两组2型糖尿病患者ACE基因型分布的比较 组别 DD ID II 合计 DN组 42(37.8 ) 48(43.3) 21(18.9) 111 无DN组 30(21.7) 72(52.2) 36(26.1) 138 合计 72(28.9) 120(48.2) 57(22.9) 249null 两组病人中医辨证分型 组别 肝胃不和 胃阴不和 脾胃虚寒 寒热夹杂 合计 中药 8(7) 19(16) 29(30) 41(47) 100 西药 6(7) 13(16) 31(30) 53(47) 100 合计 14(7) 32(16) 60(30) 94(47) 200 null H0:两组ACE基因型总体构成比相同; H1:两组ACE基因型总体构成比不同,α=0.05。 查表得: 7.91 > 5.99, P<0.05,拒绝H0 ,接受H1 ,两组 ACE基因型分布不同。 null二、两组无序分类资料的关联性检验 例 7-8 测得某地5801人的ABO血型和MN血型 结果如表7-10,问两种血型系统之间是否有关联? 表7-10 某地5801人的血型 MN血型 M N MN O 431 490 902 1823 A 388 410 800 1598 B 495 587 950 2032 AB 137 179 32 348 合计 1451 1666 2684 5801ABO血型合计null H0:两种血型系统之间无关联; H1:两种血型系统之间有关联, α=0.05。 查表得: 213.16 >18.55, P<0.005,拒绝H0 ,接受H1 ,两 种血型系统之间有关联。 关联系数: 关联系数较小,可认为关系不太密切。null 表7-10 某地5801人的血型 MN血型 M N MN O 131 190 1502 1823 A 688 410 500 1598 B 495 887 650 2032 AB 137 179 32 348 合计 1451 1666 2684 5801 ABO血型合计null A B C 合计 甲 165 0 0 165 乙 0 185 0 185 丙 0 0 166 166 合计 165 185 166 516模拟数据的关联性分析null四、行×列表资料 检验的注意事项: 1.注意对T值大小的要求: 要求T< 5的个数不能超过1/5, 且不能有T<1。 如果不符可选用以下方法处理: (1)增加样本例数; (2)相邻行列例数进行合理地合并; (3)删去理论数小的行或列; (4) 确切概率法。 null 2.注意多组比较结果如为差别有显著性,并不代表 每两组差别有显著性,如需分析可进一步作两两 比较。 3.注意有序行×列表资料不宜采用 检验,因为 检验与分类变量的顺序无关。null第五节 多个样本率间的多重比较第五节 多个样本率间的多重比较 分割法基本思想 先将原R×2的行列表分割为若干四格表,按四格表检 验方法计算 值;再将原检验水准进行适当调整,保证 Ⅰ型错误的概率不变;最后用求得的 值与表7-11理论值比较得 P 值,再与调整后的α比较并作出相应的判 断。 表7-11 υ=1时 界值表(多个样本率间的多重比较用) P P P 6.23 0.01250 7.48 0.00625 8.21 0.00417 6.96 0.00833 7.88 0.00500 8.49 0.00358 7.24 0.00714 8.05 0.00455 8.73 0.00313null二、多个实验组间的两两比较 例7-9 对例7-6中表7-8的资料进行两两比较,以推断是否任两种疗法治疗周围性面神经麻痹的有效率均有差别? 物理疗法组与药物治疗组: 物理疗法组与外用膏药组: 药物治疗组与外用膏药组:k为组数null二、各实验组与同一个对照组的比较 例 7-10 以表7-8资料中的药物治疗组为对照 组,物理疗法组与外用膏药组为试验组,试分析 两试验组与对照组的总体有效率有无差别? 物理疗法组与药物治疗组: 外用膏药组与药物治疗组: k为组数null 第六节 有序分组资料的线形趋势性检验 一、行×列表资料的分类 1.双向无序行×列表资料 检验或关联性检验 2.单向有序行×列表资料 分组为有序用 检验;效应为有序用秩和检验。 3. 双向有序属性相同行×列表资料 一致性检验(Kappa检验) 4. 双向有序属性不同行×列表资料 秩和检验、等级相关、线形趋势性检验。 null二、双向有序属性不同行×列表资料的线形趋势性检验 基本思想:先计算 值,再将 值分解成 线性回归分量和偏离线性回归分量。若两者均有统 计学意义,则说明两个变量存在相关关系,但不是 直线关系,如前者有意义而后者无意义则说明有直 线关系存在。 null 例7-11 某研究者欲研究年龄与冠状动脉粥样 硬化等级之间的关系,将278例尸解资料整理成表 7-13,问年龄与冠状动脉粥样硬化等级之间是否存 在线性变化趋势? 表7-13 年龄与冠状动脉硬化的关系 冠状动脉硬化等级(Y ) ①— ②+ ③++ ④+++ ① 20~ 70 22 4 2 98 ② 30~ 27 24 9 3 63 ③ 40~ 16 23 13 7 59 ④ ≥50 9 20 15 14(5.42) 58 合计 122 89 41 26 278合计 年龄(岁) (X) null 年龄与冠状动脉粥样硬化等级之间无线性关系; 1.按R×C表公式计算 值,并检验:年龄与冠状动脉粥样硬化等级之间有线性关系。null2.计算线性回归分量 并检验:nullnull3.计算偏离线性回归分量 并检验: 结论:由于线性回归分量有统计学意义,偏离线性回归分量无统计学意义,说明年龄与冠状动脉粥样硬化等级之间存在线性变化关系。 null第七节 Poisson资料的频数分布拟合优度检验 例7-12 观察某克山病区克山病患者的空间分 布情况,调查者将该地区划分为279个取样单位, 统计各取样单位历年累计病例数,资料见表7-15的 第(1)、(2)栏,问此资料是否服从Poisson分 布? null 表7-15 Poisson分布的拟合与检验 取样单位内 观察频数 概率 理论频数 病例数(X ) A P(X) (1) (2) (3) (4)=(3×n) (5) 0 26 0.0854 23.8 0.20 1 51 0.2102 58.6 0.99 2 75 0.2585 72.1 0.12 3 63 0.2120 59.1 0.26 4 38 0.1304 36.4 0.07 5 17 0.0641 17.9 0.05 6 5 0.0263 7.3 7 3 9 0.0092 2.6 11 0.36 ≥8 1 0.0039* 1.1 合计 279(n) 1.0000 279.0 2.05( ) * ≥8的概率:1-0.9961=0.0039null 结束
本文档为【第七章卡方检验】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_085176
暂无简介~
格式:ppt
大小:997KB
软件:PowerPoint
页数:0
分类:小学语文
上传时间:2011-12-01
浏览量:52