卡方检验

卡方检验南方医科大学生物统计系谭旭辉 • χ2检验(chi-square test) 是现代统计学的创始人之一Karl Pearson （1857-1936）于1900年提出的一种具有广泛用途的统计方法，可用于两个或多个率间的比较，计数资料的关联度分析，拟合优度检验等等。一、两独立样本率比较 • 例9-1 为研究肿瘤标志物癌胚抗原(CEA)对肺癌的诊断价值，随机抽取72例确诊为肺癌的患者为肺癌组，114例接受健康体检的非肺癌患者为对照组。用CEA对其进行检测，结果呈阳性反应者病例组中...

南方医科大学生物统计系谭旭辉 • χ2检验(chi-square test) 是现代统计学的创始人之一Karl Pearson （1857-1936）于1900年提出的一种具有广泛用途的统计方法，可用于两个或多个率间的比较，计数资料的关联度分析，拟合优度检验等等。一、两独立样本率比较 • 例9-1 为研究肿瘤标志物癌胚抗原(CEA)对肺癌的诊断价值，随机抽取72例确诊为肺癌的患者为肺癌组，114例接受健康体检的非肺癌患者为对照组。用CEA对其进行检测，结果呈阳性反应者病例组中33例，对照组中10例。问两组人群的 CEA阳性率有无差异？ 23.1 8.8 45.8 阳性率（%） 186 114 72 合计 14343合计 10410对照组 3933肺癌组阴性阳性组别表 9-1 CEA对两组人群的诊断结果 • χ2检验的理论公式为 nb+da+c合计 c+ddc对照组 a+bba实验组合计阴性阳性组别 2 2 ( - ) 1 -1 A T T χ υ = ∑ = − ×（行数）（列数） ¾ χ2检验的基本思想 υ 公式中A为每个格子的实际频数(actural frequency), T为的理论频数(theoretical frequency)，为自由度。 0 1 2 11 12 21 22 ( 23.1%) 72 43 16.6 186 R C RC R C T H n nT n n n T T T T π π= = ×= = 理论频数是据检验假设：本例中均为得到的：其中：为格子所在行的合计为格子所在列的合计如：，同理可得、、。 186 114 72 合计 23.114343合计 8.8104(87.6)10(26.4)对照组 45.839(55.4)33(16.6)肺癌组阳性率（%）阴性阳性组别表9-1 CEA对两组人群的诊断结果 2 2 2 2 2 (33 16.6) (39 55.4) (10 26.4) (104 87.6) 16.6 55.4 26.4 87.6 34.32 (2 1) (2 1) 1 χ υ − − − −= + + + = = − × − = χ2检验的步骤 1、建立检验假设： • H0:π1=π2（两组人群的总体阳性率相同）H1:π1≠π2 （两组人群的总体阳性率不同）α=0.05 2、计算统计量值： 2 2 ( ) ( )( )( )( ) ad bc n a b a c b d c d χ −= + + + + χ2检验的四格表专用公式 2 2 (33 104 10 39) 186 34.10 72 43 143 114 χ × − × ×= =× × ×本例为：由上面可以看到采用理论公式计算时，需要先计算理论频数，为此人们由理论公式推导出了四格表专用计算公式如下： • 3、 20.05 1 2 0 1 1 8 3.84 34.32 3.84 0.05. 0.05P H H υ χ χ α = = = > < = ，以查附表得：，而本例中，按水准拒绝，接受，可以认为肺癌患者癌胚抗原的阳性率高于健康人，提示其可能具有临床诊断价值。 ¾ 两个率比较的χ2检验与u检验之间的关系 ) 自由度 =1时, χ2界值为双侧u界值的平方，在比较两个率时，二者等价； u0.05/2=1.96 χ20.05，(1)=3.84=1.962 u0.01/2=2.58 χ20.01，(1)=6.63=2.582 ) u检验可以做单侧检验，而χ2检验只能做双侧检验； ) u检验仅适于大样本，而χ2检验不仅适于大样本，尤其适合小样本率的假设检验。 υ ¾ χ2检验的连续性校正 • 选用条件： 1) 自由度为1； 2) 1≤T<5，n≥40时 • 连续性校正的理论公式： • 连续性校正的四格表专用公式： 2 2 0.5 C A T T χ − −=∑（） 2 2 2) ( )( )( )( )C ad bc n n a b a c b d c d χ − −= + + + + （ ¾关于χ2检验连续性校正的争论 • Yates1934年提出χ2检验的连续性校正观点，是否需要连续性校正的争论一直持续至今。 • 赞成者认为χ2为一连续性分布，而四格表资料属离散型分布，由此得到的χ2统计量的抽样分布也具有离散性质，因此需要进行校正； • 反对者认为经过连续性校正以后，P值有过分保守之嫌，故认为不需要校正； • 在具体应用中：若两种检验结果一致则无须在此问题上纠缠；若结果相互矛盾，需慎重解释结果。为了客观建议将两种结论同时报告出来。 • 例9-2 94.3704（7.2）66（62.8）高压氧组 89.711612104合计 82.6468（4.8）38（41.2）常规组无效有效有效率/%合计治疗效果治疗方法表2 两种疗法治疗癫痫的效果 2 2 (66 8 4 38) 116 4.08 70 46 104 12 χ × − × ×= =× × × 非连续性校正公式有： 2 2 2 2 0.05 1 166 8 4 38 116 2) 116 2.92 70 46 104 12 3.84 Cχ χ χ × − × − ×= =× × × =，连续性校正公式有：（查界值表有，，结论相互矛盾。 ¾ Fisher精确概率法 • 1934年Fisher提出的用于两个独立样本率比较的方法。 • 应用条件：n<40或T < 1时。 • 计算公式： ( )!( )!( )!( )! ! ! ! ! ! a b c d a c b dP a b c d n + + + += “!”为阶乘符号。 ¾ 四格表χ2检验各公式的适用条件 • 当n≥ 40，T ≥ 5时，选用非连续性校正公式 • 当n≥ 40，1 ≤ T < 5时，选用连续性校正公式 • 当n<40或T < 1时，选用Fisher精确概率法 2 2 2 2 0.5 2) ( )( )( )( )C C A T ad bc n n T a b a c b d c d χ χ− − − −= = + + + +∑ （）（或 2 2 2 2 ( )(A-T) T ( )( )( )( ) ad bc n a b a c b d c d χ χ −= ∑ = + + + + 或 ( )!( )!( )!( )! ! ! ! ! ! a b c d a c b dP a b c d n + + + += 二、两相关样本率检验（McNemar检验） • 例9-3 某抗癌新药的毒理研究中，将78只大鼠按性别、窝别、体重、年龄等因素配成39对，每对大鼠随机分配分别接受甲剂量和乙剂量注射，实验结果见表 5-3。试分析该新药两种不同剂量的毒性有无差异？乙剂量甲剂量死亡生存合计死亡 6(a)* 12(b) 18 生存 3(c) 18(d) 21 合计 9 30 39 表3 某抗癌新药两种剂量的毒理实验结果 * 括号里的数值代表理论值 • 在上述配对设计实验中，对每个对子而言，结果不外乎有四种乙+甲-甲生存乙死亡乙-甲+甲死亡乙生存乙-甲-两只均生存乙+甲+两只均死亡 dc- ba+ -+ 乙处理甲处理 ¾ χ2值的计算公式 2 2 2 2 ( ) , 1 40 (| | 1) , 1 b c b c b c b c b c χ υ χ υ −= =+ + < − −= =+ 当时，连续性校正公式为： •本例的具体假设检验过程 • H0:总体四格表中甲+乙-的对子数与甲-乙+的对子数出现频率相同（即b=c） H1:总体四格表中甲+乙-的对子数与甲-乙+的对子数出现频率不同（即b≠c） α =0.05 • 因本例b+c=12+3=15<40故选用连续性校正公式： 2 2 2 2 0.05 1 0 1 (|12 3 | 1) 4.27 12 3 3.84 0.05, 0.05P H H χ χ χ α − −= =+ = < =，而查界值表有，，得按水准拒绝，接受。可认为两种剂量的毒性有差异，即甲剂量组的死亡率高。三、行×列表的χ2检验 • 通常也称为列联表或Ｒ×Ｃ表，常见的资料类型如：多个样本率的比较、两组构成比的比较、多组构成比的比较等。其χ2值计算通用计算公式： 2 2 ( 1) , ( 1)( 1) R C An R C n n χ υ= − = − −∑ ¾ 多个样本率的比较 • 例4 某医师研究物理疗法、药物治疗和外用膏药三种治疗周围性面神经麻痹的疗效，资料见下表，问三种疗法的有效率有无差别？ 96.602067199物理治疗组 90.4153251481合计 81.9414426118外用膏药组 90.1118218164药物治疗组有效率（%）合计无效有效疗法表4 三种疗法有效率的比较假设检验过程 • H0:π1=π2 =π3 ，即三种疗法治疗周围性面神经麻痹的有效率相等 H1:π1，π2 ，π3 不全相等即三种疗法治疗周围性面神经麻痹的有效率不全相等 α =0.05 • 计算χ2值： • 查χ2界值表得P<0.005。按α =0.05检验水准拒绝H0、接受H1，可以认为三种疗法治疗周围性面神经麻痹的有效率总的来说有差别。 2 532 1χ υ = −× × × × 2 2 2199 7 26（ + +...+ ）=21.04206 481 206 51 144 51 =（3-1）(2-1)=2 • 在前面的例四中我们得到三种疗法治疗周围性面神经麻痹的有效率有差别，此时只能说明各总体率之间总的来说有差别，但不能说明任两个总体率之间有差别。 • 若要想继续对每两个总体率之间有无差别作出推断，需进一步进行多个率之间的两两比较，其分析方法有χ2分割法、 Scheffé可信区间法和SNK 法，具体可参考其他书籍。 ¾ 多个样本率的两两比较 ¾ 两个构成比的比较 • 例5 1979年某地爆发松毛虫病，333例患者按年龄以14岁为界分为两组，资料如下表。试考察两组病人病变类型的构成比有无差别？ 95 23 72 混合型 3332558155合计 145710105成人组 188184850儿童组合计软组织炎型骨关节炎型皮炎型年龄分组表5 某地两组松毛虫病患者型别的构成比较假设检验过程 • H0:两组患者中患各型松毛虫病的构成比相同 H1:两组患者中患各型松毛虫病的构成比不同α =0.05 • 计算χ2值： • 查χ2界值表得P<0.005。按α =0.05检验水准拒绝H0、接受H1，故可以认为两组松毛虫病患者的病型构成不同，结合本资料说明成年组中症状较轻的皮炎型比重较儿童组大，症状较重的类型比重较儿童组小。 2 333 1 155 58 9 χ υ = −× × × = × 2 2 250 48 23（ + +...+ ）=70.14188 188 145 5 (2-1) (4-1)=3 ¾ 多组构成比的比较 • 例9-6 在某项疼痛测量的研究中，给160例手术后疼痛的患者提供四种疼痛测量量表，即直观模拟量表 (VAS)，数字评估量表(NRS)，词语描述量表(VDS)，面部表情疼痛量表(FPS)，患者首选的量表以及患者的文化程度见下表，问患者首选疼痛量表与其文化程度是否相关？ 4215(20.2)12(10.2)11(9.7)4(1.8)高中以上 1607739377合计 3718(17.8)9(9.0)10(8.6)0(1.6)高中 8144(39.0)18(19.7)16(18.7)3(3.5)高中以下 FPSNRSVDSVAS 合计首选疼痛量表文化程度表6 不同文化程度患者首选量表的类型* * 括号内为理论频数假设检验过程 • H0:不同文化程度首选疼痛量表的总体构成相同 H1:不同文化程度首选疼痛量表的总体构成不全相同 α =0.05 • 计算χ2值： 2 2 2 0.25,6 0 16160 1 7 81 37 42 77 , 7.84,7.51 7.84, 0.25, 0.05 , P H χ υ χ χ α = −× × × = × = < > = 2 2 23 15（ + +...+ ）=7.5181 (4-1) (3-1)=6 查界值表得所以以水准不拒绝即尚不能认为术后疼痛患者首选疼痛测量量表的类型与其文化程度有关。 ¾ R×C表 χ2 检验的条件 • R×C表 χ2 检验的条件是理论频数不宜太小，否则有可能产生偏性：一般认为行×列表中不宜有1/5以上格子的理论频数小于 5，或有一个理论频数小于1，但也有人认为此限制过严，可有多个理论频数小到1而对分析影响不大。 ¾ 理论频数太小的三种处理方法 1. 增大样本容量。以达到增大理论频数的目的，属首选方法，只是有些研究无法增大样本容量，如同一批号试剂已用完等。 2. 删去理论频数太小的格子所对应的行或列。损失信息及损害样本的随机性。 3. 合并理论频数太小的格子所相邻的行或列。同样会损失信息及损害样本的随机性，但损失的信息比第2种方法小一些。不过，应注意合并得是否合理，如不同年龄组是可以合并的，但不同血型就不能合并。

                    本文档为【卡方检验】，请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑，
                    图片更改请在作品中右键图片并更换，文字修改请直接点击文字进行修改，也可以新增和删除文档中的内容。 
 该文档来自用户分享，如有侵权行为请发邮件ishare@vip.sina.com联系网站客服，我们会及时删除。

                    [版权声明] 本站所有资料为用户分享产生，若发现您的权利被侵害，请联系客服邮件isharekefu@iask.cn，我们尽快处理。

                    本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用。

                    网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
                

下载需要：免费已有0 人下载

立即下载

卡方检验

你可能还喜欢