南方医科大学生物统计系
谭旭辉
• χ2检验(chi-square test)
是现代统计学的创始人
之一Karl Pearson
(1857-1936)于1900年
提出的一种具有广泛用
途的统计方法,可用于
两个或多个率间的比
较,计数资料的关联度
分析,拟合优度检验等
等。
一、两独立样本率比较
• 例9-1 为研究肿瘤标志物癌胚抗原(CEA)对肺癌
的诊断价值,随机抽取72例确诊为肺癌的患者为
肺癌组,114例接受健康体检的非肺癌患者为对
照组。用CEA对其进行检测,结果呈阳性反应者
病例组中33例,对照组中10例。问两组人群的
CEA阳性率有无差异?
23.1
8.8
45.8
阳性率
(%)
186
114
72
合计
14343合计
10410对照组
3933肺癌组
阴性阳性组别
表
关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf
9-1 CEA对两组人群的诊断结果
• χ2检验的理论公式为
nb+da+c合计
c+ddc对照组
a+bba实验组
合计阴性阳性组别
2
2 ( - )
1 -1
A T
T
χ
υ
= ∑
= − ×(行数 )(列数 )
¾ χ2检验的基本思想
υ
公式中A为每个格子的实际频数(actural frequency),
T为的理论频数(theoretical frequency), 为自由度。
0 1 2
11 12 21 22
( 23.1%)
72 43 16.6
186
R C
RC
R
C
T H
n nT
n
n
n
T T T T
π π=
=
×= =
理论频数 是据检验假设 : 本例中均为
得到的:
其中: 为格子所在行的合计
为格子所在列的合计
如: ,同理可得 、 、 。
186
114
72
合计
23.114343合计
8.8104(87.6)10(26.4)对照组
45.839(55.4)33(16.6)肺癌组
阳性率
(%)阴性阳性组别
表9-1 CEA对两组人群的诊断结果
2 2 2 2
2 (33 16.6) (39 55.4) (10 26.4) (104 87.6)
16.6 55.4 26.4 87.6
34.32
(2 1) (2 1) 1
χ
υ
− − − −= + + +
=
= − × − =
χ2检验的步骤
1、建立检验假设:
• H0:π1=π2(两组人群的总体阳性率相同)H1:π1≠π2 (两组人群的总体阳性率不同)α=0.05
2、计算统计量值:
2
2 ( )
( )( )( )( )
ad bc n
a b a c b d c d
χ −= + + + +
χ2检验的四格表专用公式
2
2 (33 104 10 39) 186 34.10
72 43 143 114
χ × − × ×= =× × ×本例为:
由上面可以看到采用理论公式计算时,需要先
计算理论频数,为此人们由理论公式推导出了
四格表专用计算公式如下:
• 3、 20.05 1
2
0 1
1 8 3.84
34.32 3.84 0.05. 0.05P
H H
υ χ
χ α
= =
= > < =
,以 查附表 得: ,而本例
中 , 按
水准拒绝 ,接受 ,可以认为肺癌患者
癌胚抗原的阳性率高于健康人,提示其
可能具有临床诊断价值。
¾ 两个率比较的χ2检验与u检验之间的关系
) 自由度 =1时, χ2界值为双侧u界值的平
方,在比 较两个率时,二者等价 ;
u0.05/2=1.96 χ20.05,(1)=3.84=1.962
u0.01/2=2.58 χ20.01,(1)=6.63=2.582
) u检验可以做单侧检验,而χ2检验只能做
双侧检验;
) u检验仅适于大样本,而χ2检验不仅适于大
样本,尤其适合小样本率的假设检验。
υ
¾ χ2检验的连续性校正
• 选用条件:
1) 自由度为1;
2) 1≤T<5,n≥40时
• 连续性校正的理论公式:
• 连续性校正的四格表专用公式:
2
2
0.5
C
A T
T
χ − −=∑( )
2
2
2)
( )( )( )( )C
ad bc n n
a b a c b d c d
χ − −= + + + +
(
¾关于χ2检验连续性校正的争论
• Yates1934年提出χ2检验的连续性校正观点,是否需
要连续性校正的争论一直持续至今。
• 赞成者认为χ2为一连续性分布,而四格表资料属离
散型分布,由此得到的χ2统计量的抽样分布也具有
离散性质,因此需要进行校正;
• 反对者认为 经过连续性校正以后,P值有过分保守
之嫌,故认为不需要校正;
• 在具体应用中:若两种检验结果一致则无须在此问
题上纠缠;若结果相互矛盾,需慎重解释结果。为
了客观建议将两种结论同时报告出来。
• 例9-2
94.3704(7.2)66(62.8)高压氧组
89.711612104合计
82.6468(4.8)38(41.2)常规组
无效有效 有效率/%合计
治疗效果治疗方法
表2 两种疗法治疗癫痫的效果
2
2 (66 8 4 38) 116 4.08
70 46 104 12
χ × − × ×= =× × ×
非连续性校正公式有:
2
2
2 2
0.05 1
166 8 4 38 116 2) 116
2.92
70 46 104 12
3.84
Cχ
χ χ
× − × − ×= =× × ×
=,
连续性校正公式有:
(
查 界值表有, ,结论相互矛盾。
¾ Fisher精确概率法
• 1934年Fisher提出的用于两个独立样本率比较
的方法。
• 应用条件:n<40或T < 1时。
• 计算公式:
( )!( )!( )!( )!
! ! ! ! !
a b c d a c b dP
a b c d n
+ + + +=
“!”为阶乘符号。
¾ 四格表χ2检验各公式的适用条件
• 当n≥ 40,T ≥ 5时,选用非连续性校正公式
• 当n≥ 40,1 ≤ T < 5时,选用连续性校正公式
• 当n<40或T < 1时,选用Fisher精确概率法
2 2
2 2
0.5 2)
( )( )( )( )C C
A T ad bc n n
T a b a c b d c d
χ χ− − − −= = + + + +∑
( ) ( 或
2 2
2 2 ( )(A-T)
T ( )( )( )( )
ad bc n
a b a c b d c d
χ χ −= ∑ = + + + + 或
( )!( )!( )!( )!
! ! ! ! !
a b c d a c b dP
a b c d n
+ + + +=
二、两相关样本率检验(McNemar检验)
• 例9-3 某抗癌新药的毒理研究中,将78只大鼠按性
别、窝别、体重、年龄等因素配成39对,每对大鼠随
机分配分别接受甲剂量和乙剂量注射,实验结果见表
5-3。试分析该新药两种不同剂量的毒性有无差异?
乙剂量 甲剂量 死 亡 生 存 合计
死 亡 6(a)* 12(b) 18
生 存 3(c) 18(d) 21
合 计 9 30 39
表3 某抗癌新药两种剂量的毒理实验结果
* 括号里的数值代表理论值
• 在上述配对设计实验中,对每个对子而
言,结果不外乎有四种
乙+甲-甲生存乙死亡
乙-甲+甲死亡乙生存
乙-甲-两只均生存
乙+甲+两只均死亡
dc-
ba+
-+
乙处理
甲处理
¾ χ2值的计算公式
2
2
2
2
( ) , 1
40
(| | 1) , 1
b c
b c
b c
b c
b c
χ υ
χ υ
−= =+
+ <
− −= =+
当 时,连续性校正公式为:
•本例的具体假设检验过程
• H0:总体四格表中甲+乙-的对子数与甲-乙+的对子数出现
频率相同(即b=c)
H1:总体四格表中甲+乙-的对子数与甲-乙+的对子数出现
频率不同(即b≠c)
α =0.05
• 因本例b+c=12+3=15<40故选用连续性校正公式:
2
2
2 2
0.05 1
0 1
(|12 3 | 1) 4.27
12 3
3.84 0.05, 0.05P
H H
χ
χ χ α
− −= =+
= < =,
而查 界值表有, ,得 按
水准拒绝 ,接受 。可认为两种剂量的毒性有差异,
即甲剂量组的死亡率高。
三、行×列表的χ2检验
• 通常也称为列联表或R×C表,常见的资料类
型如:多个样本率的比较、两组构成比的比
较、多组构成比的比较等。其χ2值计算通用计
算公式:
2
2 ( 1) , ( 1)( 1)
R C
An R C
n n
χ υ= − = − −∑
¾ 多个样本率的比较
• 例4 某医师研究物理疗法、药物治疗和外用膏药
三种治疗周围性面神经麻痹的疗效,资料见下
表,问三种疗法的有效率有无差别?
96.602067199物理治疗组
90.4153251481合计
81.9414426118外用膏药组
90.1118218164药物治疗组
有效率
(%)合计无效有效疗法
表4 三种疗法有效率的比较
假设检验过程
• H0:π1=π2 =π3 ,即三种疗法治疗周围性面
神经麻痹的有效率相等
H1:π1,π2 ,π3 不全相等即三种疗法治疗
周围性面神经麻痹的有效率不全相等
α =0.05
• 计算χ2值:
• 查χ2界值表得P<0.005。按α =0.05检验水准拒
绝H0、接受H1,可以认为三种疗法治疗周围
性面神经麻痹的有效率总的来说有差别。
2 532 1χ
υ
= −× × ×
×
2 2 2199 7 26( + +...+ )=21.04206 481 206 51 144 51
=(3-1)(2-1)=2
• 在前面的例四中我们得到三种疗法治疗周围性面
神经麻痹的有效率有差别,此时只能说明各总体
率之间总的来说有差别,但不能说明任两个总体
率之间有差别。
• 若要想继续对每两个总体率之间有无差别作出推
断,需进一步进行多个率之间的两两比较,其分
析方法有χ2分割法、 Scheffé可信区间法和SNK
法,具体可参考其他
书
关于书的成语关于读书的排比句社区图书漂流公约怎么写关于读书的小报汉书pdf
籍。
¾ 多个样本率的两两比较
¾ 两个构成比的比较
• 例5 1979年某地爆发松毛虫病,333例患者按年
龄以14岁为界分为两组,资料如下表。试考察两
组病人病变类型的构成比有无差别?
95
23
72
混合型
3332558155合计
145710105成人组
188184850儿童组
合计软组织炎型骨关节炎型皮炎型年龄分组
表5 某地两组松毛虫病患者型别的构成比较
假设检验过程
• H0:两组患者中患各型松毛虫病的构成比相同
H1:两组患者中患各型松毛虫病的构成比不同α =0.05
• 计算χ2值:
• 查χ2界值表得P<0.005。按α =0.05检验水准
拒绝H0、接受H1,故可以认为两组松毛虫病
患者的病型构成不同,结合本资料说明成年
组中症状较轻的皮炎型比重较儿童组大,症
状较重的类型比重较儿童组小。
2 333 1
155 58 9
χ
υ
= −× × ×
= ×
2 2 250 48 23( + +...+ )=70.14188 188 145 5
(2-1) (4-1)=3
¾ 多组构成比的比较
• 例9-6 在某项疼痛测量的研究中,给160例手术后疼痛
的患者提供四种疼痛测量量表,即直观模拟量表
(VAS),数字评估量表(NRS),词语描述量表(VDS),面
部表情疼痛量表(FPS),患者首选的量表以及患者的文
化程度见下表,问患者首选疼痛量表与其文化程度是否
相关?
4215(20.2)12(10.2)11(9.7)4(1.8)高中以上
1607739377合计
3718(17.8)9(9.0)10(8.6)0(1.6)高中
8144(39.0)18(19.7)16(18.7)3(3.5)高中以下
FPSNRSVDSVAS
合计首选疼痛量表文化程度
表6 不同文化程度患者首选量表的类型*
* 括号内为理论频数
假设检验过程
• H0:不同文化程度首选疼痛量表的总体构成相
同
H1:不同文化程度首选疼痛量表的总体构成不
全相同
α =0.05
• 计算χ2值:
2
2 2
0.25,6
0
16160 1
7 81 37 42 77
, 7.84,7.51 7.84, 0.25,
0.05 ,
P
H
χ
υ
χ χ
α
= −× × ×
= ×
= < >
=
2 2 23 15( + +...+ )=7.5181
(4-1) (3-1)=6
查 界值表得 所以
以 水准不拒绝 即尚不能认为术后疼痛患者
首选疼痛测量量表的类型与其文化程度有关。
¾ R×C表 χ2 检验的条件
• R×C表 χ2 检验的条件是理论频数不宜太小
,否则有可能产生偏性:一般认为行×列
表中不宜有1/5以上格子的理论频数小于
5,或有一个理论频数小于1,但也有人认
为此限制过严,可有多个理论频数小到1而
对分析影响不大。
¾ 理论频数太小的三种处理方法
1. 增大样本容量。
以达到增大理论频数的目的,属首选方法,只是
有些研究无法增大样本容量,如同一批号试剂已
用完等。
2. 删去理论频数太小的格子所对应的行或列。
损失信息及损害样本的随机性。
3. 合并理论频数太小的格子所相邻的行或列。
同样会损失信息及损害样本的随机性,但损失的
信息比第2种方法小一些。不过,应注意合并得
是否合理,如不同年龄组是可以合并的,但不同
血型就不能合并。