nullnull 卡方检验
Chi-square test内容摘要内容摘要两组二分类资料对比
普通四格表的χ2检验
Fisher确切概率法
配对设计四格表资料的χ2检验
行×列(R×C)表资料的χ2检验
多组二分类(多个率)——χ2检验
多组多分类(无序)——χ2检验
关联性分析卡方检验(Chi-square test)卡方检验(Chi-square test) χ2检验是现代统计学的创始人
之一,英国统计学家K . Pearson
(1857-1936)于1900年提出的一
种具有广泛用途的统计方法,常称
为Pearson卡方检验,可用于:
两个或多个率间的比较;
两组或多组频数分布(或构成)的比较
两分类变量的关联性分析
拟合优度检验等等。第一节 卡方检验的基本思想——以四格表为例第一节 卡方检验的基本思想——以四格表为例表7-1 两种疗法疗效的比较的四格表(four-fold table)null实际频数A :a、b、c、d
理论频数T:H0:π1=π2=π假设为pc=(a+c.)/ n
T11= (a+b)×pc= (a+b)×[(a+c.)/ n]=nRnC/n =65.7
T12=16.3 T21=59.3 T22=14.7表7-1 两种疗法疗效的比较的四格表(four-fold table)null如果假设检验成立,A与T不应该相差太大。理论上可以
证明
住所证明下载场所使用证明下载诊断证明下载住所证明下载爱问住所证明下载爱问
:
服从χ2分布(附后)。
计算出χ2值后,查χ2界值表判断这么大的χ2是否为小概率事件,以判断假设检验是否成立。χ2分布(chi-square distribution)χ2分布(chi-square distribution)第二节 普通四格表χ2检验与专用公式第二节 普通四格表χ2检验与专用公式简化的专用公式:
推断结论:两个独立样本率比较的正态近似法
—— z 检验两个独立样本率比较的正态近似法
—— z 检验适用条件:n1p1 和n1(1- p1)与
n2p2 和n2(1- p2)均>5仅在自由度为1时计算公式:适用条件适用条件普通四格表资料的适用条件:
n≥40,且T≥5 专用公式勿需校正
n≥40,而1≤T<5时,用连续性校正公式 ——Yates校正公式 一种建议:条件(1)亦做校正。
当n<40或T<1时,Fisher精确检验(Fisher exact test)
χ2接近χ2界值时或P≈0.05时, 亦用Fisher精确概率法连续性校正公式连续性校正公式校正公式:
通用公式的校正
专用公式的校正χ2分布是一连续型分布,而行×列表资料属离散型分布,对其进行校正称为连续性校正(correction for continuity)
又称Yates(耶茨)校正(Yates’ correction)卡方检验完整的分析步骤卡方检验完整的分析步骤例7-2
建立假设,确定检验水准
H0:π1=π2
H1:π1≠π2
α=0.05
计算检验统计量
判断适用条件:n? Tmin?
正确选用公式
确定P值,作出推断结论Fisher确切概率法Fisher确切概率法以7-8为例
建立假设,确定检验水准
检验统计量——直接计算概率
判断适用条件:n? Tmin?
正确选用公式——确切概率法 超几何分布原理直接计算周边合计不变的条件下各种组合的概率
P=∑Pi(Pi≤P样本)
作出推断结论第三节 配对四格表资料的χ2检验第三节 配对四格表资料的χ2检验设计类型:配对设计
例7-3:
配对设计与完全随机设计的区别
配对设计 完全随机设计配对四格表的χ2检验(McNemar's test)配对四格表的χ2检验(McNemar's test)
Q. McNemar
1900-1986
美国心理学家
统计学家 例7-3
分析目的:两法有无差别
假设(+,-)与(-,+)两格子理论频数相等均为:配对四格表的χ2检验配对四格表的χ2检验H0:B=C 或两种方法检出率相同
H1:B≠C 或两种方法检出率不同
α=0.05。
b+c≥40:
25≤b+c<40:连续性校正
b+c <25 确切概率法
本例b+c=86配对设计多分类R×C表配对设计多分类R×C表McNemar-Bowker 检验配对四格表的确切概率法配对四格表的确切概率法b+c <25——确切概率法
例7-9
原理:二项分布
公式:
单侧
双侧
例7-9 P(X≤3)=0.0176<0.05第四节 行×表资料的χ2检验第四节 行×表资料的χ2检验一 多个率比较的卡方检验
步骤:例7-4
1. 建立假设,确定检验水准
H0:π1=π2=π3 , 总体率相等
H1:π1,π2,π3 不等或不全相等
α=0.05
2. 计算检验统计量
3. 确定P值,作出推断结论
null二 两组或多组构成比的比较 例7-5:推论多个组的总体分布是否相同——方法原理同上
三 两个分类变量关联性分析
例7-6:方法同上
列联系数或关联系数
Pearson列联系数
Cramér列联系数
取值范围:0~√1-1/min(R,C)行×表分析注意事项行×表分析注意事项适用条件:不宜有1/5以上格子的理论频数小于5,且T>1
条件不满足
合并:将相邻组合并
删除:将不满足条件的行或列删除
Fisher精确概率或Monte Carlo模拟
增加样本含量
当其中一个变量为等级资料,且分析目的为比较处理效应时,用秩和检验 如表8-3第四节 两两比较第四节 两两比较卡方分割
两两比较计算卡方
无统计学意义的合并
Scheffè可信区间法
Bonferroni法:调整检验水准
k=R(R-1)/2,α’=α/k
例7-4: α’=0.05 / 3=0.0167
结果保守
SNK检验:参照定量资料的原理χ2检验的其它应用χ2检验的其它应用拟合优度检验(goodness of fit)
判断实际频数与理论频数的吻合程度
应用:
判断分布类型(正态分布、二项分布……)
评价多元回归分析中回归方程的拟合效果
线性趋势检验
资料类型:不同等级分层的百分率
分析目的:百分率虽等级增加而增加的趋势
分析方法:参见相关与回归分析小结小结资料类型与统计方法
两个样本率对比的卡方检验
配对设计两个率对比的卡方检验
多个率对比的R×C表的卡方检验
两组或多组构成比的R×C表的卡方检验
适用条件
普通四格表 n? T?
配对四个表 b+c?
R×C表 T?