null卡方检验 (Chi-square) 卡方检验 (Chi-square) 参数与非参数检验
卡方匹配度检验
卡方独立性检验
卡方检验的前提和限制
卡方检验的效应大小和效力参数与非参数检验参数与非参数检验参数检验
用于等比/等距型数据
对参数的前提:正态分布和方差同质
非参数检验
不用对参数进行假设
对分布较少有
要求
对教师党员的评价套管和固井爆破片与爆破装置仓库管理基本要求三甲医院都需要复审吗
,也叫distribution-free tests
用于类目/顺序型数据
没有参数检验敏感,效力低
因此在二者都可用时,总是用参数检验卡方匹配度检验
(Chi Square for Goodness of fit)卡方匹配度检验
(Chi Square for Goodness of fit)用样本数据检验总体分布的形状或比率,以确定与假设的总体性质的匹配度
是对次数分布的检验
研究情境
在医生职业中,男的多还是女的多?
在三种咖啡中,哪种被中国人最喜欢?
在北京大学中,各国留学生的比例有代
表
关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf
性吗?
卡方匹配度检验的虚无假设-期望次数卡方匹配度检验的虚无假设-期望次数在医生职业中,男的多还是女的多?
在外科医生中,男的是否占80%?
最喜欢的咖啡品牌
卡方匹配度检验的公式卡方匹配度检验的公式f e=pn
df =C-1
χ2= ∑[(f0-f e)2/ f e]
F0:观察次数
f e :期望次数
C:类目的个数
Χ2:统计量卡方分布卡方分布是一系列平方和相加,没有负值
当H0为真时,Chi square 的数值会小
典型的卡方分布是正偏态,右侧的尾端构成临界区域
卡方分布的形状并不取决于样本数目,而是取决于类目数目。 df =C-1
当卡方df 增加时,卡方的临界值增加。
当卡方df 增加时,卡方分布的偏态越来越不严重。卡方匹配度检验的例题卡方匹配度检验的例题影响学生选课的因素有上述4种,哪些因素的影响力更强?卡方匹配度检验的例题卡方匹配度检验的例题影响学生选课的因素有上述4种,哪些因素的影响力更强?
H0: 4种因素的影响力相等
Df=3,Χ2(3).05=7.81
求边缘和N=18+17+7+8=50
χ2= ∑[(f0-f e)2/ f e] =(18-12.5)2/12.5+ (17-12.5)2/12.5 +(7-12.5)2/12.5+(8-12.5)2/12.5=2.42+1.62+2.42+1.62 =8.08
推翻H0: 4种因素的影响力不同单位格χ2单位格χ2单位格χ2具有可加性
单位格χ2大于2.5,说明该因素对整个统计检验的显著贡献较大卡方独立性检验卡方独立性检验检验行和列的两个变量彼此有无关联
是命名型变量, 顺序型变量相关的计算方法卡方独立性检验的公式卡方独立性检验的公式χ 2= ∑[(f0-f e)2/ f e]
f e=(row total)(column total)/n,
df =(R-1)(C-1)
F0:观察次数
f e :期望次数
R :行类目的个数 C:列类目的个数
χ 2:统计量null对手表显示的偏好程度与被试的年龄段是否有关?null卡方独立性检验卡方独立性检验检验行和列的两个变量彼此有无关联
是命名型变量,顺序型变量相关的计算方法
有时变量虽为等距型,但若不符合Pearson相关的统计前提,也可用卡方独立性检验以下数据是学业成绩和自尊分数,求二者的关系以下数据是学业成绩和自尊分数,求二者的关系被试 学业成绩 自尊分数
A 94 31
B 78 26
C 81 27
D 65 23
。 。 。
。 。 。以下数据是学业成绩和自尊分数,求二者的关系以下数据是学业成绩和自尊分数,求二者的关系nullH0:学业成绩和自尊水平彼此独立
Df=(2-1)(3-1)=2,Χ2(2).05=5.99
χ 2=(17-12)2/12 +(32-30)2/30 +(11-18)2/18 +(13-18)2/18 +(43-45)2/45 +(34-27)2/27 =2.08+ 0.13+2.72+1.39+0.09+1.81=8.22
推翻H0,学业成绩和自尊水平彼此相关卡方检验的前提和限制卡方检验的前提和限制观察彼此独立
所有 fe >=5χ2与效应大小(effect size)χ2与效应大小(effect size)Phi系数,范围0至1,是一种多元相关系数
在2×2列联表时,
在多于2×2列联表时,Phi系数:Cohen’s convensionPhi系数:Cohen’s convension当dfsmall=1时,
Φ=0.10表示小的效应, Φ=0.30表示中等的效应,Φ=0.50表示高的效应.
当dfsmall=2时,
Φ=0.07表示小的效应, Φ=0.21表示中等的效应,Φ=0.35表示高的效应.
当dfsmall=3时,
Φ=0.06表示小的效应, Φ=0.17表示中等的效应,Φ=0.29表示高的效应.null计算上题例1, Cramer’s φ=sqrt(38.09/200/1)=sqrt(0.095)=0.44
中等的效应
例2,Cramer’s φ=sqrt(8.22/150/1)=sqrt(0.027)=0.23
小的效应
概念小测查: 判断正误概念小测查: 判断正误在卡方检验中,样本数据称为观测频率.
卡方检验的一个优点是它可以用于命名量表的数据.
假定卡方匹配度检验采用三个类目的无偏假设.如果样本有n=60个被试,那么每个类目的期望次数是fe=20.
一个检验三个类目分布的卡方匹配度检验,研究者取了100名被试,这个卡方匹配度检验的自由度是df=99.
卡方独立性检验要求每个个体在两列变量上分类.
卡方检验的自由度不依赖样本量大小.
在卡方检验中,观测频率可能为分数或小数.
一般来说,一个大的卡方值会容易拒绝虚无假设.
卡方的数值永远不会为负数.
一位研究者用卡方独立性检验,评价出生顺序和自尊的关系.每个个体被分类为出生顺序为1至3,及高自尊,低自尊.这个卡方独立性检验的自由度是df=2.