首页 第5章 列联表分析与对数线性模型

第5章 列联表分析与对数线性模型

举报
开通vip

第5章 列联表分析与对数线性模型PAGE\*MERGEFORMAT#第5章列联表分析与对数线性模型实验5-1列联表分析一、列联表若总体中的个体可按两个属性A与B分类,A有r个等级,B有c个等级,从总体中抽取大小为N的样本,每种属性的样本数如下表所示:BB1B2•••Bc行和AA1n11n12•••n1cn1+A2n21n22•••n2cn2+•••Arnr1nr2•••nrcnr+列和n+1n+2n+cN称上表为rXc列联表。当r=2=c时...

第5章  列联表分析与对数线性模型
PAGE\*MERGEFORMAT#第5章列联表分析与对数线性模型实验5-1列联表分析一、列联表若总体中的个体可按两个属性A与B分类,A有r个等级,B有c个等级,从总体中抽取大小为N的样本,每种属性的样本数如下表所示:BB1B2•••Bc行和AA1n11n12•••n1cn1+A2n21n22•••n2cn2+•••Arnr1nr2•••nrcnr+列和n+1n+2n+cN称上表为rXc列联表。当r=2=c时,称上表为2X2列联表或四格表。B1B2行和A1n11n12n1+A2n21n22n2+列和n+1n+2n本节仅涉及四格表检验。例1对肺癌患者和对照组的调查结果吸烟不吸烟合计患肺癌60363对照组321143合计9214106问是否患肺癌与是否吸烟独立与否?例21976年至1977年美国佛罗里达州29个区的凶杀案件中凶手的肤色和是否被判死刑的326个犯人的情况如下,问是否存在种族歧视与审判不公?凶手死刑判决是否合计白人19141160黑人17149166合计36290326二、实验内容数据来源:wushujiance.sav某防疫站观察当地一个污水排放口在高温和低温季节中伤寒病菌检出情况。其中高温和低温季节各观测12次,数据有24个观测样本,有两个属性变量degree和test,degree有1(高温季节)和2(低温季节)两个等级;test有1(+)和2(-)两个等级。问:两个季节的伤寒菌检出率有无差别?数据如下图所示:Degree1(高温)2(低温)合计test1(检出)1782(没有检出)11516合计121224意为:设A:高温季节;A:低温季节;B:检出;B:没有检出。记p=P(BIA),p=P(BIA)12此处欲检验H:p=poH:p丰p012112检验统计量:Pearson卡方统计量=咒2%2(1)(渐进)n(nn—nn)211221221-nnnn1+2++1+2称此检验为卡方检验。此外,可以证明:卡方检验等价于独立性检验(A属性与B属性独立),即:H:p=poH:p丰p等价于H:0121120p=ppoH:p丰pp,i,j=1,2.iji--j1iji•・j其中bi=知np=—^,i・nnp=一Y,i,j=1,2.・jn实验过程:(1)打开数据文件;(2)分析->描述统计->交叉表相依系数:其数值在0〜1之间,但不能达到1,是行变量和列变量相关性的度量指标。Phi和Cramer变量:也可以刻画相关性。Lambda:取“1”时表明自变量完全预测因变量,取“0”时表示预测完全没有效果。不定性系数:表示用一个变量来预测其他变量时降低错误的比例。输出结果:[数据集1]K:¥SPSS教程¥sample¥ChapO5¥wushuijiance.sav 案例 全员育人导师制案例信息技术应用案例心得信息技术教学案例综合实践活动案例我余额宝案例 处理摘要案例有效的缺失合计N百分比N百分比N百分比季节*检验结果24100.0%00.0%24100.0%季节*检验结果交叉制表检验结果合计阳性阴性计数11112期望的计数4.08.012.0季节中的%8.3%91.7%100.0%检验结果中的%12.5%68.8%50.0%高温总数的%4.2%45.8%50.0%残差-3.03.0标准残差-1.51.1调整残差-2.62.6季节计数7512期望的计数4.08.012.0季节中的%58.3%41.7%100.0%检验结果中的%87.5%31.3%50.0%低温总数的%29.2%20.8%50.0%残差3.0-3.0标准残差1.5-1.1调整残差2.6-2.6卡方检验值df渐进Sig.(双侧)精确Sig.(双侧)精确Sig.(单侧)Pearson卡方6.750a1.009连续校正b4.6881.030似然比7.3681.007Fisher的精确检验.027.014线性和线性组合6.4691.011有效案例中的N24合计计数81624期望的计数8.016.024.0季节中的%33.3%66.7%100.0%检验结果中的%100.0%100.0%100.0%总数的%33.3%66.7%100.0%2单元格(50.0%)的期望计数少于5。最小期望计数为4.00。仅对2x2表计算上表的sig值均小于0・05,说明高低温两组检出率有显著差别。对称度量值渐进标准误差a近似值Tb近似值Sig.按区间Pearson的R-.530.160-2.934.008c按顺序Spearman相关性-.530.160-2.934.008c有效案例中的N24不假定零假设。使用渐进标准误差假定零假设。基于正态近似值。季节*检验结果交叉制表计数检验结果合计阳性阴性高温11112季节低温7512合计81624直接分析列联表的 方法 快递客服问题件处理详细方法山木方法pdf计算方法pdf华与华方法下载八字理论方法下载 (加权个案)若无个案,直接分析下表检验结果合计阳性阴性高温11112季节低温7512合计81624本例的完成方法:在SPSS中,定义数据为:要让SPSS识别列联表,必须加权个案:输出结果:交叉表[数据集0]C:¥DocumentsandSettings¥wangkun¥桌面¥未标 快递公司问题件快递公司问题件货款处理关于圆的周长面积重点题型关于解方程组的题及答案关于南海问题 l.sav案例处理摘要案例有效的缺失合计N百分比N百分比N百分比气温*检出24100.0%00.0%24100.0%气温*检出交叉制表计数检出合计阴性ioi/rm低溫5712气溫高温11112合计16824卡方检验值df渐进Sig.(双侧)精确Sig.(双侧)精确Sig.(单侧)Pearson卡方6.750a1.009连续校正b4.6881.030似然比7.3681.007Fisher的精确检验.027.014线性和线性组合6.4691.011有效案例中的N242单元格(50.0%)的期望计数少于5。最小期望计数为4.00。仅对2x2表计算可以看到上表中卡方橙费¥値心渐进Sig.精确侧)p蓿确Sig.(单侧)PPearson卡方P6.750I1+.00^P连续校正P4.60811+一诞PP似煞比P71+.007^1Fisher的蓿确检验门.027^.014由于sig值小于0.05,所以认为高温和低温检出率有显著差别。实验5-2对数线性模型一、对数线性模型2X2维交叉列联表B1B2行和A1n11n12%A2n21n22n2列和口1口2n对应概率表为:B1B2行和A1P11P12P1。A2P21P22P2列和P1P21其中p二仝ijn将概率取对数:耳二lnpijij二lnpp——y—ljp.pJ'i--jyp=lnp+lnp+lniJ—,i,J=1,2ijppij将上式视为:耳二A+B+(AB)ijijij接下来引入方差分析模型这是一个有交互效应的双因素方差分析数学模型。二、实验内容数据来源:qiguanyan.sav实验过程:(1)打开数据(2)分析—>对数线性模型—>常规常規对数线性-…冈刚残差31标准残差値国H调节的残差値迟偏差残差側31號顾值亘哇续][取消][帮助]输出结果数据信息N有效4案例缺失0加权有效206定义的单元格4单元格结构中的无效单元0采样无效单元0吸烟状况2类别治疗效果2收敛信息ab最大迭代次数20收敛容限度.00100最终最大绝对差值.00150最终最大相对差值.00071c迭代次数5模型:泊松 设计 领导形象设计圆作业设计ao工艺污水处理厂设计附属工程施工组织设计清扫机器人结构设计 :常量+smoke*effect+smoke+effect由于 参数 转速和进给参数表a氧化沟运行参数高温蒸汽处理医疗废物pid参数自整定算法口腔医院集中消毒供应 估计的最大相对变化小于指定的收敛条件,导致迭代已收敛。迭代历史b,c迭代对数似然估计参数常量[smoke=0]*[effect=0][smoke=0]*[effect=1][smoke=1]*[effect=0]0613.8593.9512.0000.0000.00001660.4574.3070-1.1923-.8462.61542670.9404.2569-1.7649-.9639.41193671.6034.2556-2.0603-.9783.37504671.6174.2556-2.1140-.9785.37435671.617a4.2556-2.1155-.9785.3743未显示冗余的参数。这些参数的值在所有迭代中均为零。由于参数估计的最大相对变化小于指定的收敛条件,导致迭代已收敛。模型:泊松设计:常量+smoke*effect+smoke+effect拟合度检验ab值dfSig.似然比.0000Pearson卡方检验.0000模型:泊松设计:常量+smoke*effect+smoke+effect设计矩阵a,b参数吸烟状况不吸烟吸烟治疗效果治疗效果无效显效无效显效单元结构1111常量1111[smoke=0]*[effect=0]1000[smoke=0]*[effect=1]0100[smoke=1]*[effect=0]0010设计矩阵的缺省显示已被转置。未显示冗余的参数。模型:泊松设计:常量+smoke*effect+smoke+effect单元计数和残差a’b吸烟状治疗效观测期望乎的残差标准化残调整残偏差况果计数%计数%差差无效8.5004.1%8.5004.1%.000.000.000.000不吸烟显效26.50012.7%26.50012.7%.000.000.000.000无效102.50049.3%102.50049.3%.000.000.000.000吸烟显效70.50033.9%70.50033.9%.000.000.000.000模型:泊松设计:常量+smoke*effect+smoke+effect参数估计b,c估计标准误ZSig.95%置信区间下限上限常量4.256.11935.732.0004.0224.489[smoke=0]*[effect=0]-2.116.363-5.830.000-2.827-1.404[smoke=0]*[effect=1]-.978.228-4.294.000-1.425-.532[smoke=1]*[effect=0].374.1552.419.016.071.678[smoke=1]*[effect=1]0a[smoke=0]0a[smoke=1]0a[effect=0]0a[effect=1]0a此参数为冗余参数,因此将被设为零。模型:泊松设计:常量+smoke*effect+smoke+effect参数估计的相关性皿常量[smoke=0]*[effect=0][smoke=0]*[effect=1][smoke=1]*[effect=0]常量1-.328-.523-.770[smoke=0]*[effect=0]-.3281.172.253[smoke=0]*[effect=1]-.523.1721.402[smoke=1]*[effect=0]-.770.253.4021模型:泊松设计:常量+smoke*effect+smoke+effect未显示冗余的参数。参数估计的协方差Zc常量[smoke=0]*[effect=0][smoke=0]*[effect=1][smoke=1]*[effect=0]常量.014-.014-.014-.014[smoke=0]*[effect=0]-.014.132.014.014[smoke=0]*[effect=1]-.014.014.052.014[smoke=1]*[effect=0]-.014.014.014.024模型:泊松设计:常量+smoke*effect+smoke+effect未显示冗余的参数。三、任意rXc列联表分析(对数线性模型)如:数据来源:qiguanyan.sav名称类型宽度小数标签值1smoke数值㈣80吸烟狀况P不吸烟}...2effect数值(N)80治疗效果P无效「3freq数值㈣80频数无46意为:吸烟不吸烟行和有效702696无效1028110列和17234206下面要检验吸烟和治疗效果是否独立?实验过程:SPSSStatistits18撫①分折曲直谄迪酬⑨实用棍库帖苗□辿)幫期定义范围输出结果:层次对数线性分析附注创建的输出19-JUN-201609:20:10注释M:\2015-2016学年下学期\20131101+统计软数据件与应用\自编讲义\sample\Chap05\qiguanyan.sav输入活动的数据集数据集1过滤器〈none〉权重频数拆分文件〈none〉工作数据文件中的N行4缺失的定义用户自定义缺失值被视为缺失。缺失值处理使用的个案对于模型中的所有变量而言,统计量以带有有效数据的所有个案为基础。HILOGLINEARsmoke(01)effect(01)/CWEIGHT=freq/METHOD=BACKWARD语法/CRITERIAMAXSTEPS(10)P(.05)ITERATION©。)DELTA(.5)/PRINT=FREQRESIDESTIM/DESIGN.处理器时间00:00:00.02资源已用时间00:00:00.01[数据集1]M:\sample\Chap05\qiguanyan.sav警告对干1-.500已添加至此饱和模型的所有观测单元格中,使用CRITERIA=DELTA子命今可以更改此值。数据信息N有效4超出范围a0个案缺失0加权有效206吸烟状况2类别治疗效果2a.由于超过因子值范围,个案被拒绝。设计1收敛信息生成类smoke*effect迭代数1“观测边际”与“拟合边际”之间.000的最大差异收敛性准则10.404单元计数和残差吸烟状况治疗效果观测期望残差标准残差计数a%计数%无效8.5004.1%8.5004.1%.000.000不吸烟显效26.50012.9%26.50012.9%.000.000无效102.50049.8%102.50049.8%.000.000吸烟显效70.50034.2%70.50034.2%.000.000a.对于饱和模型,.500已添加至所有观测单元格中。拟合优度检验卡方dfSig.似然比.0000Pearson.0000K-Way和高阶效果Kdf似然比Pearson迭代数卡方Sig.卡方Sig.13117.044.000105.534.0000K-Way和高阶效果a2115.070.00014.599.000212101.974.00090.935.0000K-way效果b2115.070.00014.599.0000检验k-way和高阶效果是否为零。检验k-way效果是否为零。参数估计值效果参数估计标准误ZSig.95%置信区间下限上限smoke*effect1-.378.106-3.569.000-.585-.170smoke1-.867.106-8.190.000-1.075-.660effect1-.191.106-1.801.072-.398.017
本文档为【第5章 列联表分析与对数线性模型】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
个人认证用户
天涯明月
暂无简介~
格式:doc
大小:807KB
软件:Word
页数:29
分类:高中语文
上传时间:2022-12-24
浏览量:5