首页 人大版-贾俊平-第五版-统计学-第9章PPT课件

人大版-贾俊平-第五版-统计学-第9章PPT课件

举报
开通vip

人大版-贾俊平-第五版-统计学-第9章PPT课件第9章分类数据分析9.1分类数据与卡方统计量9.1.1分类数据调查结果虽然用数值表示,但不同数值描述的是调查对象的不同特征。分类数据汇总的结果表现为频数。卡方检验是对分类数据的频数进行分析的统计方法。AFP金融理财师http://www.afpcfpchina.com/afp/叵浵獍9.2拟合优度检验依据总体分布状况,计算出分类变量中各类别的期望频数,与分布的观察频数进行对比,判断期望频数与观察频数是否有显著差异。1912年4月15日,豪华巨轮泰坦尼克号与冰山相撞沉没。当时船上共有2208人,其中男性1738人,女...

人大版-贾俊平-第五版-统计学-第9章PPT课件
第9章分类数据分析9.1分类数据与卡方统计量9.1.1分类数据调查结果虽然用数值 关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf 示,但不同数值描述的是调查对象的不同特征。分类数据汇总的结果表现为频数。卡方检验是对分类数据的频数进行分析的统计方法。AFP金融理财师http://www.afpcfpchina.com/afp/叵浵獍9.2拟合优度检验依据总体分布状况,计算出分类变量中各类别的期望频数,与分布的观察频数进行对比,判断期望频数与观察频数是否有显著差异。1912年4月15日,豪华巨轮泰坦尼克号与冰山相撞沉没。当时船上共有2208人,其中男性1738人,女性470人。海难发生后,幸存者共718人,其中男性374人,女性344人,以α=0.1的显著性水平检验存活状况与性别是否有关。如果存活状况与性别无关,男性与女性的幸存比例应该相等。海难后幸存比例为718/2208=0.325男性应该为1738*0.325=565人女性应该为470*0.325=153人。H0:观察频数与期望频数一致H1:观察频数与期望频数不一致自由度为:分类变量类型的个数-1=1c2α=0.12.705决策:拒绝H0结论:有证据表明存活状况与性别显著相关拒绝域一项统计结果声称,某市老年人口所占比例为14.7%,该市老年人口研究会为了检验该项统计是否可靠,随机抽选了400名居民,发现其中有57人老年人。调查结果是否支持14.7%的看法?一项统计结果声称,某市老年人口所占比例为14.7%,该市老年人口研究会为了检验该项统计是否可靠,随机抽选了400名居民,发现其中有57人老年人。调查结果是否支持14.7%的看法?H0:观察频数与期望频数一致H1:观察频数与期望频数不一致如果该项统计可靠,400居民中老年人的频数应该为400*14.7%=59自由度为:分类变量类型的个数-1=1c2α=0.055.024决策:接受H0结论:调查结果支持该项统计结论拒绝域9.3列联分析:独立性分析9.3.1列联表由两个以上的变量进行交叉分类的频数分布表行变量的类别用r表示,ri表示第i个类别列变量的类别用c表示,cj表示第j个类别每种组合的观察频数用fij表示表中列出了行变量和列变量的所有可能的组合,所以称为列联表一个r行c列的列联表称为rc列联表列联表的结构(2列联表)列(cj)行(ri)一个2列联表列联表的结构(rc列联表的一般表示)列(cj)行(ri)r行c列的列联表fij表示第i行第j列的观察频数【例】一个集团公司在四个不同的地区设有分公司,现该集团公司欲进行一项改革,此项改革可能涉及到各分公司的利益,故采用抽样调查方式,从四个分公司共抽取420个样本单位(人),了解职工对此项改革的看法,调查结果如下表边缘分布行边缘分布行观察值的合计数的分布例如,赞成改革方案的共有279人,反对改革方案的141人列边缘分布列观察值的合计数的分布例如,四个分公司接受调查的人数分别为100人,120人,90人,110人条件分布与条件频数变量X条件下变量Y的分布,或在变量Y条件下变量X的分布每个具体的观察值称为条件频数行边缘分布列边缘分布条件频数条件频数反映了数据的分布,但不适合进行对比为在相同的基数上进行比较,可以计算相应的百分比,称为百分比分布行百分比:行的每一个观察频数除以相应的行合计数(fij/ri)列百分比:列的每一个观察频数除以相应的列合计数(fij/cj)总百分比:每一个观察值除以观察值的总个数(fij/n)总百分比列百分比行百分比假定行变量和列变量是独立的一个实际频数fij的期望频数eij,是总频数的个数n乘以该实际频数fij落入第i行和第j列的概率,即由于观察频数的总数为n,所以f11的期望频数e11应为例如,第1行和第1列的实际频数为f11,它落在第1行的概率估计值为该行的频数之和r1除以总频数的个数n,即:r1/n;它落在第1列的概率的估计值为该列的频数之和c1除以总频数的个数n,即:c1/n。根据概率的乘法 公式 小学单位换算公式大全免费下载公式下载行测公式大全下载excel公式下载逻辑回归公式下载 ,该频数落在第1行和第1列的概率应为根据上述公式计算的前例的期望频数统计量用于检验列联表中变量之间是否存在显著性差异,或者用于检验变量之间是否独立计算公式为合计:3.0319拟合优度检验检验列联表中目标变量之间是否存在显著性差异检验的步骤为提出假设H0:P1=P2=…=Pj(目标变量的各个比例一致)H1:P1,P2,…,Pj不全相等(各个比例不一致)计算检验的统计量进行决策根据显著性水平和自由度(r-1)(c-1)查出临界值2若22,拒绝H0;若2<2,接受H0拟合优度检验检验职工的态度是否与所在单位有关?(0.1)提出假设H0:P1=P2=P2=P4(赞成比例一致)H1:P1,P2,P3,P4不全相等(赞成比例不一致)计算检验的统计量根据显著性水平=0.1和自由度(2-1)(4-1)=3查出相应的临界值2=6.251。由于2=3.0319<2=6.251,接受H09.3.2独立性检验检验列联表中的行变量与列变量之间是否独立检验的步骤为提出假设H0:行变量与列变量独立H1:行变量与列变量不独立计算检验的统计量进行决策根据显著性水平和自由度(r-1)(c-1)查出临界值2若22,拒绝H0;若2<2,接受H0【例】一种原料来自三个不同的地区,原料质量被分成三个不同等级。从这批原料中随机抽取500件进行检验,结果如下表。检验各地区与原料之间是否存在依赖关系(0.05)提出假设H0:地区与原料等级之间独立H1:地区与原料等级之间不独立计算检验的统计量根据显著性水平=0.05和自由度(3-1)(3-1)=4查出相应的临界值2=9.488。由于2=19.82>2=9.448,拒绝H09.4列联表中的相关测量9.4.1相关系数测度22列联表中数据相关程度的一个量对于22列联表,系数的值在0~1之间相关系数计算公式为一个简化的22列联表列联表中每个单元格的期望频数分别为将各期望频数代入的计算公式得将入相关系数的计算公式得ad等于bc,=0,表明变量X与Y之间独立若b=0,c=0,或a=0,d=0,意味着各观察频数全部落在对角线上,此时||=1,表明变量X与Y之间完全相关列联表中变量的位置可以互换,的符号没有实际意义,故取绝对值即可9.4.2列联相关系数用于测度大于22列联表中数据的相关程度,计算公式为C的取值范围是0C<1C=0表明列联表中的两个变量独立C的数值大小取决于列联表的行数和列数,并随行数和列数的增大而增大。22列联表完全相关时,c=0.7071;33列联表完全相关时,c=0.8165;44列联表完全相关时,c=0.87根据不同行和列的列联表计算的列联系数不便于比较9.4.3V相关系数计算公式为其中V的取值范围是0V1V=0表明列联表中的两个变量独立V=1表明列联表中的两个变量完全相关不同行和列的列联表计算的列联系数不便于比较当列联表中有一维为2,min[(r-1),(c-1)]=1,此时V=9.4.4数值分析、C、V的比较同一个列联表,、C、V的结果会不同不同的列联表,、C、V的结果也不同在对不同列联表变量之间的相关程度进行比较时,不同列联表中的行与行、列与列的个数要相同,并且采用同一种系数9.5列联分析中应注意的问题9.5.1条件百分表的方向通常将自变量放在列的位置,将因变量放在行的位置。如果因变量在样本中的分布和在总体中的分布不同时,可以进行调整。9.5.2卡方分布的期望值准则准则一:如果只有两个单元,每个单元的期望频数必须≥5准则二:如果有两个以上单元,20%以上的单元期望频数<5时,不能使用卡方检验如果期望值过小,会不适当的增大,造成对的高估,导致不适当的拒绝原假设的结论刚才的发言,如有不当之处请多指正。谢谢大家!  
本文档为【人大版-贾俊平-第五版-统计学-第9章PPT课件】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
机构认证用户
夕夕资料
拥有专业强大的教研实力和完善的师资团队,专注为用户提供合同简历、论文写作、PPT设计、计划书、策划案、各类模板等,同时素材和资料部分来自网络,仅供参考.
格式:ppt
大小:649KB
软件:PowerPoint
页数:0
分类:
上传时间:2021-05-18
浏览量:33