首页 第二章单变量的统计描述分析(3)社会统计学

第二章单变量的统计描述分析(3)社会统计学

举报
开通vip

第二章单变量的统计描述分析(3)社会统计学第二章单变量统计描述(3)众值、中位值和均值都反映了资料的集中特征但这还不够,试比较以下三组数据:甲组:80869094100X=90乙组:8889909192X=90丙组:9090909090X=90所谓离散趋势测量法是指求出一个值来表示一个变项中各变量值之间的差距和离散程度。离散趋势反应的是变量分布的分散程度,数据分布的另一个重要特征反映各变量值远离其中心值的程度,有时又称离中趋势,离势小,平均数的代表性高;离势大,平均数代表性低。从另一个侧面说明了集中趋势测度值的代表程度不同类型的集中趋势对应着不同的离...

第二章单变量的统计描述分析(3)社会统计学
第二章单变量统计描述(3)众值、中位值和均值都反映了资料的集中特征但这还不够,试比较以下三组数据:甲组:80869094100X=90乙组:8889909192X=90丙组:9090909090X=90所谓离散趋势测量法是指求出一个值来 关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf 示一个变项中各变量值之间的差距和离散程度。离散趋势反应的是变量分布的分散程度,数据分布的另一个重要特征反映各变量值远离其中心值的程度,有时又称离中趋势,离势小,平均数的代表性高;离势大,平均数代表性低。从另一个侧面说明了集中趋势测度值的代表程度不同类型的集中趋势对应着不同的离散趋势的测量**离散趋势的测量的内容一.异众比率二.极差三.四分位差四.平均差五.方差及 标准 excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载 差六.离散系数一、异众比率(VariationRation)适用于定类或以上测量层次的变量异众比率(V)就是非众值的频数占全部个案数目的比率。公式如下:V=         N为全部个案数目,fmo是众值的频次。这个公式所求出的是在全部的个案中有多少是偏离众值,显然,非众值的比例越小,众值的代表性越好。可见,离异比率是众值的补充。当V=0,说明变量只有一个取值,那是众值,这时众值可以完全代表变量;V1时,表示资料十分分散,众值几乎没有代表性。例:调查了200名大学生,内心的苦恼倾诉对象意愿为:党团组织41人、家长49人、知心朋友52人、闷在心里32人、班团干部15人、随便议论11人可见N=200fmo=52V=众数的代表性很低注意:众值与众值频数,即MO与fmo的区别。二、极差(全距)定义:一组数据的最大值与最小值之差例如:数据72,81,86,69,和57的极差为:86与57之差等于29。如果数据已被分组,则极差取为极端类别的中点之差例:青年人阅读小说 关于书的成语关于读书的排比句社区图书漂流公约怎么写关于读书的小报汉书pdf 的数目则极端类别的中点为3和18极差R=18-3=15优点:计算简单,并且一目了然,特别是对外行来说,极差是唯一可理解的离差量度。缺点:它仅仅以两个个案为依据,而且是两个极端的个案,数据利用率低,信息丧失严重。另外,极差随着样本的变化而变化很大,一般来说大样本的极差比小样本更大一些。*三、四分位差,检验中位数代表性高低1.排序后处于25%和75%位置上的值2.不受极端值的影响3.主要用于定序数据,也可用于数值型数据,但不能用于定类数据Q25Q50Q7525%25%25%25%计算方法,是将个案由低至高排列,然后分为四个等分(即每个等分包括25%的个案;则第一个四分位置的值(Q1)与第三个四分位置的(Q3)的差异,就是四分位差(简写Q),公式是Q=Q1-Q3)25%25%25%25%低Q1Q2Q3高(一)未分组数据首先应求出Q1与Q3的位置,公式是:Q1位置=         ;Q3位置=3(N+1)/4其中N是全部个案数目如调查甲、乙两个生产队家庭的人数甲队有11户人家,每户人数如下:2234691010111315Md位置=        ∴Md=9Q1位置=        ∴Q1=3Q3位置=        ∴Q3=11所以四分位差Q=Q3-Q1=11-3=8乙队有8户人家,每户人数如下:2,3,4,7,9,10,12,12Md位置=  ∴Md=Q1位置=   ∴Q1=3+0.25(4-3)=3.25因此Q3位置=3(8+1)/4=6.75∴Q3=10+0.75(12-10)=11.5所以Q=Q3-Q1=11.5-3.25=8.25根据频次分布或四分位差步骤如下:Q1位置=(N+1)/4=(80+1)/4=20.5∴Q1=丁Q3位置=3(N+1)/4=3(80+1)/4=60.75∴Q3=乙Md位置=1/2(N+1)=1/2(80+1)=40.5Md=丙四分位置Q=Q3-Q1=乙-丁结论,有50%的学生成绩在乙与丁之间。*定序数据的四分位数:例【例3.10】根据第二章表2-2中的数据,计算甲城市家庭对住房满意状况 评价 LEC评价法下载LEC评价法下载评价量规免费下载学院评价表文档下载学院评价表文档下载 的四分位数解:下四分位数(Q25)的位置为:Q25位置=(300)/4=75上四分位数(Q75)的位置为:Q75位置=(3×300)/4=225从累计频数看,Q25在“不满意”这一组别中;Q75在“一般”这一组别中。因此Q25=不满意Q75=一般表2-2甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)累计频数非常不满意不满意一般满意非常满意2410893453024132225270300合计300—根据分组资料求四分位差步骤:第一步:计算累加次数(Cf↑)第二步:求出Q1和Q3位置Q1位置=N+1/4Q3位置=3(N+1)/4其中N是全部个案数目第三步:参考累加次数分布,决定Q1和Q3的位置应属于哪一组第四步:从所属的组中,计算Q1位置和Q3位置的数值公式如下:Q1=L1+()W1Q3=L3+()W3其中:L1=Q1属组之真实下限L3=Q3属组之真实下限f1=Q1属组之频数f3=Q3属组之频数Cf1=低于Q1属组下限之累加次数Cf3=低于Q3属组下限之累加次数W1=Q1属组之组距W3=Q3属组之组距N=全部个案数目例:生产队的育龄妇女节育情况第二步Q1的位置=212/4=53Q3的位置=3/4N=3/4212=159第三步参加累加次数分布,可见Q1位置属于5-15组,Q3位置是45-55。根据第四步的计算公式,计算Q1和Q3位置的数值:L1=5.5L3=45.5f1=38f3=24cf1=16cf3=147W1=10W3=10N=212因而:Q1=5.5+()10=15.2Q3=45.5+()10=50.5则Q=Q3-Q1=50.5-15.2=35.3*四分位差:定距数据的例子四分位差Q=Q75-Q25=128.75-117.81=10.94表2-5某车间50名工人日加工零件数分组表按零件数分组频数(人)累积频数105~110110~115115~120120~125125~130130~135135~140358141064381630404650合计50—【例3.13】根据第二章表2-5中的数据,计算50名工人日加工零件数的四分位数*线箱图的绘制(举例)Md=123.21Q25=117.81Q75=128.75Max(Xi)=107Min(Xi)=139*四、平均差:概念要点及计算公式1.各变量值与其均值离差绝对值的平均数2.离散程度的测量值之一3.能全面反映一组数据的离散程度4. 数学 数学高考答题卡模板高考数学答题卡模板三年级数学混合运算测试卷数学作业设计案例新人教版八年级上数学教学计划 性质较差,实际中应用较少5.计算公式为未分组数据组距分组数据例72、81、86、69、57、的均值是73从每个数减去73,忽略正、负号,加上结果再除以5,得A.D=因此我们可以说,记分数与均值平均相差8.4*平均差:计算过程及结果表3-4某车间50名工人日加工零件标准差计算表按零件数分组组中值(Xi)频数(Fi)|Xi-X||Xi-X|Fi105~110110~115115~120120~125125~130130~135135~140107.5112.5117.5122.5127.5132.5137.535814106415.710.75.70.74.39.314.347.153.545.69.843.055.857.2合计—50—312【例3.13】根据第二章表2-5中的数据,计算工人日加工零件数的平均差五、方差和标准差:概念要点1.方差是变量值与均值偏差的平方的平均值,标准差是方差的开平方2.离散程度的测量值之一,最常用的测量值3.反映了数据的分布4.反映了各变量值与均值的平均差异5..根据总体数据计算的,称为总体方差或标准差;根据样本数据计算的,称为样本方差或标准差*总体方差和标准差:计算公式未分组数据:组距分组数据:未分组数据:组距分组数据:方差的计算公式标准差的计算公式标准差(例)*总体标准差:计算过程及结果表3-5某车间50名工人日加工零件标准差计算表按零件数分组组中值(Xi)频数(Fi)(Xi-X)2(Xi-X)2Fi105~110110~115115~120120~125125~130130~135135~140107.5112.5117.5122.5127.5132.5137.5358141064246.49114.4932.490.4918.4986.49204.49739.47572.45259.926.86184.90518.94817.96合计—50—3100.5【例3.14】根据第二章表2-5中的数据,计算工人日加工零件数的标准差还有以下一些替代公式:S=实际上基本公式为:例:72,81,86,69,57,N=56561,7396,4761,3249.*离散系数:概念要点和计算公式1.标准差与其相应的均值之比2.测度了数据的相对离散程度3.用于对不同组别数据离散程度的比较4.计算公式为例如∴代表性高*离散系数:实例和计算过程表3-6某管理局所属8家企业的产品销售数据企业编号产品销售额(万元)X1销售利润(万元)X21234567817022039043048065095010008.112.518.022.026.540.064.069.0【例3.15】某管理局抽查了所属的8家企业,其产品销售数据如表3.6。试比较产品销售额与销售利润的离散程度*离散系数:计算结果X1=536.25(万元)S1=309.19(万元)V1=536.25309.19=0.577S2=23.09(万元)V2=32.521523.09=0.710X2=32.5215(万元)结论:计算结果表明,V1
本文档为【第二章单变量的统计描述分析(3)社会统计学】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
个人认证用户
dzws96803
暂无简介~
格式:ppt
大小:2MB
软件:PowerPoint
页数:54
分类:
上传时间:2023-02-20
浏览量:4