null心理与教育统计学心理与教育统计学陈启山
华南师大心理系
kaisanchan@yahoo.com.cnnull
参 数 估 计null参数估计在统计方法中的地位统计方法描述统计推断统计假设检验null统计推断的过程null参数估计概要
样本统计量及其分布
参数的点估计
参数的区间估计
1 样本统计量及其抽样分布1 样本统计量及其抽样分布统计量与参数
统计量的双重身份
(1)一个样本的统计量
(2)统计量的一个观测值
常用的样本统计量
如均值、两个均值的差、方差与
标准
excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载
差等,是随机变量(X)的函数。
样本统计量的分布即抽样分布也叫随机变量函数的分布。复习复习样本均值的分布?正态分布
两个样本均值差的分布?T分布
样本方差的分布?卡方分布
两个样本方差比的分布?F分布null某变量服从正态分布,总体平均数为100,总体标准差为5。从该总体中抽取一个容量为25的简单随机样本(simple random sample),求其样本均值介于99~101的概率。如果容量为100呢?62.87% 95.45%
某种灯具平均寿命为5000小时,标准差为400小时,从产品中抽取100盏,问它们的平均使用寿命不低于4900小时的概率是多少?99.38%null样本统计量的抽样分布是参数估计、假设检验等统计方法的理论基础。2 参数估计(parameter estimation)2 参数估计(parameter estimation)根据从总体中抽取的样本估计总体分布中包含的未知参数的方法。
是统计推断的一种基本形式,是数理统计学的一个重要分支。
分为点估计和区间估计两种形式。 3 点估计(point estimation)3 点估计(point estimation)构造一个只依赖样本的量,作为总体分布中所含的未知参数或未知参数的函数的估计值。
简言之,用某一样本统计量的值来估计相应总体参数的值。
null一个优良的估计量:无偏性:估计量的数学期望等于被估计的总体参数。换言之,一切可能个样本统计量的值与总体参数值偏差的均值为零。null有效性:一个方差较小的无偏估计量称为一个更有效的估计量。如,与其他估计量相比,样本均值是一个更有效的估计量。null一致性:随着样本容量的增大,估计量越来越接近被估计的总体参数。null3 区间估计(interval estimation)按一定概率要求,由样本统计量的值估计总体参数值的所在范围。
如: 总体均值落在50~70之间,置信度为 95%。3.1 估计原理与重要概念3.1 估计原理与重要概念区间估计的原理是抽样分布理论。
样本统计量的抽样分布为区间估计提供概率解释。
样本统计量抽样分布的标准误的大小决定置信区间的长度。3.1.1 以平均数的区间估计为例3.1.1 以平均数的区间估计为例所有的样本均值中有95.45%落在总体均值加减2个标准差的间距内。
可以推理,所有样本均值中有95.45%的样本均值加减2个标准差这一间距包含着总体均值。
换言之,有95.45%的机会总体均值被包含在任一样本均值加减2个标准差的间距之间。以平均数的区间估计为例(1-) % 区间包含了,% 的区间未包含。以平均数的区间估计为例3.1.2 置信区间(confidence interval, CI )3.1.2 置信区间(confidence interval, CI )置信区间是指在某一置信度时,总体参数所在的区域长度。置信区间的上下限称为置信限。
置信度,又称置信水平或置信概率,是作出某种推断时正确的可能性(概率)。通常用(1-a)
表
关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf
示。
显著性水平(significance level),即 a,是指估计总体参数落在某一区间时可能犯错误的概率。
常用的置信水平值有 99%, 95%, 90%,相应的 a为0.01,0.05,0.10置信区间的两个要素置信区间的两个要素可靠性:反映为置信水平(1-a)的高低。
精确度:反映为区间长度。
置信区间的确切含义置信区间的确切含义置信水平为95%的置信区间的确切含义:
重复抽样N次,所得到的N个置信区间中有95%个包含了总体参数。
置信区间应用了概率的中心概念,即重复抽样很多次,会出现什么情况。null100个来自N(0,1)的样本所估计的置信区间示意 在区间估计中,总体参数虽未知,但却是固定的值(且只有一个),而不是随机变量值 。
置信区间一旦形成,它要么包含总体参数,要么不包含总体参数,二者必居其一,无概率可言。所谓95%的置信度是针对置信区间的构建方法而言的。 影响区间估计的精确度的因素影响区间估计的精确度的因素置信度(1-a):在N不变的情况下,置信度越高,临界值越大,那么区间会变得越宽,即越不精确。
样本容量N。加大样本容量N ,可以提高样本的代表性,提高估计精确度。
总体数据的变异程度。总体数据变异越大,样本的变异往往也越大,区间会变得越宽。3.2 单总体均值的区间估计3.2 单总体均值的区间估计总体方差已知,使用正态分布统计量
总体方差未知,使用 t 分布统计量
3.2.1单总体均值的区间估计(2已知)3.2.1单总体均值的区间估计(2已知)假定条件
(1)总体服从正态分布,且总体方差(2)已知
(2)如果不是正态分布,可以由正态分布来近似 (n 30)
使用正态分布统计量Znull总体均值在1-置信水平下的置信区间为3.2.2单总体均值的区间估计(2未知)3.2.2单总体均值的区间估计(2未知)假定条件
(1) 总体方差(2)未知
(2)总体必须服从正态分布
使用 t 分布统计量
总体均值在1-置信水平下的置信区间为3.2.3 练习题3.2.3 练习题已知总体为正态分布,标准差为6。从中抽取两个样本,n1=9、n2=36,其均值均为78。试回答总体均值的95%、99%的置信区间。
95%:S1 [74.08, 81.92];S2 [76.04, 79.96]
99%:S1 [72.84, 83.16];S2 [75.42, 80.58]
区间半径为什么不一样,原因何在?null某班49人期末考试平均成绩为85分,标准差为7,假设此项考试能反映学生的学习水平,试推论该班学生学习的真实成绩。
95% [83.04, 86.96]
null从某大学随机抽取100个学生进行韦氏智力测验(Wechsler Intelligence Test )测验,均值是117.50,标准差是10。求该大学学生平均IQ的点估计和95%的置信区间。
117.5, [115.54, 119.46] null3.3 两总体均值差异的区间估计两个样本均值之差的抽样分布:t 分布null相关样本,使用 t 分布统计量
独立样本,使用 t 分布统计量
3.3.1 两总体均值差异的区间估计-相关样本3.3.1 两总体均值差异的区间估计-相关样本两个总体X1、X2服从正态分布,则X1-X2也是正态分布,均值为1- 2 。
两个相关样本有n对观测值,每对观测值的差Di= X1i-X2i。 Di 则是X1-X2的一个样本,服从t分布。
请自己写出来请自己写出来两相关总体均值差异1- 2在1-置信水平下的置信区间为:3.3.2 两总体均值差异的区间估计-独立样本3.3.2 两总体均值差异的区间估计-独立样本还记得这个
公式
小学单位换算公式大全免费下载公式下载行测公式大全下载excel公式下载逻辑回归公式下载
吗?混和标准差是什么?null请自己写出来两独立总体均值差异1- 2在1-置信水平下的置信区间:3.3.3 练习题3.3.3 练习题某省在高考后分析男女生在物理学习上的差异。随机抽取各10名男女考生,其均值分别为59.7、45.7,方差分别为300、340。请计算男女考生物理成绩差异的95%的置信区间。
如果抽取的男女生分别为40名,其它统计参数不变,其95%的置信区间为多少?
比较两个置信区间,你有什么发现?含0时无差异,所以不能判断
是否可根据置信区间判断男女成绩有无差异?null3.4 总体方差的区间估计样本方差的抽样分布
n个相互独立的标准正态变量的平方和服从自由度为n的卡方分布,即z分数的平方和服从卡方分布:
通常u是未知的,用其无偏估计样本均值代替,于是 null总体方差在1-置信水平下的置信区间练习题练习题在一次全市统考中,参加考试的某班49名考生的平均成绩为80,标准差为12。请问全市考生成绩的变异区间有多大?
总体方差
3.5 两总体方差之比的区间估计3.5 两总体方差之比的区间估计推理null思考 的区间估计
练习题练习题随机抽取男生31人,女生25人,进行反应时测验,结果男女生的标准差分别为6和9。试问男女生测验结果的方差是否齐性(相等)?3.6 小结与扩展3.6 小结与扩展区间估计的模式化思路
要知道与所要估计的参数相对应的样本统计量的值,以及样本统计量的理论分布;
要求出该种统计量的标准误;
要确定在多大的可靠度上对总体参数作估计,再通过某种理论概率分布表,找出与某种可靠度相对应的该分布横轴上记分的临界值,才能计算出总体参数的置信区间的上下限。null其他的参数估计可以据以上模式化思路迁移
问题:其他都有什么?null统计量数by变量的测量层次null这些总体参数的估计你会不会?
总体标准差的区间估计
总体比例的区间估计
总体相关系数的区间估计
总体……的区间估计