首页 抽样方法与样本含量的确定!!!

抽样方法与样本含量的确定!!!

举报
开通vip

抽样方法与样本含量的确定!!!抽样方法与样本含量的确定!!! 抽样方法与样本含量的确定 在设计一个抽样调查时,我们通常需要做的工作是:定义总体及抽样单元、确定或构置抽样框、选择抽样技术、确定样本量的大小、制定实施细节并实施。这里我们着重介绍一下定量研究的抽样方法和样本量这两个技术环节。 最基本的定量研究的抽样方法分为两类,一类为非概率抽样,一类为概率抽样。 一、非概率抽样 非概率抽样是不能计算抽样误差的,因为它是靠调研者个人的判断来进行的抽样。它包括偶遇抽样或者方便抽样、判断抽样、配额抽样、雪球抽样等。 偶遇抽样(方便抽样) 常见...

抽样方法与样本含量的确定!!!
抽样方法与样本含量的确定!!! 抽样方法与样本含量的确定 在设计一个抽样调查时,我们通常需要做的工作是:定义总体及抽样单元、确定或构置抽样框、选择抽样技术、确定样本量的大小、制定实施细节并实施。这里我们着重介绍一下定量研究的抽样方法和样本量这两个技术环节。 最基本的定量研究的抽样方法分为两类,一类为非概率抽样,一类为概率抽样。 一、非概率抽样 非概率抽样是不能计算抽样误差的,因为它是靠调研者个人的判断来进行的抽样。它包括偶遇抽样或者方便抽样、判断抽样、配额抽样、雪球抽样等。 偶遇抽样(方便抽样) 常见的未经 许可 商标使用许可商标使用许可商标使用许可商标使用许可商标使用许可 的街头随访或拦截式访问、邮寄式调查、杂志内 问卷 关于教学调查问卷关于员工内部调查问卷员工内部调查问卷基药满意度调查问卷论文问卷调查格式 调查等都属于偶遇抽样的方式。偶遇抽样是所有抽样技术中花费最小的(包括经费和时间)。抽样单元是可以接近的、容易测量的、并且是合作的。但尽管有许多优点,这种形式的抽样还是有严重的局限性。许多可能的选择偏差都会存在,如被调查者的自我选择、抽样的主观性偏差等。这种抽样不能代表总体和推断总体。因此,当我们在进行街头访问或邮寄调查时,一定要谨慎对待调查结果。 判断抽样 判断抽样是基于调研者对总体的了解和经验,从总体中抽选"有代表性的""典型的"单位作为样本,例如从全体企业中抽选若干先进的、居中的、落后的企业作为样本,来考察全体企业的经营状况。如果判断准,这种方法有可能取得具有较好代表性的样本,但这种方法受主观因素影响较大。 配额抽样 配额抽样是根据总体的结构特征来给调查员分派定额,以取得一个与总体结构特征大体相似的样本,例如根据人口的性别、年龄构成来给调查员规定不同性别、年龄的调查人数。配额保证了在这些特征上样本的组成与总体的组成是一致的。一旦配额分配好了,选择样本元素的自由度就很大了。唯一的要求就是所选的元素要适合所控制的特性。这种抽样方法的目的是使样本对总体具有更好的代表性,但仍不一定能保证样本就是有代表性的。如果与问 快递公司问题件快递公司问题件货款处理关于圆的周长面积重点题型关于解方程组的题及答案关于南海问题 相关联的某个特征未被考虑进配额,配额样本可能就不具有代表性,但在实施中包括太多的控制特征是十分困难的。另外,用这种方法进行选择时,往往存在调查员的选择偏好,因而也难以避免主观因素的影响。如果在严格控制调查员和调查过程的条件下,可使配额抽样获得与某些概率抽样非常接近的结果。在进行配额抽样时,要特别注意配额与调查结果之间的密切联系。 雪球抽样 雪球抽样是先选择一组调查对象,通常是随机地选取的。访问这些调查对象之后,再请他们提供另外一些属于所研究的目标总体的调查对象,根据所提供的线索,选择此后的调查对象。这一过程会继续下去,形成一种滚雪球的效果。此抽样的主要目的是估计在总体中十分稀有的人物特征。由于后来被推荐的人可能类似于推荐他们的那些人,因此这种方式的调查也是非概率的。 二、概率抽样 概率抽样包括简单随机抽样,分层抽样,等距抽样,整群抽样等,每个样本的中选概率是已知的,因此可以计算抽样误差。通常的实地调查中,是把这几种抽样方法相互结合。 简单随机抽样 总体中的每一个元素都有一个相等的被抽中概率。简单随机抽样可以通过抽签法和随机数字表方法来实现。先确定或搜集一个抽样框,将抽样框中的每个元素都编上号。然后把所有抽签抽中的号码的元素或随机数字对应的号码的元素做为样本进行调查。 等距抽样(系统抽样) 按照某种顺序给总体中所有单元编号,然后随机地抽取一个编号作为样本的第一个单元,样本的其它单元则按照某种确定的规则抽取(如等距原则),这种抽样方法称为系统抽样。其中最常用最简单的系统抽样叫等距抽样。 分层抽样 分层抽样的特点是先将总体按照某种特征或指标分成几个排斥的又是穷尽的子总体,或层,然后在每个层内按照随机的方法抽取元素。其原则是子总体内元素间差异可能小,而不同子总体间差异大。 整群抽样 整群抽样首先将总体划成许多相互排斥的子总体或群,然后以群为初级抽样单元,按某种概率抽样技术,如简单随机抽样,从中抽取若干个群,对抽中的群内的所有单元都进行调查。 多级抽样 也叫多阶段抽样。它是在第一阶段从所有群中抽取若干群,在每个抽中的群中,再抽取若干单元进行调查。它与分层抽样的区别在于第一层是抽取部分,与整群抽样的区别在于第二阶段是抽取部分。这在实际实施中是最为常见的一种抽样方式。同时它的抽样精度比整群抽样高,操作性更强。 什么时候用概率抽样,什么时候用非概率抽样,应当根据各种条件来决定,例如研究的性质、对误差容忍的程度、抽样误差与非抽样误差的相对大小、总体中的变差、以及统计上的操作上的考虑等。尽管非概率抽样不能推断总体,不能计算抽样误差,但在实际调查中仍常被应 用。一方面是操作的考虑,减少非抽样误差的发生,另一方面也是因为所调查内容不需投射总体,而且一般总体的同质性较强。如概念测试、包装测试、名称测试以及广告测试等,这类研究中,主要的兴趣集中在样本给出各种不同应答的比例。概率抽样用于需要对总体给出很准确的估计的情况,例如要估计市场占有率、整个市场的销售量、估计某个地区的电视收视率等。还有全国性的市场跟踪研究(提供有关产品分类和品牌使用率等信息的研究),以及用户的心理特征和人口分布的研究等,都采取概率抽样。但在概率抽样时要特别注意控制调查过程中的非抽样误差。 如何确定样本量 在抽样设计中,还要考虑样本含量,即观察单位数的多少问题。因为样本含量过少,所得指标不够稳定,用于推断总体的精确度差;样本含量过多,不但造成不必要的浪费,也给调查的质量控制带来更多的困难。因此,估计样本含量,目的是在保证一定精确度的前提下,确定最少的观察单位数。 抽样方法不同,估计样本含量的方法各异,用单纯随机抽样估计总体参数时(率)时,样本n的估计方法。为此要:1)确定容许误差δ 2)确定 标准 excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载 误差的置信水平U3)了解调查α总体的率π 2Uπ(1-π) α n= 2δ 举例:估计过去一个月内,市民上网的比例。 首先要估计此次调查可接受的抽样误差范围,即δ的值。假设此次可接受的误差范围为 ?4%,那么δ=0.04 假设研究人员要求抽样在总体比例的?4%范围内的置信度为95%,则U1.96 α=在一年前的一次类似调查中,有20%的调查者在一个月内上过网,我们可以用0.20作为π值带入公式。 22Uπ(1-π) 1.960.20(1-0.20) α 因此:n= = =384 2 2δ0.04 研究人员如果缺乏估计π的依据,可以对π值做最悲观或最糟糕的假设。当π=0.5时,π(1-π)有极大值0.25存在,如此避免n值过小。 这是无限总体的样本含量估计方法。,在有限总体中,须用公式作进一步校正。根据经验, 但样本容量超过总体的5%时,就需要调整样本容量了。 N n Nc= , 1+(n-1)/N 1+n/N 在市场调查的实际抽样中,所代表的城市人口都很大,所以样本含量和所要调查的城市人口 多少关系不大,这也是为什么在调查大小不同城市时,每个城市的样本含量一样的原因。 在确定样本含量、置信水平下的抽样范围误差估计 在实际的工作中,我们常会根据客户的要求或预算来确定样本含量,这时常常想知道,在这 样的样本量和确定的置信水平下,估计抽样误差的范围是多少。 同理: 2Uπ(1-π) α n= 2δ 如此: 2Uπ(1-π) α 2δ= n 要求置信度水平为90%时,则U1;;要求置信度水平为95%时,则U1.96;要求置信α=α=度水平为99%时,则U2.58 α= 不同样本含量、置信水平下的抽样范围误差估计表 误差 样本量 90,的置信水平 95,的置信水平 99,的置信水平 100 5.00% 9.80% 12.90% 200 3.54% 6.93% 9.12% 300 2.89% 5.66% 7.45% 400 2.50% 4.90% 6.45% 500 2.24% 4.38% 5.77% 600 2.04% 4.00% 5.27% 700 1.89% 3.70% 4.88% 800 1.77% 3.46% 4.56% 900 1.67% 3.27% 4.30% 1000 1.58% 3.10% 4.08% 1100 1.51% 2.95% 3.89% 1200 1.44% 2.83% 3.72% 1300 1.39% 2.72% 3.58% 1400 1.34% 2.62% 3.45% 1500 1.29% 2.53% 3.33% 1600 1.25% 2.45% 3.23% 1700 1.21% 2.38% 3.13% 1800 1.18% 2.31% 3.04% 1900 1.15% 2.25% 2.96% 2000 1.12% 2.19% 2.88% 2100 1.09% 2.14% 2.82% 2200 1.07% 2.09% 2.75% 2300 1.04% 2.04% 2.69% 2400 1.02% 2.00% 2.63% 2500 1.00% 1.96% 2.58% 2600 0.98% 1.92% 2.53% 2700 0.96% 1.89% 2.48% 2800 0.94% 1.85% 2.44% 2900 0.93% 1.82% 2.40% 3000 0.91% 1.79% 2.36% 3100 0.90% 1.76% 2.32% 3200 0.88% 1.73% 2.28% 3300 0.87% 1.71% 2.25% 3400 0.86% 1.68% 2.21% 3500 0.85% 1.66% 2.18% 3600 0.83% 1.63% 2.15% 3700 0.82% 1.61% 2.12% 3800 0.81% 1.59% 2.09% 3900 0.80% 1.57% 2.07% 4000 0.79% 1.55% 2.04% 4100 0.78% 1.53% 2.01% 4200 0.77% 1.51% 1.99% 4300 0.76% 1.49% 1.97% 4400 0.75% 1.48% 1.94% 4500 0.75% 1.46% 1.92% 4600 0.74% 1.44% 1.90% 4700 0.73% 1.43% 1.88% 4800 0.72% 1.41% 1.86% 4900 0.71% 1.40% 1.84% 5000 0.71% 1.39% 1.82%
本文档为【抽样方法与样本含量的确定!!!】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_597436
暂无简介~
格式:doc
大小:20KB
软件:Word
页数:7
分类:企业经营
上传时间:2017-09-20
浏览量:49