首页 第六章抽样调查1课件

第六章抽样调查1课件

举报
开通vip

第六章抽样调查1课件第一节抽样调查的意义第三节抽样平均误差第二节抽样调查的基本概念及理论依据第四节全及指标的推断第六章抽样调查第五节抽样方案设计第六章第一节抽样调查的意义指样本单位的抽取不受主观因素及其他系统性因素的影响,每个总体单位都有均等的被抽中机会抽样调查按照随机原则从全部研究对象中抽取一部分单位进行调查,并以调查结果对总体数量特征作出具有一定可靠程度的估计与推断,从而认识总体的一种统计方法。第六章统计推断全及总体指标:参数(未知量)样本总体指标:统计量(已知量)抽样调查第六章随机原则的实现抽签法是将总体中每个单位的编号写在外形...

第六章抽样调查1课件
第一节抽样调查的意义第三节抽样平均误差第二节抽样调查的基本概念及理论依据第四节全及指标的推断第六章抽样调查第五节抽样 方案 气瓶 现场处置方案 .pdf气瓶 现场处置方案 .doc见习基地管理方案.doc关于群访事件的化解方案建筑工地扬尘治理专项方案下载 设计 领导形象设计圆作业设计ao工艺污水处理厂设计附属工程施工组织设计清扫机器人结构设计 第六章第一节抽样调查的意义指样本单位的抽取不受主观因素及其他系统性因素的影响,每个总体单位都有均等的被抽中机会抽样调查按照随机原则从全部研究对象中抽取一部分单位进行调查,并以调查结果对总体数量特征作出具有一定可靠程度的估计与推断,从而认识总体的一种统计方法。第六章统计推断全及总体指标:参数(未知量)样本总体指标:统计量(已知量)抽样调查第六章随机原则的实现抽签法是将总体中每个单位的编号写在外形完全一致的签上,将其搅拌均匀,从中任意抽选,签上的号码所对应的单位就是样本单位。随机数表法将总体中每个单位编上号码,然后使用随机数表,查出所要抽取的调查单位。计算机模拟法是将随机数字编制为程序存储在计算机中,需要时将总体中各单位编上号码,启用随机数字发生器输出随机数字,然后从总体中找到相应总体单位形成样本。第六章并非所有的抽样估计都按随机原则抽取样本,也有非随机抽样总体随机样本非随机样本与总体分布特征相同与总体分布特征不同第六章 不可能进行全面调查时 不必要进行全面调查时 来不及进行全面调查时 对全面调查资料进行补充修正时抽样调查的应用第六章第二节抽样调查的基本概念和理论依据第六章抽样调查的基本概念抽样总体又称样本或子样,是指从全及总体中按照随机原则抽取的那部分个体的组合。抽样总体的单位数称为样本容量,通常用n表示。1<n<N。例如:在100万户居民中,随机抽取1000户居民进行家庭收支情况调查,其中的100万户居民就是全及总体,而被抽中的1000户居民则构成抽样总体。n≥30称为大样本,n<30称为小样本.n/N称为抽样比第六章样本也有变量样本和属性样本(是非标志样本)之分。根据全及总体各个单位的标志值或标志特征所计算的反映总体某种属性的综合指标,又称总体参数。由于全及总体是惟一确定的,根据全及总体计算的全及指标也是惟一确定的。不同性质的总体,需要计算不同的全及指标。全及指标第六章设总体中个总体单位某项标志的标志值分别为,其中具有某种属性的有个单位,不具有某种属性的有个单位,则⒈总体平均数(又叫总体均值):第六章变量总体的全及指标⒉总体单位标志值的 标准 excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载 差:⒊总体单位标志值的方差:第六章变量总体的全及指标4.总体成数:5.总体是非标志的标准差:6.总体是非标志的方差:第六章是非标志总体的全及指标设总体N个单位中,有N1个单位具有某种属性,N0个单位不具有某种属性,N1+N0=N,P为总体中具有某种属性的单位数所占的比重,Q为不具有某种属性的单位数所占比重设样本中个样本单位某项标志的标志值分别为,其中具有和不具有某种属性的样本单位数目分别为和个,则指根据抽样总体各个单位的标志值或标志特征计算的综合指标,又被称为统计量,它是随机变量。不同性质的抽样总体,也需要计算不同的抽样指标。抽样指标第六章⒉样本单位标志值的标准差:⒊样本单位标志值的方差:变量样本的抽样指标⒋样本成数:⒌样本单位是非标志的标准差:⒍样本单位是非标志的方差:第六章是非标志样本的抽样指标设样本n个单位中,有n1个单位具有某种属性,n0个单位不具有某种属性,n1+n0=n,p为总体中具有某种属性的单位数所占的比重,q为不具有某种属性的单位数所占比重抽样方法的分类根据对样本的要求不同,可分为:考虑顺序抽样不考虑顺序抽样考虑各单位的中选顺序。ABC≠CBA不考虑各单位的中选顺序。ABC=CBA考虑顺序的重复抽样不考虑顺序的不重复抽样考虑顺序的不重复抽样不考虑顺序的重复抽样综合起来共有四种抽样方式第六章样本的可能数目考虑顺序的不重复抽样不考虑顺序的不重复抽样考虑顺序的重复抽样不考虑顺序的重复抽样把填35选7福利彩票号码看作一次抽样,则它属于哪一种抽样?中特等奖的概率是多少?(0—9选6呢?)不考虑顺序的不重复抽样,第六章抽样推断的理论基础大数定律中心极限定律表明大量随机观象平均结果具有稳定性的性质。大数定律论证了如果独立随机变量总体存在有限的平均数和方差,则对于充分大的样本可以近乎100%的概率,期望样本平均数与总体平均数的绝对离差为任意小。如果变量总体存在有限的平均数和方差,那么不论这个总体的分布如何,随着样本容量的增加,样本平均数的分布,便趋近于正态分布。第六章第三节抽样平均误差第六章一、统计误差指统计调查结果所获得的统计数字与客观事物实际数值的差别。1.登记性误差亦称调查工作误差,是指调查登记以及资料汇总中由于主客观原因而引起的误差。如:计算错误、抄录错误、汇总错误而产生的误差,由于遗漏或重复登记而产生的误差等等。登记误差在全面调查和非全面调查中都有可能发生。偶然性登记误差系统性登记误差业务水平低、责任心不强等原因无意系统性登记误差有意系统性登记误差第六章2.代表性误差指在非全面调查中,利用部分单位资料推断总体资料时所产生的误差。代表性误差有两种:偏差随机性误差指没有严格遵守随机原则而产生的系统性误差。随机性误差是指遵循随机原则,但由于抽取的样本不同而产生的误差即为随机性误差。随机性误差是不可避免的。(抽样误差)第六章抽样误差167CM169CM172CM160CM162CM167CM175CM180CM165CM167CM170CM175CM178CM180CM162CM173CM155CM160CM170CM165CM平均身高=169.8CM平均身高=174.6CM总平均身高=168.6CM第六章《统计学》第六章抽样调查登记误差二、影响抽样误差的因素总体各单位标志值的差异程度(即标准差的大小):越大,抽样误差越大;样本单位数的多少:越大,抽样误差越小;抽样方法:不重复抽样的抽样误差比重复抽样的抽样误差小;抽样组织方式:简单随机抽样的误差最大。第六章抽样平均误差指所有可能样本的指标值与总体指标值之间平均离差,即一系列样本指标的标准差。式中:为样本平均数的抽样平均误差;为可能的样本数目;为第个可能样本的平均数;为总体平均数注意:不要混淆抽样标准差与样本标准差!第六章三、抽样平均误差抽样平均误差的计算⒈样本平均数的抽样平均误差当N≥500时,有重复抽样时:不重复抽样时:第六章⒉样本成数的抽样平均误差重复抽样时:不重复抽样时:当N≥500时,有抽样平均误差的计算第六章学生 A B C D E F G成绩30405060708090按随机原则抽选出4名学生,并计算平均分数。平均数的抽样分布样 本均 值样 本均 值样 本均 值ABCDABCEABCFABCGABDEABDFABDGABEFABEGABFGACDEACDF4547.55052.55052.5555557.56052.555ACDGACEFACEGACFGADEFADEGADFGAEFGBCDEBCDFBCDGBCEF57.557.56062.56062.56567.55557.56060BCEGBCFGBDEFBDEGBDFGBEFGCDEFCDEGCDFGCEFGDEFG62.56562.56567.5706567.57072.575样本均值4547.55052.55557.560出现次数1123445样本均值62.56567.57072.575出现次数443211二者均值相等样本均值4547.55052.55557.560出现次数1123445离  差-15-12.5-10-7.5-5-2.50样本均值62.56567.57072.575出现次数443211离  差2.557.51012.515学生 A B C D E F G成绩30405060708090离差-30-20-100102030第六章平均数的抽样分布全部可能样本平均数的均值等于总体均值,即: 从非正态总体中抽取的样本平均数当n足够大时其分布接近正态分布。 从正态总体中抽取的样本平均数不论容量大小其分布均为正态分布。 样本均值的标准差为总体标准差的 。第六章成数的抽样分布全部可能样本成数的均值等于总体成数,即:   从非正态总体中抽取的样本成数,当n足够大时其分布接近正态分布。 从正态总体中抽取的样本成数,不论容量大小其分布均为正态分布。样本成数的标准差为总体标准差的 。第六章关于总体方差的估计方法用过去同类问题全面调查或抽样调查的经验数据代替;用样本标准差代替总体标准差,用代替。第六章第四节全及指标的推断也叫抽样估计,就是根据样本指标数值对总体指标数值作出估计或推断。1.参数估计通常,把用来估计总体特征的样本指标叫估计量或统计量,待估计的总体指标叫总体参数。特点1、它在逻辑上运用归纳推理而不是演绎推理。2、在方法上运用不确定的概率估计方法,而不是运用确定的数学分析方法。3、抽样估计存在抽样误差。第六章2.抽样极限误差指在一定的概率保证程度下,变动的抽样指标与确定的总体指标之间抽样误差的最大可能范围,也称作抽样允许误差。常用△表示。上式表明,样本平均数(成数)是以总体平均数(成数)为中心,在相应的区间内变动。第六章由于总体成数和总体平均数是未知的,它要靠实测的抽样平均数和抽样成数来估计,因而抽样极限误差的实际意义是希望总体平均数(成数)落在某个已知的范围内。2.抽样极限误差所以前面的不等式应变换为:在一个特定的全及总体中,当抽样方法和样本容量固定时,抽样平均误差是一个定值,因此,抽样极限误差通常以抽样平均误差为标准单位来衡量。即抽样极限误差通常表示为抽样平均误差的多少倍。由于t值与样本估计值落入允许误差范围内的概率有关,因此,t也称为概率度。第六章3.抽样估计的置信度抽样指标和总体指标的误差不超过一定范围的概率大小,我们将它称之为概率保证程度,也叫抽样估计的置信度,一般用F(t)表示。即:置信度t值与相应的概率保证程度存在一一对应关系,常用t值及相应的概率保证程度为: t值 概率保证程度  1.000.68271.960.95002.000.95453.000.9973在大样本下第六章68.27%95.45%99.73%抽样极限误差第六章点估计从总体中抽取一个随机样本,计算与总体参数相应的样本统计量,然后把该统计量视为总体参数的估计值,称为参数的点估计。也叫定值估计。简单,具体明确优点缺点无法控制误差,仅适用于对推断的准确程度与可靠程度要求不高的情况第六章4.参数估计的方法的抽样分布点估计的最大好处:给出确定的值点估计的最大问题:无法控制误差第六章区间估计给出一个区间(置信区间)并推断真正的参数以一定的概率存在于这个区间的方法。第六章4.参数估计的方法  以样本统计量为中心,以抽样平均误差为距离单位,可以构造一个区间,并可以一定的概率保证待估计的总体参数落在这个区间之中。区间越大,则概率保证程度越高。区间估计原理第六章区间估计原理0.6827 落在   范围内的概率为68.27%样本抽样分布曲线原总体分布曲线第六章区间估计原理0.9545 落在   范围内的概率为95.45%样本抽样分布曲线原总体分布曲线第六章区间估计原理0.9973 落在   范围内的概率为99.73%样本抽样分布曲线总体分布曲线第六章总体平均数的区间估计表达式其中,为极限误差第六章步骤⒈计算样本平均数;⒉搜集总体方差的经验数据;或计算样本标准差,即总体平均数的区间估计第六章步骤⒊计算抽样平均误差:重复抽样时:不重复抽样时:总体平均数的区间估计第六章步骤⒋计算抽样极限误差:⒌确定总体平均数的置信区间:总体平均数的区间估计第六章【例A】某企业生产某种产品的工人有1000人,某日采用不重复抽样从中随机抽取100人调查他们的当日产量,要求在95﹪的概率保证程度下,估计该厂全部工人的日平均产量和日总产量。总体平均数的区间估计第六章按日产量分组(件)组中值(件)工人数(人)110~114114~118118~122122~126126~130130~134134~138138~14211211612012412813213614037182321186433681221602852268823768165605887006489284648600784合计—100126004144100名工人的日产量分组资料第六章解:第六章则该企业工人人均产量及日总产量的置信区间为:即该企业工人人均产量在124.797至127.203件之间,其日总产量在124797至127303件之间,估计的可靠程度为95﹪第六章总体成数的区间估计表达式其中,为极限误差第六章步骤⒈计算样本成数;⒉搜集总体方差的经验数据;⒊计算抽样平均误差:重复抽样条件下不重复抽样条件下总体成数的区间估计第六章步骤⒋计算抽样极限误差:⒌确定总体成数的置信区间:总体成数的区间估计第六章【例B】若例A中工人日产量在118件以上者为完成生产定额任务,要求在95﹪的概率保证程度下,估计该厂全部工人中完成定额的工人比重及完成定额的工人总数。总体成数的区间估计第六章按日产量分组(件)组中值(件)工人数(人)110~114114~118118~122122~126126~130130~134134~138138~142112116120124128132136140371823211864合计—100100名工人的日产量分组资料完成定额的人数第六章解:第六章则该企业全部工人中完成定额的工人比重及完成定额的工人总数的置信区间为:即该企业工人中完成定额的工人比重在0.8432至0.9568之间,完成定额的工人总数在843.2至956.8人之间,估计的可靠程度为95﹪。第六章第五节抽样方案设计一、抽样方案设计的基本原则随机原则——抽取样本单位时,应确保每个总体单位都有被抽取的可能;在对样本单位的资料进行搜集和整理时,不能随意遗漏或更换样本单位。最大抽样效果原则抽样误差最小——在其他条件相同的情况下,选抽样误差最小的方案费用最少——在其他条件相同的情况下,选费用最少的方案设计抽样方案时,通常是在误差达到一定要求的条件下,选择费用最少的方案第六章二、简单随机抽样(纯随机抽样)对总体未作任何处理的情况下,然后按随机原则直接从总体中抽出若干单位构成样本。抽样平均误差的计算公式见书P278抽取样本的具体方法:抽签法是将总体中每个单位的编号写在外形完全一致的签上,将其搅拌均匀,从中任意抽选,签上的号码所对应的单位就是样本单位。随机数表法将总体中每个单位编上号码,然后使用随机数表,查出所要抽取的调查单位。第六章应用仅适用于规模不大、内部各单位标志值差异较小的总体。简单随机抽样的特点1、直接从总体中抽取所要调查的单位,无须分组、分类、排队等处理;2、必须事先对总体中的所有单位进行编码和编号;3、抽取样本时不借助有关标志的辅助信息;4、当总体各单位标志值之间差异很大时,采用此方法不能保证样本的代表性。第六章先将总体全部单位按某一标志分类,然后从各类型中按随机原则抽取样本单位组成样本。总体N样本n等额抽取等比例抽取最优抽取······三、类型抽样实质上是分组法与随机原则的结合。例如,在居民生活水平调查中,先按职业分类,然后每种职业分别随机抽取部分居民进行调查。第六章类型抽样的优点:能提高样本的代表性;能降低影响抽样平均误差的总方差;组织起来较为方便;类型抽样分组的基本原则:尽量缩小各组内标志值之间的差异,增大组间各标志值之间的差异。第六章样本在各组间的分配方法:等额分配法:每组抽取的单位数一样。等比例分配法:按各组单位的比例分配样本单位。最佳分配法:按各组的方差大小分配样本单位。方差大的组分配较多的样本单位。经济分配法:按各组的方差大小分配样本单位,同时考虑各组抽样调查的费用。实际工作中比较常用的是等比例分配法。第六章类型抽样的抽样平均误差1、抽样平均数2、抽样成数第六章【例】某市有250家商店,分大中小三类,现从中等比例抽出50家进行销售额调查,所得资料如下分层各层商店数Ni层权Wi各层抽取数ni各层销售额样本均值(万元)样本方差(万元)大型商店中型商店小型商店25751500.10.30.6515307008001202800698510850合计2501.050____以95.45%的概率保证程度估计该市所有商店的平均销售额。第六章根据题意知:N=250,W1=0.1,W2=0.3,W3=0.6,t=2,n=50样本均值为:抽样平均误差为:总体均值的区间估计为:382±2*11.9=[385.16万元,405.84万元]解:第六章首先将总体各单位按某一标志排队,然后按固定的顺序和间隔抽取样本单位。又称机械抽样或系统抽样。四、等距抽样等距抽样是不重复抽样,适合于对单位数不多且能进行排序的总体抽样。按无关标志排队按有关标志排队总体单位的排列顺序和所研究的标志数值大小是无关的。如调查居民生活水平时,按姓氏笔划排队。总体单位的排列顺序和所研究的标志数值大小有密切关系。如居民收入调查,按银行存款高低排序。第六章根据样本抽选的方法不同,可分为:随机起点等距抽样半距起点等距抽样对称起点等距抽样······(总体单位按某一标志排序)······(总体单位按某一标志排序)······(总体单位按某一标志排序)第六章按无关标志排队的等距抽样,可按不重复抽样下的简单随机抽样来计算;按有关标志排队的等距抽样,可按类型抽样来计算。等距抽样的抽样平均误差等距抽样的抽样平均误差估计比较复杂。一般按以下方法近似计算。第六章将总体全部单位分为若干“群”,然后以群作为抽样单位,从总体中抽取若干群作为样本,并对中选群的所有单位进行全面调查。例:总体群数R=16样本群数r=4ABCDEFGHIJKLMNOPIHPD样本容量简单、方便,能节省人力、物力、财力和时间,但其样本代表性可能较差五、整群抽样第六章整群抽样的抽样平均误差1、抽样平均数的平均误差2、抽样成数的平均误差第六章例:某工厂生产某种灯泡,在连续生产720小时中,每隔24小时抽取1小时的全部产品加以检查,根据抽样资料计算结果,灯泡平均照明时间为1200小时,群间方差为60小时,计算样本平均数的抽样误差,并以95%的概率保证程度估计该批灯泡的平均照明时间。解:由题意知:抽样平均误差为:该批灯泡的平均照明时间的区间估计为:1200±1.96×1.385=1200±2.715第六章先通过抽取若干级中间组全部单位,最后再来抽取基本调查单位的抽样组织形式。例:在某省100多万农户抽取1000户调查农户生产性投资情况。第一阶段:从该省所有县中抽取5个县第二阶段:从被抽中的5个县中各抽4个乡第三阶段:从被抽中的20个乡中各抽5个村第四阶段:从被抽中的100个村中各抽10户样本n=100×10=1000(户)六、多阶段抽样第六章多阶段抽样的适用范围多阶段抽样具有整群抽样的优点,同时还可用于:1、当抽样调查的面积很广或者总体范围太大无法直接抽取样本时;2、可以相对地节约人力物力;3、对那些基本单位数多且分散的总体,可使抽样工作大大简化。第六章调查对象的性质特点对调查对象的了解程度(抽样框的特点)抽样误差的大小人力、财力和物力等条件的限制在实际工作中,选择适当的抽样组织方式主要应考虑:七、如何确定抽样组织方式第六章第六节必要抽样单位数的确定第六章样本容量调查误差调查费用小样本容量节省费用但调查误差大大样本容量调查精度高但费用较大找出在规定误差范围内的最小样本容量一、确定样本容量的意义找出在限定费用范围内的最大样本容量第六章二、确定样本容量的依据总体各单位标志值的差异程度(即标准差的大小):越大,所需样本容量越大;允许的极限误差△的大小:△越大,所需样本容量越小;推断的可靠程度,即置信度:对可靠程度要求越高,所需样本容量越大;抽样方法和抽样组织方式:不重复抽样比重复抽样所需样本容量要少;类型抽样和机械抽样比简单随机抽样所需样本容量要少;单个抽样比整群抽样所需样本容量要少。第六章确定方法三、推断总体平均数所需的样本容量⑴重复抽样条件下:通常的做法是先确定置信度,然后限定抽样极限误差。或S通常未知。一般按以下方法确定其估计值:①过去的经验数据;②试验调查样本的S。计算结果通常向上进位第六章⑵不重复抽样条件下:确定方法三、推断总体平均数所需的样本容量第六章【例A】某食品厂要检验本月生产的10000袋某产品的重量,根据上月资料,这种产品每袋重量的标准差为25克。要求在95.45﹪的概率保证程度下,平均每袋重量的误差范围不超过5克,应抽查多少袋产品?第六章解:在不重复抽样下:第六章确定方法四、推断总体成数所需的样本容量⑴重复抽样条件下:通常的做法是先确定置信度,然后限定抽样极限误差。计算结果通常向上进位通常未知。一般按以下方法确定其估计值:①过去的经验数据;②试验调查样本的;③取方差的最大值0.25。第六章⑵不重复抽样条件下:确定方法四、推断总体成数所需的样本容量第六章【例B】某企业对一批总数为5000件的产品进行质量检查,过去几次同类调查所得的产品合格率为93﹪、95﹪、96﹪,为了使合格率的允许误差不超过3﹪,在99.73﹪的概率保证程度下,应抽查多少件产品?【分析】因为共有三个过去的合格率的资料,为保证推断的把握程度,应选其中方差最大者,即P=93﹪。第六章解第六章五、必要样本容量的影响因素总体方差的大小;允许误差范围的大小;概率保证程度;抽样方法;抽样的组织方式。重复抽样条件下:不重复抽样条件下:第六章
本文档为【第六章抽样调查1课件】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: ¥38.0 已有0 人下载
最新资料
资料动态
专题动态
个人认证用户
于于
暂无简介~
格式:ppt
大小:2MB
软件:PowerPoint
页数:95
分类:医药卫生
上传时间:2022-11-15
浏览量:0