《社会调查研究方法》第六章抽样

《社会调查研究方法》第六章抽样《社会调查研究方法》第六章抽样在社会研究中，最常见的总体是由社会中的某些个人组成的，这些个人便是构成总体的元素，比如，当我们对某省大学生的择业倾向进行研究和探讨时，该省所有在校大学生的集合就是我们研究的总体，而每一个在校大学生便是构成总体的元素。又比如，我们打算研究某城市居民的家庭生活质量，那么，该市所有的居民家庭就构成我们研究的总体，而其中的每一户家庭都是这个总体中的一个元素。样本(sample)就是从总体中按一定方式抽取出的一部分元素的集合。或者说，一个样本就是总体的一个子集...

《社会调查研究方法》第六章抽样在社会研究中，最常见的总体是由社会中的某些个人组成的，这些个人便是构成总体的元素，比如，当我们对某省大学生的择业倾向进行研究和探讨时，该省所有在校大学生的集合就是我们研究的总体，而每一个在校大学生便是构成总体的元素。又比如，我们打算研究某城市居民的家庭生活质量，那么，该市所有的居民家庭就构成我们研究的总体，而其中的每一户家庭都是这个总体中的一个元素。样本(sample)就是从总体中按一定方式抽取出的一部分元素的集合。或者说，一个样本就是总体的一个子集。比如，从某省总数为12．8万人的大学生总体中，按一定方式抽取出1 000名大学生进行调查，这1 000名大学生就构成该总体的一个样本(当然，从一个总体中可以抽取出若干个不同的样本)。在社会研究中，资料的收集工作往往是在样本中完成的。明白了总体和样本的概念，再来理解抽样的概念就十分容易了。。比如，从3 000名工人所构成的总体中，按一定方式抽取200名工人的过程；或者从1 000户家庭构成的总体中，按一定方式抽取一个由100户家庭构成的样本的过程，都叫做抽样。。。比如，上面所举的例子中，单个的大学生既是构成某省12．8万名大学生这一总体的元素，又是我们从总体中一次直接抽取出 1000名大学生的样本时所用的抽样单位；但是，当我们从这一总体中一次直接抽取出40个班级，而以这40个班级中的全部学生(假定正好1000名)作为我们的样本时，抽样单位(班级)与构成总体的元素(学生)就不是一样的了。。比如，从一所中学的全体学生中，直接抽取200名学生作为样本，那么，这所中学全体学生的名单就是这次抽样的抽样框；如果是从这所中学的所有班级中抽取部分班级的学生作为调查的样本，那么，此时的抽样框就不再是全校学生的名单，而是全校所有班级的名单了。因为此时的抽样单位已不再是单个的学生，而是单个的班级了。。在统计中最常见的总体值是某一变量的平均值，比如，某市待业青年的平均年龄、某厂工人的平均收入等等，它们分别是关于某市待业青年这一总体在年龄这一变量上的综合描述，以及某厂工人这一总体在收入这一变量上的综合描述。需要说明的是，总体值只有通过对总体中的每一个元素都进行调查或测量才能得到。。样本值是从样本的所有元素中计算出来的，它是相应的总体值的估计量。比如，样本的平均值就是通过对样本中的每一个元素进行调查或测量后计算出来的，它是相应的总体平均值的估计量。抽样的目的之一，就是要通过这些样本值去估计和推断各种总体值。由于从一个相同的总体中可以根据不同的抽样设计得到若干个不同的样本，所以，从每一个样本中所得到的估计量，都只是总体的许多个可能的估计量中的一个。抽样设计的目标，就是尽可能使所抽取的样本的估计量接近总体的参数值。从抽样的定义中不难看出，抽样主要涉及和处理有关总体与部分之间的关系问题。实际上，抽样早就在人们的日常认识活动中发挥着这种作用。抽样的基本思想或基本逻辑早就被人们自觉或不自觉地运用着。比如厨师在做菜时，常常从一大锅汤中舀一勺汤尝一尝，以便知道整锅汤的味道如何；顾客在买米时，往往先从一大袋米中随手抓一把看看，便知道这批米的质量好不好；医生只要从病人身上抽取很少的一点血液，便可以了解病人全部血液的各种情况。当然，抽样方法更广泛地应用在各种形式的社会科学研究、自然科学研究，以及生产、销售等经济活动中。例如，对社会热点问题进行民意测验、对不同水稻品种的产量进行估计、对各种商品的质量进行检验或评比，都少不了抽样方法的运用和帮助在社会研究中，抽样主要解决的是对象的选取问题，即如何从总体中选出一部分对象作为总体的代表的问题。本章一开始我们就说过，一项社会研究若能对总体中的全部个体都进行了解，那当然是很好的。但实际上广大研究人员常常会在时间、经费、人力等方面遇到难题，甚至陷入困境，从而不得不在庞大的总体与有限的时间、人力、经费之间寻求平衡。可以说，抽样方法是架在研究者十分有限的人力、财力、时间与庞杂、广阔、纷繁、多变的社会现象之间的一座桥梁。有了它的帮助，研究者可以方便地从较小的部分达到很大的整体。为了综合地说明抽样所具有的神话般的作用，我们来看一个实际的例子。 1984年11月，罗纳德?里根以59％比4l％的优势当选为美国新一任总统。正式投票选举的前夕，一些政治民意测验机构就已根据他们抽样的结果预言了里根的胜利。表6—1就是美国的一些全国性的民意测验机构在10月底或11月初所作出的预测结果与实际投票结果的比较。表6-1 1984年美国总统选举预测与实际结果比较(％) 从表6—1中可以看出，尽管各种民意测验的结果互不相同，但是，他们一方面都正确地预言了谁将获胜；另一方面，他们所预言的结果基本上都是紧紧围绕在实际投票结果的周围。那么，在将近1亿的美国选民中，他们究竟调查了多少人就得到这种结果的呢?他们的调查对象还不到2 000人!这就是抽样所具有的力量和效率。根据抽取对象的具体方式，我们把抽样分为各种不同的类型。从大的方面看，各种抽样都可以归为两大类。这是两种有着本质区别的抽样类型。。本章的大部分内容将主要涉及概率抽样的方法，因为它是目前用得最多、也是最有用处的抽样类型。而对于非概率抽样方法的介绍只占很小的篇幅。在概率抽样与非概率抽样这两大类中，还可细分出若干不同的形式，具体情况见图6 —1。除了上述几种类型外，实际研究中还有典型调查、重点调查和个案调查，均属于非概率抽样的范畴。在第五节再做介绍。为了理解概率抽样的原理或逻辑，我们需要对社会群体的同质性与异质性作一点探讨。社会中由不同的个人所组成的各种各样的群体、组织、阶层等等，经常构成社会研究中的总体。如果某个总体中的每一个成员在所有方面都相同，那么，我们说这个总体具有百分之百的同质性，在这种情况下，抽样也就没有必要了。因为只要了解了一个个体，就可以了解到整个总体的情况。这当然只是一种十分极端的例子。。“世上没有两片完全相同的树叶”，现实社会中更没有两个完全相同的人。。而概率样本所要反映的正是总体本身所具有的那种内在的异质性结构。抽样的最终目的在于通过对样本的统计值的描述来相对准确地勾画出总体的面貌。概率抽样的方法可以帮助我们实现这一目标，并且可以对这种勾画的准确程度作出估计。随机抽取是这一过程的关键。。。而且，任何一个个体的入选与否，与其他个体毫不相关，互不影响。或者说，每一个个体的抽取都是相互独立的，是一种随机事件。为了理解事件的随机性与事件发生的概率之间的关系，最好的例子也许是投掷硬币。对于投掷硬币的结果(总体)来说，只有正面和反面(个体)两种可能。每次投掷硬币相当于一次抽样过程(从两种可能性中抽取一种)；这种抽样是随机的(两种可能性都可能出现，且出现的机会均等)；尽管一次具体的随机抽样(一次投掷)只会有一种结果，或者说出现某一种情况(正面或反面)的概率为100％；但是若干次不同的抽样的结果，却总是趋向于两种情况出现的次数各为 50％——即趋向于两种不同结果本身所具有的概率，或者说趋向于总体内在结构中所蕴涵的随机事件的概率。这个例子告诉我们，在各种随机事件的背后，存在着事件发生的客观概率，正是这种概率决定着随机事件的发展变化规律。概率抽样之所以能够保证样本对总体的代表性，其原理就在于它能够很好地按总体内在结构中所蕴涵的各种随机事件的概率来构成样本，使样本成为总体的缩影。在讨论概率抽样的问题时，应对有关的问题略作说明。严格地说，由于研究者在实际抽样中所做的基本上都是不放回抽样，因而并没有完全满足抽样的独立性要求。这种独立性要求指的是：任何一个元素的抽取都不会影响到其他元素被抽取的概率(这一要求是本书后面几章中讨论的统计检验所必须依据的假定)。然而，只要总体相对于样本来说要大得多，我们就可以忽略这种不放回抽样所产生的微小改变。因为事实上对于一个相当大的总体来说，缺少一个元素可以说基本上并不改变总体中其他众多元素被抽中的概率，同样的，即使将抽中的元素放回总体中，它也基本上不会有第二次被抽取的机会。为了更好地理解概率抽样的原理，有必要对抽样分布作一简要介绍(更为详细的介绍可参见各种概率统计教材)。抽样分布是根据概率的原则而成立的理性分布，它显示出：从一个总体中不断抽取样本时，各种可能出现的情况。我们先来看一个总体为10个个案的平均数抽样分布。假如这10个人参加工作的年限分别为6、7、8、9、10、11、12、13、14、15年，那么这一总体中的成员平均参加工作年限为10.5年。如果我们从总体中随机抽取一个人作为样本来估计总体的平均数，那么这种样本的估计可能是6年到15年。全部可能的10个“样本”所得到的估计值可用图6—2表示。图6—2 容量为1的样本的抽样分布这时，抽取任一1个样本的年龄与总体的实际平均年龄的最大误差为4.5年。当样本容量为2时我们总共可以抽取45 2 ＝10×10个不同的样本(根据组合公式计算C9／1×2＝45)。这些样本的平均数范围是从 6．5年到14．5年，但其中会产生一些相同的平均数。比如6年和14年、7年和13年、8年和12年、9年和11年这四个样本的平均数都是10年。图6—3中，10年那一列的四个点即是这四个样本的平均数。这45个样本的平均数分布如图6—3所示。图6—3 容量为2的样本的抽样分布这时，抽取任一组2个样本的年龄与总体的实际平均年龄的最大误差为4年。当样本容量增至3时，我们就会得到120个样本(C3 ＝10× 9×8／1×2×3=120)。这10 些样本的平均数范围是从7年到14年，其中相同的平均数更多。全部样本的平均数分布如图6—4。图6—4 容量为3的样本的抽样分布这时，抽取任一组3个样本的年龄与总体的实际平均年龄的最大误差为3.5年。当样本容量继续增大(越来越接近总体的 l/2时)，样本平均数的分布会进一步发生变化。。从图6—5、图6—6中，我们可以很清楚地看到这种变化(它们分别是样本容量为4和5时的分布)。图6—5 容量为4的样本的抽样分布图6—6 容量为5的样本的抽样分布在概率统计中，有一个对抽样分布十分有用的“中心极限定理”。这一定理指出：在一个含有N个元素且平均数为μ、标准差为σ的总体中，抽取所有可能含有n个元素的样本(根据组合计算全部可能的样本数目n ＝N!/(N-n)!n!。若用X，X，„，Nl2为m＝C X。来分别表示这m个样本的平均数，那么，样本平均数X的分布将是一个随n愈大而愈i 趋于具有平均数μ和标准差σ/?n的正态分布。这一定理说明：当n足够大时(通常假定大于30)，无论总体的分布如何，其样本平均数所构成的分布都趋于正态分布。它的形状如图6—7。这种抽样分布具有的特点，因而其平均数、众数和中位数都相同。这即是说，图6—6中的μ既是抽样分布的平均数，也是次数最多的值(众数)，而且其两边的样本数相同(即中位数)。还可以证明，全部样本平均数的平均数正好等于总体的平均数，即有( )小而全部样本平均数的标准差(称为标准误差或标准误，记为SE)则等于总体标准差除以而，即 (SE= ) (证明从略) 图6--7 正态分布图更为重要的是，由于平均数的抽样分布是正态分布，其平均数的次数就是正态曲线下的面积。而根据概率统计理论，正态分布曲线下的任何部分的面积是可以用数学方法推算的。因此，任何两个数值之间的样本平均数次数所占的比例是可以求得的。比如，有68.26％的样本平均数在,u?SE这两个数值的范围内；类似的，大约有95％的样本统计值落在总体参数值正负两个标准误范围内，即SE；99.9％的样本统计值将落在总体参数值正负三个标准误范围内，即 ?3SE。在实际应用中，人们更多的是采用下列几个数字：有90％落在μ?l.65SE之间；有95％落在μ?l.96SE之间；有98％落在μ?l.33SE之间；有99％落在μ?l.58SE之间。从反面来考虑这一结论，我们就会有以下推论：对于任何一次随机抽样来说，其样本的统计值落在总体参数值正负1.65个标准误之间的概率是90％；落在总体参数值正负1.96个标准误之间的概率是95％„„我们正是在这种意义上来说明(或把握程度，如90％、95％等等)与(估计范围)之间的关系。虽然不同的抽样方法具有不同的操作要求，但它们通常都要经历这样几个步骤。界定总体就是在具体抽样前，首先对从中抽取样本的总体范围与界限作明确的界定。这一方面是由抽样的目的所决定的。因为抽样虽然只对总体中的一部分个体实施，但其目的却是为了描述和认识总体的状况与特征，是为了发现总体中存在的规律性，因此必须事先明确总体的范围；另一方面，界定总体也是达到良好的抽样效果的前提条件。如果不清楚明确地界定总体的范围与界限，那么，即使采用严格的抽样方法，也可能抽出对总体严重缺乏代表性的样本来。在这方面最为著名的例子是1936年美国总统大选的民意测验。总统选举投票前，《文摘》杂志寄出1000万张询问投票倾向的明信片，然后依据收回的200万份结果极其自信地预测共和党候选人兰登将以领先 15％的得票率战胜民主党候选人罗斯福而当选总统。然而，选举结果使预测者们大失所望：获胜者不是兰登，而是罗斯福，并且其得票率反超过兰登20％! 《文摘》杂志的声誉一扫而光，不久就因此而关了门。是什么原因导致《文摘》杂志的预测失败了呢?除了抽样方法上的非随机性以及邮寄方式上的原因外，对抽取样本的总体缺乏清楚的认识和明确的界定也是极为重要的原因。因为它当时抽样所依据的并不是美国全体已登记的选民名单，而是依据电话号码簿和汽车登记簿来编制抽样框，再从这些号码中进行抽取的。这样一来，那些没有家庭电话和私人汽车的选民就被排除在其抽样的总体之外了。而在当时，由于1933年开始的美国经济大萧条的影响，一方面大量人口滑落到下等阶层，另一方面，此时的劳动阶层选民希望选个民主党人当总统，因而很多人出来投票。结果，这些未被抽到民意测验中的较穷的选民压倒多数地投了罗斯福的票，使《文摘》杂志的预测遭到惨败。这一实例告诉我们，要有效地进行抽样，必须事先了解和掌握总体的结构及各方面的情况，并依据研究的目的明确地界定总体的范围。样本必须取自明确界定后的总体，样本中所得的结果，也只能推广到这种最初已作出明确界定的总体范围中。这一步骤的任务就是依据已经明确界定的总体范围，收集总体中全部抽样单位的名单，并通过对名单进行统一编号来建立起供抽样使用的抽样框。例如，如果我们要在某大学进行一项该校大学生职业观的抽样调查，那么，第一步是要先对总体进行界定。比如说，本次调查的总体是该大学所有在读的全日制本科生和研究生。这样，该校那些专科生、夜大生以及其他一些不符合上述界定的学生就被排除在总体之外。而制定抽样框这一步的工作，就是要收集全校各系所有在读本科生及研究生的花名册，并按一定的顺序将全部花名册上的名单统一编号，形成一份完整的、既无重复又无遗漏的总体成员名单，即抽样框，从而为下一步抽取样本打下基础。需要注意的是，当抽样是分几个阶段、在几个不同的抽样层次上进行时，则要分别建立起几个不同的抽样框。比如，为了解某市小学生的学习情况，需要从全市500所小学中抽取10所小学，再从每所抽中的小学中抽取3个班级，最后从每个抽中的班级中抽取10名小学生。那么，就要分别收集并排列全市500所小学的名单、每所抽中的小学里所有班级的名单，以及每个抽中的班级中所有学生的名单，形成三个不同层次的抽样框。从前面有关抽样类型的介绍中，我们已经了解到具体的抽样方法有好几种。而从后面几节对这些方法的介绍中我们将会看到，各种不同的抽样方法都有自身的特点和适用范围。因此，对于具有不同研究目的、不同范围、不同对象和不同客观条件的社会研究来说，所适用的抽样方法也不一样。这就需要我们在具体实施抽样之前，依据研究的目的要求、依据各种抽样方法的特点，以及其他有关因素来决定具体采用哪种抽样方法。除了抽样方法的确定以外，还要根据要求确定样本的规模以及主要目标量的精确程度。实际抽取样本的工作就是在上述几个步骤的基础上，严格按照所选定的抽样方法，从抽样框中抽取一个个的抽样单位，构成样本。依据抽样方法的不同，以及依据抽样框是否可以事先得到等因素，实际的抽样工作既可能在研究者到达实地之前就完成，也可能需要到达实地后才能完成。即既可能先抽好样本，再下去直接对预先抽好的对象进行调查或研究；也可能一边抽取样本一边就开始调查或研究。例如，若在一所大学中抽取200名学生进行调查，当这所学校的学生总数不是很大，且很容易弄到全校学生的花名册时，就可以事先从这份花名册中(即抽样框中)抽取出200名学生的名单；然后等其他准备工作均已做好，正式开始调查时，再按照事先已抽好的名单找到这200名学生进行调查。但当研究的总体规模较大。且抽样是采取多阶段方式进行时，就得边抽样边调查了。比如，前述的某市小学生学习情况的课题项目。虽然500所小学中全体学生的名单并非完全不能弄到，但其数量实在太大，实际抽样也十分麻烦。这时往往采取多阶段抽样的方法。那么，从500所小学中随机抽取10所小学的工作可以事先完成，而从每所抽中的小学中抽取3个班级，以及从每个抽中的班级中抽取10名小学生的工作，则往往是到了实地(即具体小学)后再进行的。到实地进行抽样时，往往是直接由调查员按预先制定好的操作方式或具体方法执行。比如，要抽取居民家庭时，往往是先抽好居委会，然后制定出具体操作方式：“楼房按单元抽，一个单元抽一户；平房按排抽，一排抽一户；两种抽样都采取简单随机抽样的方法，每个调查员随身带20 张写好号码的小纸片装在口袋中，摸到什么号码就抽取所对应的家庭。”这样，调查员就可以一边抽样一边调查了。一般情况下，样本的抽出并不是抽样过程的结束。完整的抽样过程还应包括样本抽出后对样本进行的评估工作。所谓样本评估，就是对样本的质量、代表性、偏差等等进行初步的检验和衡量，其目的是防止由于样本的偏差过大而导致的失误。评估样本的基本方法是：将可得到的反映总体中某些重要特征及其分布的资料与样本中的同类指标的资料进行对比。若二者之间的差别很小，则可认为样本的质量较高，代表性较大；反之，若二者之间的差别十分明显，那么样本的质量和代表性就一定不会很高。举例来说，如果我们从一所有4 000名学生的大学中抽取200名学生作为样本，同时，我们从学校有关部门那里得到下列统计资料：全校男生占学生总数的78％，女生占22％；本省学生占64％，外省学生占36％；那么，我们可以对抽出的200名学生进行这两方面分布情况的统计。假定样本得到的结果为：男生占76％，女生占24％；本省学生占67％，外省学生占33％。两相对比，不难发现二者之间的差距很小，它在一定程度上说明，样本的质量和代表性较高。从这样的样本中得到的结果就能较好地反映和体现总体的情况。当然，用来进行对比的指标越多越好，各种指标对比的结果越接近越好。在进行抽样设计时，应遵循一定的原则。美国著名的抽样专家科什(Kish)教授在其名著《调查抽样》中提出了一个优秀的抽样设计所应该满足的四条标准。这四条标准也可以说是进行抽样设计时所应遵循的四条原则。它们是： (1)目的性原则； (2)可测性原则； (3)可行性原则； (4)经济性原则。。以研究的问题为出发点，从最有利于研究资料的获取，以及最符合研究的目的等因素来考虑抽样方案和抽样方法的设计。。在研究中通常用标准误来表示。这是统计推断必需的基础，是样本结果与未知的总体值之间客观、科学的桥梁。通常，只有概率样本在客观上才是可测的，即概率样本可以计算出有效的估计值或抽样变动的近似值。但是，概率抽样也并不自动保证可测性。比如，从一个具有周期性变化的总体中选出一个系统样本，就不能保证这种可测性。。它意味着研究者所设计的方案能够预料实际抽样过程中可能出现的各种问题，并设计了处理这些问题的方法。由于在理论上设计抽样方案和在实际中执行这一方案是两码事，因而可行性是抽样设计的一条重要标准。。这种资源主要包括研究的经费、时间、人力等等。由于这四条标准相互之间存在着一定的制约关系，甚至会相互冲突，因而在实际设计中，常常存在这样的情况，即研究者很难设计出一个在上述四个原则上同时达到最大值的抽样方案。在更多的情况下，实际的抽样设计就成为研究者在这四条标准中进行取舍和保持平衡的过程。比如说，如果要加强抽样方案的可测性，研究者就应该尽可能加大样本的容量；然而在这样做的时候，却同时又意味着增加抽样所需的资源。这就使得抽样设计的经济性原则进一步减弱。相对而言，这四条标准中，目标定向原则和可行性原则是首要的。抽样设计要服务于研究的目标，这是设计的出发点和基本目的。而可行性则是设计方案得以实现的前提和保证。研究者应该在优先考虑这两条标准的基础上，去进一步增加方案的可测性，同时减少方案所需的资源。概率抽样是按照概率原理进行的，它要求样本的抽取具有随机性。前面已经提到，概率抽样有若干种不同的形式，每一种具体的形式有着各自不同的特点。而在研究中对不同抽样方式的选择将涉及研究问题的性质、完善的抽样框的获得、研究经费的多少、样本精确性的要求，以及资料的收集方法等因素。下面我们就结合这些因素，对常用的几种概率抽样方法逐一进行介绍。简单随机抽样(simple random sampling)又称纯随机抽样，是概率抽样的最基本形式。它是按等概率原则直接从含有 N个元素的总体中随机抽取n个元素组成样本(N>n)。常用的办法类似于抽签，即把总体的每一个单位都编号，将这些号码写在一张张小纸条上，然后放人一容器如纸盒、口袋中，搅拌均匀后，从中任意抽取，直到抽够预定的样本数目。这样，由抽中的号码所代表的元素组成的就是一个简单随机样本。比如，某系共有学生300人，系学生会打算采用简单随机抽样的办法，从中抽取出 60人进行调查。为了保证抽样的科学性，他们先从系办公室那里得到一份全系学生的名单，然后给名单中的每个学生都编上一个号(从001到300)。抽样框编好后，他们又用300张小纸条分别写上001，002，„，300的号码。他们把这300张写好不同号码的小纸条放在一个盒子里，搅乱后，随便摸出60张小纸条。然后，他们按这60张小纸条上的号码找到总体名单上所对应的60位同学。这60位同学就构成了他们本次的样本。这种方法简便易学。但当总体元素很多时；写号码的工作量就很大，搅拌匀也不容易，因而此法往往在总体元素较少时使用。对于总体元素很多的情形，我们则采用随机数表来抽样。本书后就附有一张随机数表，表中的数码和排列都是随机形成的，没有任何一点规律性(故也称为乱数表)。利用随机数表进行抽样的具体步骤是： (1)先取得一份总体所有元素的名单 (即抽样框)； (2)将总体中所有元素一一按顺序编号； (3)根据总体规模是几位数来确定从随机数表中选几位数码； (4)以总体的规模为标准，对随机数表中的数码逐一进行衡量并决定取舍； (5)根据样本规模的要求选择出足够的数码个数； (6)依据从随机数表中选出的数码，到抽样框中去找出它所对应的元素。按上述步骤选择出来的元素的集合，就是所需要的样本。举例来说，某总体共3 000人(四位数)，需要从中抽取100人作为样本进行调查。首先，我们要得到一份总体成员的名单；然后对总体中的每一个人从1到3 000进行编号；再根据总体的规模，确定从随机数表中，选择四位数。具体的选法是从随机数表的任意一行和任意一列的某一个四位数开始，按照从左到右的顺序，或者从上到下的顺序，以3 000为标准，对随机数表中依次出现的每个四位数进行取舍：凡小于或等于3 000的数码就选出来，凡大于3 000的数码以及已经选出的数码则不要，直到选够100个数码为止；最后按照所抽取的数码，从总体名单中找到它们所对应的100个成员。这100个成员就构成一个随机样本。表6-2就是对3 000人的总体进行抽样时，我们采用随机数表对四位数码进行取舍的例子(采用后四位数，并按从上往下的顺序)。表6--2 随机数表抽样例如果采用前四位数字，仍按从上往下的顺序，那么从表6—2中我们又可以抽取出 1053、0139、1359、2725这四个号码。如果取中间的四位数字，所得到的则是2990、1404、1912和0582这四个号码了。。它是把总体的单位进行编号排序后，再计算出某种间隔，然后按这一固定的间隔抽取个体的号码来组成样本的方法。它和简单抽样一样，需要有完整的抽样框，样本的抽取也是直接从总体中抽取个体，而无其他中间环节。系统抽样的具体步骤是： (1)给总体中的每一个个体按顺序编号，即制定出抽样框。 (2)计算出抽样间距。计算方法是用总体的规模除以样本的规模。假设总体规模为N，样本规模为n，那么抽样间距K就由下列公式求得： N(总体规模) K(抽样间距) = n(样本规模) (3)在最前面的K个个体中，采用简单随机抽样的方法抽取一个个体，记下这个个体的编号(假设所抽取的这个个体的编号为 A)，它称做随机的起点。 (4)在抽样框中，自A开始，每隔K个个体抽取一个个体，即所抽取个体的编号分别为A，A+K，A+2K，„，A+(n-1)K。 (5)将这72个个体合起来，就构成了该总体的一个样本。例如，要在某大学总共3 000名学生中，抽取一个容量为100的大学生样本。我们先将3 000名学生的名单依次编上号码，然后按上述公式可求得抽样间距为： 3000 K = = 30 100 即每隔30人抽一名。为此，我们先在1～30的数码中，采用简单随机抽样的方法抽取一个数字，假如抽到的是12，那么就以12为第一个号码，每隔30名再抽一个。这样，我们便可得到12，42，72，„，2 972总共 100个号码。我们再根据这100个号码，从总体名单中一一对应地找出100名学生，这100名学生就构成本次的一个样本。从上面的过程中我们不难看出，系统抽样较之于简单随机抽样来说，显然简便易行多了，尤其是当总体及样本的规模都较大时更是如此。这也正是社会研究较少采用简单随机抽样而较多采用系统抽样的原因。值得注意的是，。因此，我们在使用系统抽样方法时，一定要注意抽样框的编制方法。特别要注意下列两种情况：比如，我们要抽取若干家庭的样本进行消费状况调查。而家庭户的名单是按每个家庭总收入的多少由高到低顺序排列的。这样，如果有两个研究者都采取系统抽样的方法从这个总体中进行抽样，一个抽到抽样间距中靠前的号码，比如3；而另一个抽到的是抽样间距中靠后的号码，比如间距为40时抽到38。那么，从前一个研究者所抽样本中算出的家庭平均收入，一定大大高于后者所抽样本中算出的家庭平均收入。因为第一个样本中的每一个家庭都要比第二个样本中的每一个家庭在收入等级中靠前35个位置，即前者中的每一个家庭都比后者中的每一个家庭在总收入上高出35户家庭。如果我们事先注意到这种情况，就可以采取措施，打乱其原来的顺序，重新编制总体名单，或者改用其他的抽样方法。比如，前面关于大学生一例中，我们计算出间距为30。如果此时总体名单是按教学班排列、每班正好也是30个左右的学生，并且每班的名单都是按学生学习成绩高低排列，或是按班干部、一般学生、较差学生的顺序排列的。那么，当所抽的初始号靠前时，样本就由各班上成绩优秀的学生组成，或是全由各班的班干部组成；而当所抽的初始号靠得较后时，样本就会由各班中成绩较差的学生或是各方面表现较差的学生组成。显然，无论是哪种情况，都不符合总体的全面情况，都是一个有着严重偏差的样本。。例如，在一个企业抽取职工样本时，我们可以先把职工总体分为工人、干部和技术人员三大类；然后，采用简单随机抽样或系统抽样的方法，分别从这三类职工中抽取三个子样本；最后，将这三个子样本合起来构成全体职工的样本。分层抽样方法的一个优点，就是在不增加样本规模的前提下降低抽样误差，提高抽样的精度。前面我们曾经指出，总体的同质性程度越高，样本就越容易反映和代表总体的特征和面貌；而总体的异质性程度越高，样本对总体的反映和代表就越困难，对抽样的要求也越高。采用分层抽样的最基本目的，正在于把异质性较强的总体分成一个个，以便提高抽样的效率，达到更好的抽样效果。用统计的语言来说，通过分层，使得各层内元素之间的变异程度变小，各个层内的方差变小(比总体的方差要小)，因而在样本规模相同时，分层抽样的抽样误差往往比简单随机抽样的抽样误差要小。分层抽样方法的另一个优点，就是非常便于了解总体内不同层次的情况，以及对总体中不同的层次进行单独研究，或者进行比较。比如，在《中国妇女社会地位调查》中，研究者为了能分析比较城乡差别，提高抽样精度，并能保证城市分析具有足够的样本容量，他们采取了各个省在省内进一步按城乡分域(实际上是作为研究域的层)，分别进行抽样的做法，并使城乡两域的样本规模相等。这表明，该调查采用的是不按比例的分层抽样方式。在实际运用分层抽样的方法时，研究者需要考虑下列两个方面的问题：。同一个总体可以按照不同的标准进行分层，或者说，根据不同的标准可以将一个总体分成不同的类别或层次。那么，在实际抽样中究竟应该按什么标准来分层呢?通常采用的原则有：第一，以所要分析和研究的主要变量或相关的变量作为分层的标准。比如，若要研究居民的消费状况和消费趋向，可以以居民家庭人均收入作为分层标准；又如，要了解社会研究中不同职业的人员对社会经济改革的看法，就可以以人们的职业作为分层的标准。第二，以保证各层内部同质性强、各层之间异质性强、突出总体内在结构的变量作为分层变量。比如在工厂进行，可以以工作性质作为分层标准，将全厂职工分为干部、工人、技术人员、勤杂人员等几类来进行抽样。第三，以那些已有明显层次区分的变量作为分层变量。比如在社会研究中，性别、年龄(当然是分段以后，如老、中、青)、文化程度、职业等等，就经常被用作分层的标准。其他如学生按年级、专业、学校类型分层，城市按人口规模分层等等。。分层抽样中有按比例和不按比例分层两种方法。按比例分层抽样是指按各种类型或层次中的单位数目同总体单位数目间的比例来抽取子样本的方法。即在单位多的类型或层次中所抽的子样本就大一些，在单位少的类型或层次中所抽的子样本就小一些。比如，某厂有工人600人，按性别分层则有男工500人，女工100人。两类工人人数与总体人数的比例分别为 5：6与1：6。因此，若要抽60人作样本，那么，按比例的抽法就是根据上述比例，分别从500名男工中随机抽取50人，而从100 名女工中随机抽取10人。这样，样本中男女工人之比与总体中男女工人之比完全相同，均为5：1。可以说，样本的性别结构是总体中性别结构的一种缩影。采取按比例分层抽样的方法，可以确保得到一个与总体结构完全一样的样本。但是，在有些情况下，又不宜采用这种方法。例如，有时总体中有的类型或层次的单位数目太少，若以按比例分层的方法抽样，则有的层次在样本中个案太少，不便于了解各个层次的情况，这时往往要采取不按比例抽样的方法。如上例中，我们可以在500名男工中抽30人，在100名女工中也抽30人。这样，样本就能很好地反映出男女两类工人的一般状况，我们也能很好地对男女两类工人的情况进行比较和分析。但需要注意的是，我们采用不按比例分层抽样的方法，主要是便于对不同层次的子总体进行专门研究或进行相互比较，但若要用样本资料推断总体时，则需要先对各层的数据资料进行加权处理，即通过调整样本中各层的比例，使数据资料恢复到总体中各层实际的比例结构。比如上例中，，若要用30个男工、30个女工的收入资料去推断全厂工人的平均收入时，就需要在男工的收入后乘以 5／3，而在女工的收入后乘以1／3，再加总平均，否则就会导致推断的偏误。。这种小的群体可以是居民家庭，可以是学校中的班级，也可以是工厂中的车间，还可以是城市中的居委会等等。整群抽样中对小群体的抽取可采用简单随机抽样、系统抽样或分层抽样的方法。举例来说；假设某大学共有100个班级，每班都是30名学生，总共有3 000名学生。现要抽300名学生作为样本。如果我们采用整群抽样的方法，就不是直接去抽一个个的学生，而是从全校100个班级中，采取简单随机抽样的方法(或是系统抽样、分层抽样的方法)抽取10个班级，然后由这10个班级的全部学生(300名)构成样本。采取整群抽样的方法，不仅可以简化抽样的过程，更重要的是它可以降低收集资料的费用，同时还能相对地扩大抽样的应用范围。在简单随机抽样和系统抽样中，都要求有一份总体所有成员的名单，即抽样框。但在实际过程中，这样的名单往往难以获得。有时即使可以获得，真正运用起来也十分麻烦，因此，上述两种抽样方法的应用范围受到一定限制。例如，要在一个有10万户家庭的城市中抽取1 000户家庭进行调查，若按上述两种方法，就必须首先弄到一份这10万户家庭的排列名单。而在实际中，这样的名单往往是很难弄到的。这时，如果采用整群抽样的方法，就可以省去这种麻烦，使抽样变得简单易行。比如说，我们可以按居民委员会来编制抽样框，假设全市共有200个居委会，每个居委会有500户左右的家庭，那么我们只需弄到一份200个居委会的名单，并按上述两种方法之一，从中抽取两个居委会，然后将这两个被抽中的居委会中的所有家庭户作为我们的样本就行了。从这一事例中，我们不难看出整群抽样所具有的优点。许多较大规模的社会研究往往从节省经费、人力以及从研究的可行性等方面考虑，而采用整群抽样的方法。例如，20世纪80 年代中期由中国社会科学院社会学所等单位组织进行的《五城市婚姻家庭调查》，就是采用这种整群抽样的方法，从五个城市中抽取了八个居民点，以这八个居民点所包括的总共4 385户家庭作为样本进行的。但是，应该看到，整群抽样所具有的简便易行、节省费用的优点，是以其样本的分布面不广、样本对总体的代表性相对较差等缺点为代价的。由于整群抽样所得样本中的个体相对集中，而涉及的面相对缩小，故在许多情况下会导致样本的代表性不足，使得结果的偏差较大。拿上面的例子来说，由200个居委会中任何两个居委会所包含的1 000户家庭，显然受着具体的地理、职业等社区条件和环境的限制，往往难以体现出整个城市的不同地段、不同职业区、不同生活区居民家庭的特点。这1 000户家庭对全市家庭的代表性，比起用简单随机抽样或者系统抽样和分层抽样的方法抽取的1 000户家庭来说，显然要差一些。为了更好地理解整群抽样的特点，我们可以将整群抽样与前述几种抽样方法，特别是分层抽样方法作些比较。假设我们的总体是全国所有城市的集合，我们要抽取一个规模为40个城市的样本。若按简单随机抽样或系统抽样的方法，则首先需要弄到一份全国城市的名单，然后根据随机数表或通过计算抽样间距，直接从抽样框中抽取城市；若按分层抽样的方法，则可以先按城市规模将总体分为特大城市、大城市、中等城市和小城市四类，然后分别从每一类中抽取若干城市，并将这些城市合起来构成样本；而如果采用整群抽样的方法，则可以省(自治区、直辖市)为抽样单位，从全国31个省(自治区、直辖市)中随机抽取三至五个省(自治区、直辖市)，再以所抽中的这些省(自治区、直辖市)中所包含的全部城市的集合作为样本。整群抽样方法的运用，尤其要与分层抽样的方法相区别。当某个总体是由若干个有着自然界限和区分的子群(或类别、层次)所组成，同时，不同子群相互之间差别很大、而每个子群内部的差异不大时，则适合于分层抽样的方法；反之，当不同子群相互之间差别不大、而每个子群内部的异质性程度比较大时，则特别适合于采用整群抽样的方法。。在社会研究中，当总体的规模特别大，或者总体分布的范围特别广时，研究者一般采取多段抽样的方法来抽取样本。多段抽样的具体做法是：先从总体中随机抽取若干大群(组)，然后再从这几个大群(组)内抽取几个小群(组)，这样一层层抽下来，直至抽到最基本的抽样元素为止。比如，为了调查某市青年工人的状况，需要从全市青年工人这一总体中抽取样本。我们可以把抽样过程分为下述几个阶段进行。首先，以企业为单位抽样,即以全市所有企业为抽样框，从中随机抽取一部分企业；然后在抽中的企业里，以车间为抽样单位抽样，即从全部车间中抽取若干个车间；最后，再在抽中的车间内抽取青年工人。需要说明的是，在上述每个阶段的抽样中，都要采用简单随机抽样或等距抽样或分层抽样的方法进行。在运用多段抽样方法时，有一点需要注意，就是要在类别和个体之间保持平衡。或者说，保持合适的比例。举例来说，假设某市共有3万名教师，他们分布在全市10个区的300所学校中。现在要抽取一个由1 200 名教师组成的样本。如果按照三阶段抽样的方法，我们就可以有下列各种不同的抽样选择(见表6—3)。表6—3 究竟该选择哪一种抽样方案呢?或者说，如何确定每一阶段抽样的单位数目呢?主要考虑的因素有两方面： (1)各个抽样阶段中的子总体同质性程度。同质性程度越高的子总体，所抽的规模就应相对小一点；反之，则应大一点。比如，如果该市的10个区中，属于不同的区的学校相互之间差别很大，那么就应该加大第一阶段的抽样规模(即应采取方案1)。如果区与区之间的学校在总体上差别不大，而每一个区中，不同的学校相互之间却差别很大，那么就应该减小第一阶段的抽样规模，加大第二阶段的抽样规模(即应采取方案2)。如果区与区之间、学校与学校之间的差别都不大，倒是每所学校中教师与教师之间的差别很大，那么我们就应该尽量加大第三阶段的抽样规模，而相应地减小第一和第二阶段的抽样规模(比如采取方案8或方案9)。 (2)要考虑研究者所拥有的人力和经费。从方案3至方案9，我们来看一下样本所覆盖的区和学校面：所覆盖的区是方案3最大(所有的区)，依次减小，方案9最小(仅一个区)；所覆盖的学校数目也是从方案3至方案9依次减小(分别为200、120、60、40、30、20、20)。一般来说，在其他条件不变的情况下，样本所覆盖的面越大，样本的代表性也越大。因此，如果仅从这方面考虑，则“大的类别中抽取单元相对较多，而每一单元中抽取个体相对较少”的做法效果较好 (即方案3最好，依次递减，方案9最差)。但是，抽样时我们还应从实践的角度来进行衡量。抽的区越多、抽的学校越多，同时也意味着收集资料时，调查员要奔波的范围越广，所需要的时间、经费越多。而这则是研究者往往最不愿意看到的。所以，如果从这方面来考虑，则“大的类别中相对较少，而每一类中抽取的个体相对较多”的做法效果较好(即方案9最好，依次递减，方案3最差)。多段抽样的方法适用于总体范围特别大、对象的层次特别多的社会研究。由于它不需要总体的全部名单，各阶段的抽样单位数一般较少，因而抽样比较容易进行。但由于每级抽样时都会产生误差，故这种抽样方法的误差较大，这是它的主要不足。在同等条件下减少多段抽样误差的方法是：相对增加开头阶段的样本数而适当减少最后阶段的样本数。所以，当研究者的人力和经费允许时，应尽量扩大开头阶段的抽样规模。对于上例来说，就是要尽可能像方案3、方案4、方案5那样去设计。当研究者以家庭作为分析单位，以入户访谈的方法收集资料，试图研究城乡家庭的结构、关系、生活方式或其他内容时，他们往往采用多段抽样的方法从某一市中抽取区 (县)，再从区(县)中抽取街(乡镇)，从街(村) 中抽取居委会(村)，然后从居委会(村)中抽取家庭户，最后从家庭户中抽取一位成年人作为访谈对象。从这些访谈对象那里得到的有关其家庭的资料被用来描述这些家庭的特征和类型。在这种研究中，我们不仅需要抽出家庭户的样本，同时还要进行。在抽取家庭中的成年人之前的每个抽样阶段中，我们可以采用前面所介绍的某种方法来抽。而这最后一个阶段的抽样则可以采取一种被称做“Kish选择法”的方式进行。根据这种方法，每户家庭中所有的成年人(比如说18岁以上者)都具有同等的被选中的概率(机会)。 Kish方法的具体做法是：研究者先将调查表分为(编号为)A、E1、B2、C、D、E1、E2、F八种，每种表的数目分别占调查表总数的1/6、1/12、1/12, 1/6、1/6、1/12、1/12、1/6。同时，印制若干套(一套八种)“选择卡”发给调查员，每人一套。“选择卡”的形式如表6—4。表6—4 Kish选择表调查员首先要对每户家庭中的成年人进行排序和编号，排序的方法是男性在前，女性在后；年纪大的在前，年纪小的在后，即最年长的男性排第一，次年长的男性排第二，以此类推；最年长的女性排在最年幼的男性后面，其他女性也按年纪从大到小接着排列，如表6—5。表6—5 家庭内成年人排序表然后，调查员按照调查表上的编号找出编号相同的那种“选择表”，根据家庭人口数目从“选择表”中查出该选个体的序号，最后对这一序号所对应的那个家庭成员进行访谈。比如，某家庭18岁以上的成年人共有四人：祖母、父亲、母亲、儿子。其排序则为：1．父亲；2．儿子；3．祖母；4．母亲。若调查表为A类，则抽取父亲；若调查表为B2类，则抽取儿子；若调查表为D类，则应抽取祖母；而调查表为F类时，则抽取母亲。按这种方法抽取被访对象的另一个好处是，它不仅可以使研究者收集到样本家庭的资料，同时也可以收集到由这些被访者所构成的个人样本的资料，这种资料可以用来描述这一地区所有成年人所构成的总体。因为由按这种方法抽出来的人所组成的样本，在年龄、性别、文化程度等方面的分布与总体的分布往往十分接近。在实际调查中，研究者也经常采用一种十分简便的户内随机抽人的方法——生日法。这种方法的具体操作步骤是：首先，随机确定一年中的某一天为标准日期，为便于计算，通常抽取每个月的第一天，比如说6月 1日，或者7月1日等等。第二步，与Kish 方法相似，需要了解所抽中的户中18岁以上的人口数，以及每人的生日是几月几号。第三步，计算出每人的生日距离标准日期的天数。第四步，从中选出生日距离标准日期最近的人作为调查对象。比如，一项调查确定的标准日期是8月1日，所抽中的某户家庭共有5口人，老年夫妇两人，青年夫妇两人，一个上小学的儿童。那么，就询问4个成年人的生日。假设分别为老头子2月9日、老太太9月27日、年轻丈夫6月18日、年轻妻子5月6日。那么，四人的生日距离标准日期的时间分别为172天、57天、43天、86天。因此，就应该抽取年轻丈夫作为调查对象。由于每一户家庭中人们出生的日期是随机分布的，标准日期也是随机确定的，因而这种按生日抽取个人的方法也具有随机性。其所抽取的个人样本也能够用来推断总体的情况。多段抽样中，其实暗含了一个假定：即每一个阶段抽样时，其元素的规模是相同的。比如第一阶段抽取街道时，暗含了每个街道规模相同。第二阶段从街道抽取居委会时，也是暗含了每个居委会的规模相同。在这样的假定下，采取前述几种随机抽样的方法，最终每户居民被抽中的概率相等。但现在的问题是，现实生活中，不仅每一个街道包含的居委户数不同，而且每一个居委会中所包含的居民户数也不同。因而按照上述多段抽样的方法来抽取样本时，最终每户居民被抽中的概率实际上是不同的。为了简单说明这种情况，我们以两阶段抽样为例。第一阶段从全市所有居委会中抽一部分居委会，第二阶段再从抽中的居委会中抽取一部分居民。假设一个城市有100 000户居民，分属200个居委会。如果要从总体中抽取1 000户居民构成样本，我们可能会先从200个居委会中随机抽取20个居委会(这里暗含了每个居委会规模一样大)；然后，在所抽取的20个居委会中，每个居委会随机抽取50户居民。这样，我们总共抽到1 000户居民。当居委会的规模大小不一时，情况就发生变化。比如说，甲居委会比较大，有800户居民，乙居委会比较小，只有200户居民。那么，当它们在第一阶段都被抽中后，第二阶段分别从它们中抽取50户居民。此时，甲居委会中居民户被抽中的概率为 (20/200)X(50/800)＝1/160。而乙居委会中居民户被抽中的概率则为 (20/200)X(50/200)＝1/40。乙居委会中居民户被抽中的概率是甲居委会中居民户的四倍。再比如要从全市100家企业、总共20万名职工中，抽取l 000名职工进行调查。我们采取多段抽样的方法，先从100家企业中随机抽取若干家企业，比如说抽取20家；然后再从这20家企业中分别抽取50名职工(50×20＝1 000)构成样本。需要注意的是，这100家企业的规模是不同的：最大的企业多达16 000名职工，而最小的企业则只有 200名职工。如果这样的两个企业都选人第一阶段的样本(即都进入20家企业的样本)，那么它们在第一阶段的人选概率是相同的，即都为20／100＝20％；但第二阶段从每家企业中抽取职工时，这两家企业中每个职工被抽中的概率却大不一样：前者的概率为50／16 000＝0．312 5％，而后者的概率则为 50／200＝25％。这样，规模大的企业中每个职工被抽中的概率则为20％×0．312 5％＝0．062 5％；而规模小的企业中每个职工被抽中的概率为20％×25％＝5％；规模大的企业中的职工相对于规模小的企业中的职工来说，他们被抽中的概率要小得多(后者是前者的80倍)。在社会研究中，有一种常用的不等概率抽样方法，叫做，简称PPS抽样。PPS 抽样的方法正是为了解决上述问题而设计的。其原理可以通俗地理解成以阶段性的 (或暂时的)不等概率换取最终的、总体的等概率。其做法是：正是通过这样两个阶段上的不等概率抽样，使得总体中的每一个元素最终都具有同样的被抽中的概率。其实质是：我们还可以用下列公式来说明PPS抽样的这种原理：每一个元素被抽中的概率=所抽取的群数 ×（群的规模/总体的规模）×（平均每个群中所要抽取的元素/群的规模）比如，前述例子中甲居委会包含800户居民，那么，它在第一阶段被抽中的概率是： 800/100000=1/125 在第二阶段，这个群中每一户居民被抽中的概率是： 50/800=1/16 那么，这个居委会中每一户居民最终的被抽中的概率是： 20（所选择的居委会数目）×（1/125）×（1/16）=1/100 而乙居委会比较小，只有200户居民，那么它在第一阶段被抽中的概率是： 200/100000=1/500 在第二阶段，这个群中每一户居民被抽中的概率是： 50/200=1/4 那么，乙居委会中每一户居民最终的被抽中的概率是： 20（所选择的居委会数目）×（1/500） ×（1/4）=1/100 这里我们可以看到，无论一个居委会的规模是大是小，每一户居民始终都具有同样大的被抽中的概率。读者也可以用同样的方法计算一下前面第二个例子的结果。其实，从上述公式中也可以看到，PPS抽样的做法已经排除了群的规模这一因素的影响——第一个分子与第二个分母相互约掉了——每一个元素的被选概率变成了所抽取的群数乘以从每个群中所抽取的元素数目，再除以总体的规模。这实际上就是样本规模除以总体规模。 PPS抽样的方法可以扩展到多阶段的情形，只要在中间的每气个阶段都同样依据概率与规模成比例的原则，除了最后一个阶段以外。比如，下面是以先抽街道、再抽居委会、最后抽居民户的三阶段抽样为例的公式： PPS的具体操作方法，我们可以用前面例 2来说明。先将各个元素(即企业)排列起来，然后写出它们的规模、计算它们的规模在总体规模中所占的比例将它们的比例累计起来，并根据比例的累计数依次写出每一元素所对应的选择号码范围(该范围的大小等于元素规模所占的比例，见表6—6中第一、二、三、四列)，然后采用随机数表的方法或系统抽样的方法选择号码，号码所对应的元素人选第一阶段样本(见表6—6第五、六列)。最后再从所选样本中进行第二阶段抽样(即从每个被抽中的元素中抽取50名职52)。由于规模大的企业其所对应的选择号码范围也大，而选择号码范围大时，被抽中的概率也大(有些特别大的企业还可能抽到不止一个号码，比如企业3就抽到两个号码，那么在第二阶段抽样中，就要从企业3中抽取50×2＝100名职工)。由于规模大的企业在第一阶段抽样时被抽中的概率大于规模小的企业，这样就补偿了第二阶段抽样时规模大的企业中每个职工被抽中的概率小的情况，使得无论规模大还是规模小的企业中，每个职工总的被抽中的概率都是相等的。所以，这种方法最终抽出的样本对总体的代表性也大。当然从实践上看，由于PPS抽样需要知道每一个群的规模，所以做起来并不十分容易。如果我们无法知道每一个街道的居民户数以及每一个居委会的居民户数，或者无法得到总体中所有企业各自的职工人数，我们就无法运用PPS抽样。在社会研究中，人们有时还采用非概率抽样的办法来选取样本。非概率抽样不是按照概率均等的原则，而是根据人们的主观经验或其他条件来抽取样本。因而，其样本的代表性往往较小，误差有时相当大，而且这种误差又无法估计。所以，在大规模的正式研究中，一般很少用非概率抽样，常常只是在探索性研究中采用；常用的非概率抽样有以下几种。一、偶遇抽样。如为了调查某市的交通情况，研究者到离他们最近的公共汽车站，把当时正在那里等车的人选作调查对象；其他类似的偶遇抽样还有：在街头路口拦住过往行人进行调查；在图书馆阅览室对当时正在阅览的读者进行调查；在商店门口、展览大厅、电影院等公共场所向进出往来的顾客、观众进行的调查；利用报刊杂志向读者进行的调查；老师以他所教的班级的学生作为样本所进行的调查等等。这种碰到谁就选谁的抽样方法往往被有些人误认为就是随机抽样。仅从表面上看，二者的确有些相似，都排除了主观因素的影响，纯粹依靠客观机遇来抽取对象。但二者有一个根本的差别，这就是偶遇抽样没有保证总体中的每一个成员都具有同等的被抽中的概率。那些最先被碰到的、最容易见到的、最方便找到的对象具有比其他对象大得多的机会被抽中。正是这一点使我们不能依赖偶遇抽样得到的样本来推论总体。。这种抽样首先要确定抽样标准。由于标准的确定带有较大的主观性，所以，此法的运用结果如何往往与研究者的理论修养、实际经验以及对对象的熟悉程度有很大关系。判断抽样的主要优点在于可以充分发挥研究人员的主观能动作用，特别是当研究者对研究总体的情况比较熟悉、研究者的分析判断能力较强、研究方法与技术十分熟练、研究的经验比较丰富时，采用这种方法往往十分方便。但是由于它仍然属于一种非概率抽样，所以，其所得样本的代表性往往难以判断。在实际中，这种抽样多用于总体规模小、所涉及的范围较窄或时间、人力等条件有限而难以进行大规模抽样的情况。。进行定额抽样时，研究者要尽可能地依据那些有可能影响研究变量的因素来对总体分层，并找出具有各种不同特征的成员在总体中所占的比例。然后依据这种划分以及各类成员的比例去选择对象，使样本中的成员在上述各种因素、各种特征方面的构成及其在样本中的比例都尽量接近总体。如果把各种因素或各种特征看作不同的变数的话，那么，定额抽样实际上就是依据这些变数的组合。下面，我们以性别、年级和专业三个因素来解释这种变数的组合及其定额抽样的实施办法。假设某高校有4 000名学生，其中男生占60％，女生占40%；文科学生和理科学生各占50％；一年级学生占40％、二年级、三年级、四年级学生分别占30％、20％和10％。现在要用定额抽样方法依上述三个变数抽取一个规模为100人的样本。依据总体的构成和样本规模，我们可得到下列定额表(见表6—7)。表6-7 100个人的定额样本分布表表6—7的最下面一行就是样本中具有各种特征的学生数目。这一数目是依据总体中的结构分配的，它使得样本在这几个方面与总体保持了一致。可以想象，如果所依据的类似特征(即变数)越多，样本中成员的分类也将越细，与总体的结构也将越接近。同时我们也可以看出，每增加一个分类特征，这种分布就会复杂一层，抽样就会困难一步。因此，研究者应根据研究的主要目标来进行配额抽样。。此时的抽样标准不是代表性，而是合适性——抽样适合研究的目标，适合检验理论和假设的需要，适合比较的需要。英克尔斯在研究人的现代性时，就是根据合适性的原则，采用了配额抽样，而没有采用随机抽样。他写道：“我们没有寻找代表性的样本，而是寻找非常适合于目标的配额样本，个人与群体之所以被选入样本，是因为它们同我们要检验的理论有关„„” 英克尔斯的抽样设计如图6—8所示。就是他们对作为调查点的六个国家的选择，也是基于类似的考虑。“这些国家之所以使我们感兴趣，不是因为它们代表所有其他的国家，而是因为它们的人民符合我们的实验设计中的那些条件。” 图6-8 现代人研究抽样示意图许多书中都谈到定额抽样与后面将介绍的分层抽样十分相似，或把定额抽样称为分层抽样在非概率抽样中的对应词。实际上，二者同样具有本质上的差别。二者虽然都依据某些特征对总体进行分层，但二者的目的不同，抽样方法也不同。定额抽样之所以分层分类，其目的在于要抽选出一个总体的“模拟物”，其方法则是通过主观的分析来确定和选择组成这种模拟物的成员。也就是说，定额抽样注重的是样本与总体在结构比例上的表面一致性。而分层抽样进行分层，一方面是要提高各层间的异质性与同层中的同质性，另一方面也是为了照顾到某些比例小的层次，使得所抽样本的代表性进一步提高，误差进一步减小。而其抽样的方法则是完全依据概率原则，排除主观因素，客观地、等概率地到各层中进行抽样，这与定额抽样中那种“按事先规定的条件，有目的地寻找”的做法是完全不同的。。当我们无法了解总体情况时，可以从总体中少数成员人手，对他们进行调查，向他们询问还知道哪些符合条件的人；再去找那些人并再询问他们知道的人。如同滚雪球一样，我们可以找到越来越多具有相同性质的群体成员。如果总体不大，有时用不了几次就会接近饱和状况，即后访问的人再介绍的都是已经访问过的人。例如，要研究退休老人的生活，可以清晨到公园去结识几位散步老人，再通过他们结识其朋友，不用很久，你就可以交上一大批老年朋友。但是这种方法的偏误也很大，那些不好活动、不爱去公园、不爱和别人交往、喜欢一个人在家里活动的老人，你就很难把雪球滚到他们那里去，而他们却代表着另外一种退休后的生活方式。。确定样本规模也是每一项具体的社会研究所必须解决的问题之一。统计学中通常以30为界，把样本分为大样本(30个个案及以上)和小样本(30个个案以下)。之所以这样区分，是因为当样本规模大于30时，无论总体的分布如何，其平均数的抽样分布将接近于正态分布。从而许多统计学的公式就可以运用，也可以用样本的资料对总体进行推论。但是，需要注意的是，30个个案的样本对于社会研究来说却常常是不够的。统计学中的大样本与社会研究中的大样本并不是一回事。根据一些社会研究专家的看法，社会研究中的样本规模至少不能少于100个个案。这是因为，在社会研究中，研究者不仅仅需要以样本整体为单位来计算平均数、标准差、相关系数等等统计量，同时，他们更经常地需要将样本中的个案按不同的指标划分为不同的类别，进而分析不同类别之间的差别，分析不同变量之间的关系。因此，要保证所划分出的每个子类别中都有一定数量的个案，就必须扩大整个样本的规模。比如，要计算某企业职工的平均收入，也许大于30 个个案的样本就可以了。但是，如果要进一步计算不同年龄的职工群体(青年工人、中年工人、老年工人)的平均收入，那么，30 个个案的样本显然就不能满足统计的需要了。如果将样本中的个案按性别和年龄进一步划分为“青年男性、中年男性、老年男性和青年女性、中年女性、老年女性”六类，再分别计算每一类个案中的平均数、标准差时，所需的样本规模就更要成倍地增加了。许多书中都给出了样本规模的计算公式。，例如，简单随机抽样中推论总体均值的样本规模计算公式为：其中，为置信度所对应的临界值；口为总体的标准差；f为抽样误差。而推论总体成数(或百分比)的样本规模计算公式为：其中，p为总体的成数或百分比；f含义同上。在上述计算公式中，由于置信度是事先确定的，所以其临界值可从标准正态分布表中查出，也是研究者根据需要先确定的，但是总体的标准差、成数或百分比却往往是难以得到的(它们通常是研究所需要求的)。因此，在实际抽样过程中，研究者往往无法直接运用上述公式计算所需的样本规模，而只能采取某种变通的办法。比如，利用前人所作的关于同一总体的普查或抽样调查资料，来计算或估计总体方差，由此得出推论总体均值的样本规模。在计算推论总体成数 (或百分比)的样本规模时，我们注意到，卢 (1一p)在p＝o．5时达到最大值。因此，即使我们对卢一无所知，也可以采取比较保险的办法，取卢＝o．5，这样，p(1一p)＝0．25＝1／4，上式变为：它可以保证样本规模足够大。表6—8就是根据上面的公式，在95％的置信度条件下(‘＝1．96) 计算出的不同抽样误差所对应的最小样本规模(表中为计算简便，取t＝2) 表6—8 95％置信水平下不同抽样误差所要求的样本规模表6—8依据的是简单随机抽样，对于实际采用的多阶段复杂抽样，要达到同样的精度，还需要乘上它的设计效应deft。根据经验，通常取设计效应为1．8或取2，当然也可以取2．5等。deft取得越大时，实际样本的规模也就越大。比如，表6—8中5％的抽样误差所要求的样本规模是400，而取设计效应为1．8时的实际样本规模则是400×1．8＝720，取设计效应为2时的实际样本规模就成了400×2＝800了。一般情况下，社会研究中样本规模的确定主要受到以下四个方面因素的影响：(1)总体的规模； (2)估计的把握性与精确性要求； (3)总体的异质性程度；(4)研究者所拥有的经费、人力和时间。样本规模与总体规模有关，这不难理解。按一般的想法，总体越大时，则样本也要越大，这样才能保证一定的精确度。但是，这种想法只在一定的程度上是正确的。当总体规模大到一定程度时，样本规模的增加与它并不保持同等的增长速度。图6—9表明，在其他有关因素一定时，样本规模的增加速度大大低于总体规模的增加速度。换句话说，当总体规模达到一定程度时，样本规模的改变量是很小的。图6—9 不同的总体规模所需要的样本量(相对于95％的置信度、土3％的置信区间和总体值以50％对50％的比例均分的假定而言) 抽样的目的往往是要从样本去推论总体。影响样本规模确定的第二个因素，就与这种推论的可靠性和精确性密切相关。在社会研究中，我们用置信度与置信区间这两个概念来说明样本规模与抽样的可靠性及精确性之间的关系。置信度又称为置信水平，它指的是总体参数值落在样本统计值某一区间的概率，或者说，总体参数值落在样本统计值某一区间中的把握性程度。它反映的是抽样的可靠性程度。比如，置信度为95％，指的是总体值落在样本值某一区间的概率为 95％，或者说，在对某一总体进行的同样形式的100次抽样中，总体值将有95次落在样本值周围的某一区间内。一般来说，在其他条件一定的情况下，置信度越高，即推论的把握性越大，则所要求的样本规模就越大。比如说，99％的置信度所要求的样本规模，就比95％的置信度所要求的样本规模要大。上面在探讨置信度时所说的“某一区间”，叫做置信区间。它是指在一定的置信度下，样本值与总体值之间的误差范围。它所反映的是抽样的精确性程度。范围越大，精确性程度越低；范围越小，精确性程度越高。在其他条件一定的情况下，置信区间越小，即样本值与总体值之间的误差范围越小，则所要求的样本规模就越大。比如，对一个总数为20 000的总体，置信度确定为95％时，若置信区间为土5％，则需要377个回答者；若置信区间为土4％，则需要583个回答者；而置信区间为?1％时，则需要6849个回答者。换句话说，此时的样本规模已相当于总体规模的1／3。总体的异质性程度对所需样本规模的影响也十分明显。总体中成员相互之间不存在差别时，只要了解其中之一就行了。这当然是极端的情况。一般来说，要达到同样的精确性，在同质程度高的总体中抽样时，所需要的样本规模就小一些；而在异质程度高的总体中抽样时，所需要的样本规模就大一些。其主要原因是，同质性越高，表明总体在各种变量上的分布越集中，波动性越小，同样规模的样本对总体的反映就越准确。而异质性程度越高，表明总体在各种变量上的分布越分散，波动性越大，同样规模的样本对总体的反映就会越差。比如，当总体中的个体在收入上的差别比较小，或者说分布比较集中时，所抽取的样本中人均收入值的随机波动就很小，因而抽样误差也就会很小。抽样的精度就会比较高。与总体异质性程度有关的另一个因素是，当总体中的大部分成员对某个问题的回答或选择与小部分成员的回答或选择不同时，比如70％的成员选择甲，30％的成员选择乙，则所需要的样本规模要小一些；而当选择两种不同回答的成员比例相差无几时，比如说选择甲、乙的比例都为50％左右，则所需要的样本规模为最大。表6—9反映的就是这种差别。表6-9 根据总体同质性程度和精确性要求所需要的样本规模除了以上几种因素外，研究者所拥有的经费、人力和时间，也对样本规模的大小产生影响。从样本的代表性、抽样的精确性考虑，则样本规模当然是越大越好；但抽样所得到的样本是要用来进行调查的。样本规模越大，同时也意味着所需要投入的人力、物力和时间越多，意味着所可能受到的限制和障碍也越多；因此，从抽样的可行性、简便性考虑，样本规模又是越小越好。究竟选择多大规模的样本，往往需要作出选择。而这种选择的一个重要砝码，就是研究者所拥有的经费、人力和时间。总之，样本规模的确定需要综合考虑各方面因素，没有一成不变的规定。考虑到初学者实践的需要，笔者在这里根据自己多年的观察与实践，将现实中各种调查的样本规模进行归类，提出下列常见样本规模的类别。对于从事各种不同的社会调查项目的读者来说，也可以参考这一标准来确定自己的样本规模：小型调查类，样本规模在100～300之间；中型调查类，样本规模在300～1 000 之间；大型调查类，样本规模在1 000～3 000 之间。小型调查类的样本规模通常用于非正式的或要求不高的、总体规模较小的情况。比如，大学生上调查方法课需要做调查实践时，或者硕士研究生采用调查方法收集论文资料时，或者在一所中学作调查时。正式的调查研究一般要达到中型调查类的样本规模。这也是目前实践中采用最多的一类样本规模。在一般情况下，它兼顾到了样本的误差大小，研究者的人力、财力、时间，以及调查的组织和实施等多方面因素。而大型调查的样本规模则主要用于全国性的调查项目中。当然，这种归纳和划分只是笔者个人的看法，并且只是对于一般情况而言。如果调查项目十分特殊，那么就另当别论了。它是由于抽样本身的随机性所引起的误差。无论采取什么样的抽样方式，这种误；差都是不可避免的。但是，在另一方面，抽样误差的大小是可以在样本设计中事先进行控制的。除了抽样误差以外，社会研究中还存在另一种误差，即度量误差，它是指在记录、填答、汇总等工作中所出现的误差。抽样误差主要取决于总体的分布方差和抽样规模，这两个因素都可以导致抽样误差的增加或降低。当样本规模增加时，样本统计量的随机波动程度就会降低，从而使抽样误差也降低。在简单随机抽样中，人们正是以扩大样本规模的方式来达到降低抽样误差的目的的。而分层抽样则是着眼于缩小总体的异质性程度或分布的方差，即通过将总体划分为不同的类别或层次，既使得这些不同类别或层次在样本中都有代表，又使得抽样误差中不存在层间变差成分，而只存在层内变差成分，其效果相当于降低了总体分布的方差，从而降低了样本统计量的随机波动程度，提高了样本统计量估计总体参数的精确度。有关抽样规模与抽样误差之间的关系问题，我们还应该注意两点： (1)对于比较小的样本来说，样本规模上的很小的一点增加，便会带来精确性方面很明显的增加。比如，在前面表6—8中，当样本规模从100增加到156时(仅仅增加了56个个案)，抽样误差就由10％下降到8％。 (2)而对于比较大的样本来说，同样增加这么多个个案，却收效甚微。比如，要使抽样误差从2％下降到1．5％，则需要增加2 000个个案。因此，许多公司通常将他们的样本规模限制在2 000之内，因为当样本规模超过了这一点时，花费在所增加的样本规模上的人力、物力，相对于增加估计的精确性来说，就有些得不偿失。

                    本文档为【《社会调查研究方法》 第六章 抽样】，请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑，
                    图片更改请在作品中右键图片并更换，文字修改请直接点击文字进行修改，也可以新增和删除文档中的内容。 
 该文档来自用户分享，如有侵权行为请发邮件ishare@vip.sina.com联系网站客服，我们会及时删除。

                    [版权声明] 本站所有资料为用户分享产生，若发现您的权利被侵害，请联系客服邮件isharekefu@iask.cn，我们尽快处理。

                    本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用。

                    网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
                

下载需要：免费已有0 人下载

立即下载

《社会调查研究方法》 第六章 抽样

你可能还喜欢

《社会调查研究方法》第六章抽样