南京大学现代社会调查方法第四章 抽样笔记

发布时间:2016-05-25 10:05 分类:初试经验

一、抽样的意义和作用

总体:总体通常与构成他的元素共同定义,总体是构成他的所有元素的集合,而元素则是构成整体的最基本单位。

样本:样本就是从总体中按一定方式抽取出的一部分元素的集合。

抽样:所谓抽样,指的是从主城某个总体的所有元素的集合中,按一定的方式选择或抽取一部分元素(总体的一个子集)的过程,或者说,抽样时从总体中按一定方式选择或抽取样本的过程。

抽样单位:抽样单位就是一次直接的抽样所使用的基本单位。

抽样框:抽样框又称作抽样范围,指的是一次直接抽样是总体中所有元素的名单。

参数值:参数值也称为总体值,它是关于总体中某一变量的综合描述,或者说是总体中所有元素的某种特征的综合数量表现。

统计值:统计值也称为样本值,它是关于样本中某一变量的综合描述,或者说是样本中所有元素的某种特征的综合数量表现。

置信水平:置信水平又称为置信度,它指的是总体参数值落在样本统计值某一区间内的概率,或者说,是总体参数值落在样本统计值某一区间中的把握程度。

置信区间:它是指在一定的置信水平下,样本统计值与总体参数值之间的误差范围。置信区间反映的是抽样的精确性程度。置信区间越大,及抽样范围越大,抽样的精确性程度就越低;反之,置信区间越小,即误差范围越小,抽样的精确性程度就越高。

抽样的作用:在社会调查中,抽样主要解决的是调查对象的选取问题,及如何从总体中选出一部分对象作为总体的代表的问题。可以说没抽样方法施加在研究者十分有限的人力财力和时间与庞杂广泛纷繁多变的社会现象之间的一架桥梁。有了他的帮助,研究者可以方便的从较小的部分达到很大的整体。

抽样的类型:         

概率抽样:简单随机抽样、系统抽样、分层抽样、整群抽样、多段抽样

非概率抽样:偶遇抽样、判断抽样、定额抽样、雪球抽样

简单随机抽样:又称纯随机抽样,是概率抽样的最基本形式.它是按等概率原则直接从含有N个元素的总体中抽取n个元素组成的样本(N›n)。利用随机数表进行抽样的具体步骤:

①先取得一份调查总体所有元素的名单(即抽样框)

②将总体中所有元素一一按顺序编号

③根据总体规模是几位数来确定随机数表中选几位数码

④以总体的规模为标准,对随机数表中的数码逐一进行衡量并决定取舍

⑤根据样本规模的要求选择出足够的数码个数

⑥依据从随机数表选出的数码,到抽样框中去找出它所对应的元素

系统抽样:又称等距抽样或间隔抽样。它是把总体的元素进行编号排序后,再计算出某种间隔抽取元素来组成样本的方法。具体步骤略。

要注意的两种情况:仪式在总体的名单中,元素的排列具有某种次序上的先后、等级上的高低的情况。二是在总体名单中,元素的排列上有与抽样间隔相对应的周期性分布。

分层抽样:又称类型抽样,它是先将总体中的所有元素按某种特征或标志(如性别年龄职业地域等)划分成若干类型和层次,然后再在各个类型或层次中采用简单随机抽样或系统抽样的方法抽取一个子样本,最后将这些子样本合起来构成总体的样本。

分层抽样的优点:一是在不增加样本规模的前提下降低抽样误差,提高抽样的精度。二是非常便于了解中体内不同层次的情况,便于对总体中不同的层次或类别进行单独研究,或者进行比较。

实际分层抽样过程中要考虑的两方面问题:

一是分层的标准问题:①以调查所要分析和研究的主要变量或相关的变量作为分层的标准

②以保证各层内部同质性强和各层之间异质性强、推出总体内在结构的变量作为分层变量③以那些已有明显层次区分的变量作为分层变量。

二是分层的比例问题:按比例分层和不按比例分层

整群抽样:是从总体中随机抽取一些小的群体,然后有所抽出的若干小群体内的所有元素构成调查的样本的方法。

优点:不仅可以简化抽样的过程,更重要的是他可以降低收集资料的费用,同时还能相对的扩大抽样的应用范围。

缺点:整群抽样所具有的简便易行、节省费用的优点是以其样本分布面不广、样本相对总体的代表性相对较差等缺点为代价的。

整群抽样与分层抽样的区别:当某个个体是由若干个有着自然界限和区分的子集(或类别、层次)所组成,同时不同子群相互之间差别很大、而每个子群内部又相差不大的时候,则是和分层抽样的方法;反之,当不同子群相互之间差别不大、而每个字群内不得异质性程度比较大的时候,则特别适合采用整群抽样的方法。

多段抽样:又称多级抽样或分段抽样,它是按抽样元素的隶属关系或层次关系,把抽样过程分成几个阶段进行。具体的做法是:先从总体中随机抽取若干大群,然后再在这几个大群内抽取几个小群,这样一层层抽下来,知道抽到最基本的抽样单元为止。

使用多段抽样时要注意在类别和个体之间保持平衡。在确定每一级的抽样单位数目的时候,要特别注意下面三个因素:①各个抽样阶段中的子总体同质性程度②各层子总体的人数③研究者所拥有的人力和经费

多段抽样的优缺点:多段抽样适用于范围大、总体对象多的社会调查。由于它不需要总体的全部名单,各阶段抽样单位数一般较少,因而抽样比较容易就进行。但由于每级抽样时都会产生误差,股这种抽样方法的误差较大,这是他的主要不足。在同等条件下减少多段抽样误差的方法是:相对增加开头阶段的样本数而适当减少最后阶段的样本数。

PPS抽样:在社会调查中有一种不等概率抽样方法,叫做“概率与元素的规模大小成比例的抽样(sampling with probability proportional to size),简称PPS抽样。其做法是在第一阶段,每个群按其规模被给予大小不等的抽取概率。但到了第二个阶段,从每个抽中的群中抽取同样多的元素。

户内抽样:从所抽中的每户家庭中抽取一个成年人,以构成访谈对象的样本。(Kish选择法)

偶遇抽样:又称方便抽样或自然抽样,是指研究者根据现实情况,以自己方便的形式抽取偶然遇到的人作为调查对象,或者仅仅选择那些离得最近的、最容易找到的人作为调查对象。。他与随机抽样有本质区别,即没有保证总体中的每一个成员具有同等的被抽中的概率。

判断抽样:又称立意抽样。它是调查者根据研究的目标和自己的主观分析来选择和确定调查对象的方法。它的优点是可以充分发挥研究人员的主观能动作用,特别是当研究者对研究的总体情况比较熟悉,研究者的判断能力较强、研究方法和技术十分熟练、研究的经验比较丰富时,采用这种方法往往十分方便。缺点是,是一种非概率抽样,所得样本的代表性难以判断。在实际调查中这种抽样多用于总体规模小、调查所设计的范围较窄或调查的时间人力等条件有限而难以进行大规模抽样的情况。

定额抽样:又称配额抽样,它是一种比偶遇抽样复杂一些的非概率抽样方法。当进行定额抽样时,研究者要尽可能的依据那些有可能影响变量的各种因素对总体分类,并找出具有各种不同特征的成员在总体中所占的比例,然后根据这种划分以及各类成员的比例,采用偶遇抽样或判断抽样的方法选择调查对象,使样本中的成员在上述因素、各种特征方面的构成和样本的比例尽量接近总体情形。

不足之处:一方面研究者总是只能对少数几个方面控制的特征进行分类和定额而无法对许多同样影响着、体现着总体特征的其他因素进行分类和定额。因而,定额抽样所得到的样本有可能严重偏离总体。另一方面,有预定了抽样中调查员可以在保证各种类型定额的情况下选取自己方便获得的调查对象,这种自由度很大的选择方式同样极易造成样本和总体之间的偏差。

定额抽样与分层抽样的区别:二者虽然都根据某些特征对总体进行分层和分类,但抽样方法不同。定额抽样是通过主观的分析或依据方便性来确定和选择组成这种模拟物的成员,也就是说,定额抽样注重的是样本与总体在结构比例上的表面一致性。而分层抽样的方法则是完全依据概率原则,排除主观因素,客观地等概率的在各层中进行抽样。这与定额抽样中那种按事先规定的条件,采用偶遇方式和主观判断方式来寻找的做法完全不同。

雪球抽样:

五、样本抽样与抽样误差

样本规模:又称样本容量,它指的是样本中所含个案的多少。

样本规模的计算公式:

推论总体百分比的样本规模计算公式为

即:

影响样本规模确定的因素:①总体的规模②估计的把握性和精确性的要求(置信水平和置信区间)③总体的异质性程度④调查者所拥有的经费、人力和时间

抽样误差:就是样本的统计值与总体的参数值之间的误差。它是由于抽样本身的随机性所引起的误差

非抽样误差:即度量误差,它是指在调查、记录、填答、汇总等工作中所出现的误差。

抽样误差主要取决于总体的分布方差和抽样规模。

抽样规模和抽样误差之间的关系:第一对于比较小的样本来说,样本规模很小的增加,便会带来精确性方面的显著增加。第二,扩大样本规模虽然可以减少抽样误差,但同时它又会增加非抽样误差。所以,并非样本越大调查结果就肯定会越精确。

成功学员

Successful students
  • 王庆杰中国人民大学
  • 何娟南京大学
  • 吴文聪中国政法大学
  • 李佑哲中央音乐学院
  • 王振清华大学
  • 伍厚至清华大学