
第2章 数据的搜集
一、单项选择题
1.为了解大学生的消费状况,调查员在食堂门口任意拦截100名学生进行了问卷调查。关于这种调查方式,以下说法正确的是( )。[中央财经大学2015研]
A.这是分层抽样
B.这是方便抽样
C.这是简单随机抽样
D.这是配额抽样
【答案】B
【解析】方便抽样是调查过程中由调查员依据方便的原则,自行确定入样的单位的非概率抽样方法。例如,调查员在街头、公园、商店等公共场所进行拦截式的调查;厂家在出售产品的柜台前对路过的顾客进行调查,等等。
2.在检验人的血压与年龄之间是否有某种近似的线性关系时,对0~20,20~30,30~40,40~50,50~60及60岁以上的人进行随机抽样检测,该抽样方法属于( )。[武汉大学2015研]
A.简单抽样
B.分层抽样
C.系统抽样
D.整群抽样
【答案】B
【解析】分层抽样是将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本,再将各层的样本结合起来,对总体的目标量进行估计的抽样方法。题中,将人按年龄分层后进行随机抽样检测,该抽样方法属于分层抽样。
3.一项全国范围的大型抽样调查,拟从全国31个省市自治区中分别随机抽取1000人构成样本,这样抽样组织形式称为( )[浙江工商大学2014研]
A.简单随机抽样
B.两阶段抽样
C.整群抽样
D.分层抽样
【答案】D
【解析】分层抽样是将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本。在该题的抽样调查中,全国31个省市自治区为不同的层,从不同的层中随机抽取样本,因此这种抽样组织形式为分层抽样。
4.利用非概率抽样得到的样本( )[浙江工商大学2014研]
A.不能对总体数量特征作出评估
B.抽样误差可以计算
C.可以对总体数量特征作出具有一定可靠程度的估计
D.是根据主观判断或根据便利性原则抽取样本单位
【答案】A
【解析】非概率抽样是指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。因为非概率抽样不是依据随机原则抽选样本,样本统计量的分布是不确定的,因而无法使用样本的结果对总体相应的参数进行推断,无法计算抽样误差,不能对总体数量特征作出具有一定可靠程度的估计。
5.在一项化妆品市场调查中,考虑到男女性别对化妆品的要求有所不同,抽样时分别从男性和女性消费者中独立地随机抽取相同比例的人数作样本,这种抽样方式是( )。[中央财经大学2014研]
A.简单随机抽样
B.分层抽样
C.系统抽样
D.整群抽样
【答案】B
【解析】分层抽样是先将总体的单位按某种特征分为若干级次层,然后再从每一层内进行单纯随机抽样,组成一个样本。调查中先将总体按性别分为两层,再从这两层内独立随机抽取,为分层抽样。
6.以下关于抽样误差的说法错误的是( )。[中央财经大学2014研]
A.其它条件相同时,总体的差异程度越大,抽样误差就越大
B.其它条件相同时,样本容量越大,抽样误差越小
C.不重复抽样中的抽样误差要大于重复抽样
D.在非概率抽样中无法对抽样误差进行控制
【答案】C
【解析】影响抽样误差大小的因素主要有:①总体单位标志值的差异程度;②样本单位数的多少;③抽样方法;④抽样调查的组织形式。重复抽样比不重复抽样误差要大些。
7.我国最近完成的经济普查属于( )。[中央财经大学2014研]
A.抽样调查
B.经常性调查
C.统计报表制度
D.全面调查
【答案】D
【解析】经济普查是国家为掌握国民经济第二产业、第三产业的发展规模、结构、效益等信息,按照统一的方法、统一标准、统一时间、统一组织对工业、建筑业、第三产业的所有单位和个体经营户进行的一次性全面调查。
8.在整群抽样中,各群间为抽样调查,群内为全面调查,故影响抽样平均误差的是( )。[四川大学2013研]
A.群间方差
B.群内方差
C.总体方差
D.协方差
【答案】A
【解析】在整群抽样时,总体方差分为群内方差和群间方差两部分,由于在总体各群间进行随机抽样,使得抽样平均误差由群间方差的大小来决定,对被抽中的群进行全面调查所以不存在抽样误差即群内方差不影响抽样误差。
9.以下关于抽样误差的说法错误的是( )。[华东师范大学2013研]
A.抽样误差是指由于抽选样本的随机性所导致的误差
B.由绝对误差和置信度可显示抽样调查方案设计者预期的抽样误差
C.由总体目标量的点估计值可显示实际抽样误差的估计值
D.总体目标量的估计量的方差越大,表明抽样误差越大
【答案】C
【解析】抽样误差是由抽样的随机性引起的样本结果与总体真值之间的误差。抽样误差是由抽样的随机性导致的。影响抽样误差的原因有抽样单位的数目、总体被研究标志的变异程度、抽样方法的选择、抽样组织方式。抽样误差的计算方法为:,则可以看出抽样误差的估计是需要知道绝对误差和置信度的。
10.某企业对一批产品进行质量检查,过去几次同类调查所得的产品合格率分别为98%、95%、96%。为了使合格率的允许误差不超过2%,在95%的概率保证程度下,本次质量检查应抽查( )件产品。[浙江工商大学2014研]
A.369
B.189
C.340
D.457
【答案】D
【解析】为保证抽样推断的把握程度,确定必要的抽样数目时,若有多个可供参考的方差数值,应选其中方差最大的值来计算。由于比例的方差

由题,有三个产品合格率可供参考,应取方差最大的p=95%,因此

11.二手数据的特点是( )。
A.采集数据的成本低,但搜集比较困难
B.采集数据的成本低,搜集比较容易
C.数据缺乏可靠性
D.不适合自己研究的需要
【答案】B
【解析】二手数据是指与研究相关的原信息已经存在,只是对原信息重新加工、整理,使之成为进行统计分析可以使用的数据。二手数据具有搜集方便、数据采集快、采集成本低等优点,但是得到的数据往往缺乏相关性。
12.从含有N个元素的总体中,抽取n个元素作为样本,使得总体中的每一个元素都有相同的机会(概率)被抽中,这样的抽样方式称为( )。
A.简单随机抽样
B.分层抽样
C.系统抽样
D.整群抽样
【答案】A
【解析】分层抽样也称分类抽样,它是在抽样之前先将总体的元素划分为若干层(类),然后从各个层中抽取一定数量的元素组成一个样本。系统抽样也称等距抽样,先将总体各元素按某种顺序排列,并按某种规则确定一个随机起点,然后每隔一定的间隔抽取一个元素,直至抽取n个元素组成一个样本。整群抽样是指先将总体划分成若干群,然后以群作为抽样单元从中抽取部分群组成一个样本,再对抽中的每个群总包含的所有元素进行观察。
13.从总体中抽取一个元素后,把这个元素放回到总体中再抽取第二个元素,直至抽取n个元素为止,这样的抽样方法称为( )。
A.重复抽样
B.不重复抽样
C.分层抽样
D.整群抽样
【答案】A
【解析】重复抽样又称放回式抽样,是指每次从总体中抽取的样本单位,经检验之后又重新放回总体,参加下次抽样,这种抽样的特点是总体中每个样本单位被抽中的概率是相等的。若每次从总体中抽取的样本单位经检验之后不再放回总体,则为不重复抽样,此时每个样品单位在各次抽样中被抽中的概率是不同的。
14.在抽样之前先将总体的元素划分为若干类,然后从各个类中抽取一定数量的元素组成一个样本,这样的抽样方式称为( )。
A.简单随机抽样
B.分层抽样
C.系统抽样
D.整群抽样
【答案】B
【解析】分层抽样也称分类抽样,在抽样之前先将总体的元素划分为若干层(类),然后从各个层中抽取一定数量的元素组成一个样本;系统抽样也称等距抽样,先将总体各元素按某种顺序排列,并按某种规则确定一个随机起点,然后每隔一定的间隔抽取一个元素,直至抽取n个元素组成一个样本;整群抽样是指先将总体划分成若干群,然后以群作为抽样单元从中抽取部分群组成一个样本,再对抽中的每个群中包含的所有元素进行观察。
15.为了调查某校学生的购书费用支出,从男生中抽取60名学生调查,从女生中抽取40名学生调查,这种调查方法是( )。
A.简单随机抽样
B.整群抽样
C.系统抽样
D.分层抽样
【答案】D
【解析】分层抽样也称分类抽样,在抽样之前先将总体的元素划分为若干层(类),然后从各个层中抽取一定数量的元素组成一个样本。题中在抽样之前先将总体的元素划分为男、女两类,然后从男的这个类中抽取60名学生,女的这个类中抽取40名学生,组成一个样本。所以这种调查方法属于分层抽样。
16.为了调查某校学生的购书费用支出,从全校抽取4个班级的学生进行调查,这种调查方法是( )。
A.简单随机抽样
B.系统抽样
C.分层抽样
D.整群抽样
【答案】D
【解析】整群抽样是指先将总体划分成若干群,然后以群作为抽样单元从中抽取部分群组成一个样本,再对抽中的每个群总包含的所有元素进行观察。题中在抽样之前先将全校的每个班级看成一个群,然后以群为单位抽取4个班级作为一个样本,在对抽取的每个班级的所有学生进行调查,因此这种调查方法属于整群抽样。
17.为了调查某校学生的购书费用支出,将全校学生的名单按拼音顺序排列后,每隔50名学生抽取一名学生进行调查,这种调查方法是( )。
A.简单随机抽样
B.整群抽样
C.系统抽样
D.分层抽样
【答案】C
【解析】系统抽样也称等距抽样,先将总体各元素按某种顺序排列,并按某种规则确定一个随机起点,然后每隔一定的间隔抽取一个元素,直至抽取n个元素组成一个样本。题中的间隔为50。
18.为了解女性对某种品牌化妆品的购买意愿,调查者在街头随意拦截部分女性进行调查。这种调查方式是( )。
A.简单随机抽样
B.分层抽样
C.方便抽样
D.自愿抽样
【答案】C
【解析】方便抽样是指调查过程中由调查员依据方便的原则,自行确定入抽样本的单位。例如,调查员在街头、公园、商店等公共场所所进行拦截式的调查;厂家在出售产品的柜台前对路过的顾客进行的调查,等等。
19.研究人员根据对研究对象的了解有目的选择一些单位作为样本,这种调查方式是( )。
A.判断抽样
B.分层抽样
C.方便抽样
D.自愿抽样
【答案】A
【解析】判断抽样是指研究人员根据经验、判断和对研究对象的了解,有目的地选择一些单位作为样本,实施时根据不同的目的有重点抽样、典型抽样、代表抽样等方式。
20.下面的哪种抽样调查的结果不能用于对总体有关参数进行估计( )。
A.分层抽样
B.系统抽样
C.整群抽样
D.判断抽样
【答案】D
【解析】ABC三项均属于概率抽样,概率抽样是依据随机原则抽选样本,总体中每个单位都有一定的机会被选入样本;因此,可以根据调查的结果对总体相应的参数进行估计,并计算估计的误差。D项属于非概率抽样。
21.调查时首先选择一组调查单位,对其实施调查之后,再请他们提供另外一些属于研究总体的调查对象,调查人员根据所提供的线索,进行此后的调查,以搜集某一特定群体的有关资料。这样的调查方式称为( )。
A.系统抽样
B.整群抽样
C.滚雪球抽样
D.判断抽样
【答案】C
【解析】滚雪球抽样往往用于对稀少群体的调查。在滚雪球抽样中,首先选择一组调查单位,对其实施调查之后,再请他们提供另外一些属于研究总体的调查对象,调查人员根据提供的线索,进行此后的调查。这个过程持续下去,就会形成滚雪球效应。滚雪球抽样的主要优点是容易找到那些属于特定群体的被调查者,调查的成本也比较低。它适合对特定群体进行研究的资料搜集。
22.下面的哪种抽样方式不属于概率抽样( )。
A.系统抽样
B.整群抽样
C.分层抽样
D.滚雪球抽样
【答案】D
【解析】概率抽样是指遵循随机原则进行的抽样,总体中的每个单位都有一定的机会被选入样本,主要包括简单随机抽样、分层抽样、整群抽样、系统抽样、多阶段抽样等。非概率抽样是指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查,主要包括方便抽样、判断抽样、自愿样本、滚雪球抽样、配额抽样等。
23.先将总体中的所有单位按一定的标志(变量)分为若干类,然后在每个类中采用方便抽样或判断抽样的方式选取样本单位。这种抽样方式称为( )。
A.分类抽样
B.配额抽样
C.系统抽样
D.整群抽样
【答案】B
【解析】配额抽样是指先将总体中的所有单位按一定的标志(变量)分成若干类,然后在每个类中采用方便抽样或判断抽样的方式选取样本单位。
24.与概率抽样相比,非概率抽样的缺点是( )。
A.样本统计量的分布是确定的
B.无法使用样本的结果对总体相应的参数进行推断
C.调查的成本比较高
D.不适合探索性的研究
【答案】B
【解析】由于非概率抽样不是依据随机原则抽选样本,样本统计量的分布是不确切的,因而无法使用样本的结果对总体相应的参数进行推断。
25.一家公司的人力资源部主管需要研究公司雇员的饮食习惯,改善公司餐厅的现状。他将问卷发给就餐者,填写后再收上来。他的收集数据的方法属于( )。
A.自填式问卷调查
B.面访式问卷调查
C.实验调查
D.观察式调查
【答案】A
【解析】自填式是指在没有调查员协助的情况下由被调查者自己填写,完成调查问卷。把问卷递送给被调查者的方法有很多,如调查员分发、通过邮寄方式、通过网络方式、或把问卷刊登在报刊上等等。
26.为了估计某城市愿意乘坐公交车上下班的人数的比例,在收集数据时,最有可能采用的数据搜集方法是( )。
A.普查
B.公开发表的资料
C.随机抽样
D.实验
【答案】C
【解析】概率抽样也称随机抽样,是指遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本。为了估计某城市愿意乘坐公交车上下班的人数的比例,目的在于对总体相应的参数进行推断,因此,最有可能采用的数据搜集方法是随机抽样。
27.某机构十分关心学生每周看电视的时间。该机构随机抽取300名小学生家长对他们的孩子每周看电视的时间进行了估计。结果表明,这些小学生每周看电视的平均时间为15小时,标准差为5小时。该机构搜集数据的方式是( )。
A.概率抽样调查
B.观察调查
C.实验调查
D.公开发表的资料
【答案】A
【解析】概率抽样也称随机抽样,是指遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本。随机抽取300名小学生家长对他们的孩子每周看电视的时间进行了估计属于概率抽样调查。
28.如果一个样本因人故意操纵而出现偏差,这种误差属于( )。
A.抽样误差
B.非抽样误差
C.设计误差
D.实验误差
【答案】B
【解析】抽样误差是由抽样的随机性引起的样本结果与总体真值之间的误差,随机误差属于抽样误差;非抽样误差是指除抽样误差之外的,由于其他原因引起的样本观察结果与总体真值之间的差异,非抽样误差主要包括抽样框误差、回答误差、无回答误差、调查员误差与测量误差。因此,本题中是误差属于非抽样误差。
29.为了解居民对小区物业服务的意见和看法,管理人员随机抽取了50户居民,上门通过问卷进行调查。这种数据的收集方法称为( )。
A.面访式问卷调查
B.实验调查
C.观察式调查
D.自填式问卷调查
【答案】A
【解析】面访式是指现场调查中调查员与被调查者面对面,调查员提问、被调查者回答这种调查方式。题中管理人员随机抽取了50户居民,上门通过问卷进行调查属于面访式问卷调查。
30.指出下面的陈述中哪一个是错误的( )。
A.抽样误差只存在于概率抽样中
B.非抽样误差只存在于非概率抽样中
C.无论是概率抽样还是非概率抽样都存在非抽样误差
D.在全面调查中也存在非抽样误差
【答案】B
【解析】抽样误差是一种随机误差,只是存在于概率抽样中;非抽样误差则不同,无论是概率抽样、非概率抽样,或是在全面性调查中,都有可能产生非抽样误差。
31.某居民小区为了解住户对物业服务的看法,准备采取抽样调查方式搜集数据。物业管理部门利用最初的居民户登记名单进行抽样。但现在的小区中,原有的一些居民户已经搬走,同时有些是新入住的居民户。这种调查产生的误差属于( )。
A.随机误差
B.抽样框误差
C.回答误差
D.无回答误差
【答案】B
【解析】抽样框误差是指由于抽样框的不完善性造成的统计推断错误。在概率抽样中需要根据抽样框抽取样本。一个好的抽样框应该是,抽样框中的单位和研究总体中的单位有一一对应的关系,现在的小区中,原有的一些居民户已经搬走,同时有些是新入住的居民户,这时,抽样框中的单位与研究总体的单位就不存在一一对应的关系,使用这样的抽样框抽取样本就会出现抽样框误差。
32.某居民小区为了解住户对物业服务的看法,准备采取抽样调查方式搜集数据。物业管理部门用居民户登记名单进行抽样。但现在的小区中,原有的一些居民户已经搬走而没有回答问题。这种调查产生的误差属于( )。
A.随机误差
B.抽样框误差
C.回答误差
D.无回答误差
【答案】D
【解析】无回答误差是指被调查者拒绝接受调查,调查人员得到的是一份空白的答卷。无回答误差也包括那些调查进行时被访者不在家的情况。题中由于原有的一些居民户已经搬走而没有回答问题,属于无回答误差。
33.某居民小区的物业管理者怀疑有些居民户有偷电行为。为了解住户的每月用电情况,采取抽样调查方式对部分居民户进行调查。发现有些居民户有虚报或瞒报情况。这种调查产生的误差属于( )。
A.有意识误差
B.抽样框误差
C.回答误差
D.无回答误差
【答案】A
【解析】当被调查的问题比较敏感,被调查者不愿意回答,迫于各种原因又必须回答时,可能就会提供一个不真实的数字。产生有意识误差的动因大致有两种,一种是调查问题涉及个人隐私,被调查者不愿意告诉,所以造假;另一种是受利益驱动,进行数字造假。居民受利益驱动,故虚报或瞒报用电情况,这种误差属于有意识误差。
34.某居民小区的物业管理者怀疑有些居民户有偷电行为。为了解住户的每月用电情况,采取抽样调查方式对部分居民户进行调查。发现调查员在登记电表数时有抄错的数据。这种调查产生的误差属于( )。
A.有意识误差
B.抽样框误差
C.调查员误差
D.无回答误差
【答案】C
【解析】调查员误差是指由于调查员的原因而产生的调查误差。例如,调查员粗心,在记录调查结果时出现错误。调查员误差还产生于调查中的诱导,而调查员本人可能并没有意识到。
35.指出下面的陈述哪一个是错误的( )。
A.抽样误差是可以避免的
B.非抽样误差是可以避免的
C.抽样误差是不可避免的
D.抽样误差是可以控制的
【答案】A
【解析】抽样误差是由于抽样的随机性带来的,只要采用概率抽样,抽样误差就不可避免。抽样误差是可以控制的,要求的抽样误差越小,所需要的样本量就越大。非抽样误差与抽取样本的随机性无关,因而在概率抽样和非概率抽样中都会存在,有很多原因造成非抽样误差,因此控制起来比较困难。
二、多项选择题
1.在估计总体比例的抽样调查中,计算必要样本容量时哪些方法可以用来估计总体方差:( )。[中央财经大学2014研]
A.根据试点调查的结果估计
B.根据历史资料估计
C.将总体方差假设为0.25
D.将总体比例假设为0.5
E.将总体方差假设为0.5
【答案】ABCD
【解析】在计算样本容量时,必须知道总体的方差。而在实际抽样调查前,往往总体的方差是未知的。在实际操作时,一般用如下办法解决:①利用预调查或试调查的结果估计;②利用过去的资料估计;③若曾有若干个方差,应选择最大的,以保证抽样估计的精确度。总体比例估计问题中常取S2=P(1-P)=0.25,P=0.5。
2.下列哪一种表述是正确的( )。[东北财经大学2014研]
A.其他条件不变,总体方差越大,必要的样本容量越大
B.其他条件不变,允许误差越小,必要的样本容量越大
C.其他条件不变,显著性水平取值越小,必要的样本容量越大
D.其他条件不变,置信度取值越小,必要的样本容量越小
【答案】ABC
【解析】在重复抽样或无限总体抽样条件下,边际误差为。令E代表所希望达到的边际误差,即

则确定样本量的公式为

其中表示置信水平下的
统计量,
代表总体标准差。A项,样本量与总体方差成正比,总体的差异越大,所要求的样本量也越大;B项,样本量与边际误差的平方成反比,即可以允许的误差越小,所需的样本量就越大;C项,样本量与置信水平成正比,在其他条件不变的情况下,置信水平越大,即显著性水平或置信度越小,Z统计量的值的平方项越大,所需的样本量也就越大。
3.在造成抽样数据的误差中,以下哪些属于非抽样误差( )。[西安交大2008研]
A.被调查人回答误差
B.调查员误差
C.抽样样本没有遵循随机原则
D.样本容量太少而不具备代表性
E.被调查人无回答误差
【答案】ABCE
【解析】非抽样误差有以下几种类型:①抽样框误差;②回答误差;③无回答误差;④调查员误差;⑤测量误差。抽样样本没有遵循随机原则时产生的误差属于非抽样误差。D项属于抽样误差。
4.下面抽样方式中,属于非概率抽样的有( )。[西安交大2007研]
A.方便抽样
B.滚雪球抽样
C.配额抽样
D.多阶段抽样
E.自愿样本
【答案】ABCE
【解析】非概率抽样包括方便抽样、判断抽样、自愿样本、滚雪球抽样和配额抽样。D项属于概率抽样。
5.评价二手资料的准则包括( )。
A.资料是由谁搜集的
B.资料是为什么目的而搜集的
C.资料是怎样搜集的
D.资料是什么时候搜集的
E.资料的搜集是否方便
【答案】ABCD
【解析】评价二手资料的准则:①资料是谁搜集的?②为什么目的而搜集的?③数据是怎样搜集的?④什么时候搜集的?另外,使用二手数据,要注意数据的定义、含义、计算口径和计算方法,避免错用、误用、滥用。在引用二手数据时,应注明数据的来源,以尊重他人的劳动成果。
6.下列属于判断抽样的有( )。
A.重点抽样
B.方便抽样
C.典型抽样
D.代表抽样
E.配额抽样
【答案】ACD
【解析】非概率抽样包括方便抽样、判断抽样、自愿样本、滚雪球抽样和配额抽样。其中,判断抽样是指研究人员根据经验、判断和对研究对象的了解,有目的地选择一些单位作为样本,实施时根据不同的目的有重点抽样、典型抽样、代表抽样等方式。
7.下列关于简单随机抽样的说法,正确的有( )。
A.简单随机抽样是一种最基本的抽样方法,是其他抽样方法的基础
B.简单随机抽样突出特点是简单、直观
C.在规模较大的调查中,也可以采用简单随机抽样的方法
D.抽选的概率是相同的
E.根据简单随机抽样抽出的单位比较集中
【答案】ABD
【解析】在规模较大的调查中,很少直接采用简单随机抽样,一般是把这种方法和其他抽样方法结合在一起使用;根据简单随机抽样抽出的单位很分散。
三、简答题
1.抽样误差影响因素分析。[山东大学2016研,西安交大2003研]
答:影响抽样误差的因素主要有:
(1)样本单位数目。在其他条件不变的情况下,抽样数目越多,抽样误差越小;抽样数目越少,抽样误差越大。当n=N时,就是全面调查,抽样误差此时为零。
(2)总体标志变动程度。在其他条件不变的情况下,总体标志变异程度越大,抽样误差越大;总体变异程度越小,抽样误差越小。
(3)抽样方法。一般讲,不重复抽样的抽样误差要小于重复抽样的抽样误差。当n相对N非常小时,两种抽样方法的抽样误差相差很小,可忽略不计。(4)抽样组织方式。采用不同的抽样组织方式,也会有不同的抽样误差。一般讲分层抽样的抽样误差较小,而整群抽样的抽样误差较大。
2.简述概率抽样的特点。[山东大学2015研]
答:概率抽样也称随机抽样,是指遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本。概率抽样的特点主要有:
(1)抽样时是按一定的概率以随机原则抽取样本。随机原则就是在抽取样本时排除主观上有意识地抽取调查单位,使每个单位都有一定的机会被抽中。需要注意的是,随机不等于随便,随机有严格的科学含义,可以用概率来描述,而随便则带有人为的主观的因素。例如,要在一栋楼内抽取10位居民作为样本,若采用随机原则,就需要事先将居住在该楼的居民按某种顺序编上号,通过一定的随机化程序,如使用随机数字表,抽取出样本,这样可以保证居住在该楼的每位居民都有一定的机会被选中。而如果调查人员站在楼前,将最先走到楼外的10位居民选入样本,这就是随便而不是随机,这种方法不能使居住在该楼内的所有居民都有一定的机会被选中,已经在楼外的人不可能被选中,在调查时段不外出的人也没有机会被选中。随机与随便的本质区别就在于,是否按照给定的入样概率,通过一定的随机化程序抽取样本单元。
(2)每个单位被抽中的概率是已知的,或是可以计算出来的。
(3)当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率。换而言之,估计量不仅与样本单位的观测值(又称观察值)有关,也与其入样概率有关。
3.某课题组拟对某高校20000名在校生进行题为“大学生心理健康状况”的抽样调查。课题组在调查方案中关于调查方式方法的描述是“拟于午餐时间在食堂门口对路过的学生进行随机调查”。根据这一调查方式得到的样本数据能够对整体特征做出新的推断吗?为什么?[浙江工商大学2014研]
答:不能。
因为在午餐时间的食堂门口随机调查的路过的学生不具有代表性。午餐时间可能有同学点外卖在宿舍吃,可能有同学不在食堂吃,甚至可能有同学不在午餐时间去食堂等等,因而使得该高校20000名在校生总体中每个大学生不都有一定的机会被选入样本;另外,这些同学的心理健康状况也许跟午餐时间出现在食堂门口的学生的心理健康状况大有不同,由此调查方式得到的样本数据只是反映了午餐时间出现在食堂门口的这类学生的心理健康状况,因此不能对整体特征做出新的推断。
4.分别说明分层抽样和整群抽样方式的组织方式和特点。[中央财经大学2014研]
答:(1)组织方式:分层抽样是先对总体各单位按主要标志加以分组,然后再从各组中按随机原则抽选一定单位构成样本。整群抽样是先将总体划分为若干群,再从中任意抽取几群,然后对抽中的群作全面调查。
(2)分层抽样特点:①分层抽样除了可以对总体进行估计外,还可以对各层子总体进行估计;②在一定条件下为组织实施调查提供了方便;③分层抽样可以有效地提高估计的精度。整群抽样特点:①在大规模抽样调查中,整群抽样大大简化了编制抽样框的工作量;②在样本单元数相同的条件下可以节省调查费用,方便调查的实施。
5.某市管理部门拟投资建立一家大型生猪养殖场以满足本市居民猪肉需求,为确定生猪养殖场的规模,需调查该市的猪肉人均消费量。为此,该管理部门委托当地一家调查公司进行调查。该市共有8个城区,其中有两个城区为居民居住较为集中的区域。该调查公司通过本市派出所获得所有居民户的住址和联系方式后,从中随机抽取了1000户居民进行调查,并利用该样本信息对全市居民猪肉人均消费量进行估计。
试回答:
(1)该调查公司采用的是何种抽样方法?你认为这种抽样方法对于上述调查是否合适?为什么?
(2)如果不合适,你认为最恰当的抽样方法是什么?请结合该种抽样方法的优点阐述你的理由。[首都经济贸易大学2014研]
答:(1)①该调查公司从所有的居民户中随机抽取1000户居民进行调查,每户居民入样的概率相等,因此采用的是简单随机抽样方法。
②不合适。因为该市的8个城区中,有2个城区居民居住较为集中,若采用简单随机抽样方法进行调查,则容易使得样本不具有代表性,进而影响对全市居民猪肉人均消费量的估计。
(2)最恰当的抽样方法应是分层抽样。
分层抽样是将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本的抽样方法。该种抽样方法保证了样本中包含有各种特征的抽样单位,样本的结构与总体的结构比较相近,从而可以有效地提高估计的精度。将8个城区按居民居住密集度划分为较集中层和不集中层,然后分别从这两个层中独立、随机地抽取居民户,这样便能较为准确地代表总体的情况,使得估计结果较为精确。
6.简述概率抽样与非概率抽样。[暨南大学2013研]
答:(1)概率抽样与非概率抽样的定义:
①概率抽样也称随机抽样,是指遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本。常用的概率抽样方式有简单随机抽样、分层抽样、整群抽样、系统抽样和多阶段抽样。
②非概率抽样是相对于概率抽样而言的,指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。常用的非概率抽样的方式有方便抽样、判断抽样、自愿样本、滚雪球抽样和配额抽样。
(2)概率抽样与非概率抽样的区别:
概率抽样是依据随机原则抽选样本,这时样本统计量的理论分布是存在的,因此可以根据调查的结果对总体的有关参数进行估计,计算估计误差,得到总体参数的置信区间,并且在进行抽样设计时,对估计的精度提出要求,计算为满足特定精度要求所要的样本量;而非概率抽样不是依据随机原则抽选样本,样本统计量的分布是不确切的,因而无法使用样本的结果对总体相应的参数进行推断。
7.简述影响样本容量(或抽样数目)的因素。[四川大学2013研]
答:从定性的方面考虑样本量的大小,其考虑因素有:决策的重要性,调研的性质,变量个数,数据分析的性质,同类研究中所用的样本量,发生率,完成率,资源限制等。具体地说,更重要的决策,需要更多的信息和更准确的信息,这就需要较大的样本;探索性研究,样本量一般较小,而结论性研究如描述性的调查,就需要较大的样本;收集有关许多变量的数据,样本量就要大一些,以减少抽样误差的累积效应;如果需要采用多元统计方法对数据进行复杂的高级分析,样本量就应当较大;如果需要特别详细的分析,如做许多分类等,也需要大样本。
8.统计中常用的抽样方法有哪些?各自适用于何种情况的抽样?[东北财经大学2013研]
答:(1)常用的概率抽样方法有简单随机抽样、分层抽样、系统抽样。
(2)简单随机抽样要求包含所有总体单位的名单作为抽样框,当N很大时,构造这样的抽样框并不容易,所以它适用于总体中的个体数较少的情况;分层抽样是将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本,分层抽样适用于总体中的个体数较多的情况;系统抽样是将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本单位,适用于总体由差异明显的几部分组成的情况。
9.统计数据质量的基本标准是什么?[湖南大学2007研]
答:(1)准确:用数字语言来反映客观实际;(2)快速:统计信息服务必须具有时效性和紧迫性;(3)完整:调查单位没有遗漏,调查项目没有缺陷,资料数据齐全;(4)精练:统计信息具有针对性、有效性、精确性。
10.简述搜集数据的基本方法及其弱点。
答:搜集数据的基本方法:
(1)自填式。自填式方法的弱点:首先,问卷的返回率比较低。其次,自填式方法不适合结构复杂的问卷,对调查的内容有所局限。此外,自填式方法的调查周期通常都比较长,调查人员也需要对问卷的递送和回收方法进行仔细的研究和选择。最后,对于在数据搜集过程中出现的问题,一般难以及时采取调改措施。
(2)面访式。面访式的弱点主要有:首先,调查的成本比较高。其次,面访这种搜集数据的方式对调查过程的质量控制有一定难度。此外,对于敏感性问题的调查,需要对调查员的访谈技巧进行技术培训。
(3)电话式。电话调查也有一定的局限。因为电话调查的工具是电话,如果被调查者没有电话,调查将无法实施。所以在电话拥有率不高的地区,电话调查这种方式就受到限制。另外,使用电话进行访问的时间不能太长,人们不愿意通过电话进行冗长的交谈,特别是被调查者对这项调查的内容不感兴趣时就更是如此。同时,电话调查所使用的问卷要简单。最后,与面访式相比,电话调查由于不是面对面的交流,在被访者不愿意接受调查时,要说服他们就更为困难。
此外,搜集数据的方法还有观察式,即调查人员通过直接观测的方法获取信息。
11.分层抽样与整群抽样有何异同?它们分别适合于什么场合?
答:(1)①相同点:分层抽样和整群抽样都是需要事先按某一标志对总体进行划分的随机抽样。
②不同点:分层抽样的划分标志与调查标志有密切关系,而整群抽样的划分标志不一定与调查标志有关;分层抽样在总体的每个层内随机抽样,而整群抽样在总体全部群体中随机抽取一部分群体;比较计算公式可知,分层抽样的抽样误差取决于各层总体方差的平均数,而整群抽样的抽样误差取决于总体的群间方差;分层抽样的目的(优点)主要是缩小抽样误差,满足推断各子总体数量特征的需要,而整群抽样的目的(优点)主要是扩大抽样单位,简化抽样组织工作。
(2)适用场合:分层抽样用于层间差异大而层内差异小时,以及为了满足分层次管理决策需要时;整群抽样用于群间差异小而群内差异大时,或只有以群体为抽样单位的抽样框时等。