【讲座笔记】抽样调查漫谈
抽样调查漫谈
人民大学 金勇进
(一)生活在调查当中的现代人
1.抽样调查是运用最为广泛的调查;抽样调查:从调查对象的总体中按照随即原则抽取一部分单位作为样本,并以对样本进行调查和统计的结果来推断总体的方法。
2.抽样调查的几个关键
(1)样本是怎样产生的
(2)调查问卷是否有缺欠,不能有诱导的成分
(二)调查的步骤
1.调查策划:明确通过调查索要获取的信息,确定调查内容,决定像谁进行调查(确定调查对象)。
2.调查问卷设计
3.抽样方法确定:面对面调查;电话调查;网络调查
4.数据的处理:数据编码与录入;数据审核与插补(包括权数确定);数据估计(包括抽样误差计算、置信区间);调查结果表述(调查报告)
(三)什么是好的设计
1.调查的立意:无论是概率抽样或是非概率抽样,调查的立意要高
(1)以市场调查为例,目标是发现存在的问题或机会
策略价值2
观念创新
最高层次
策略价值1
价值附加
较高层次
基本经验
本体价值
较低层次
2.调查方式和研究的问题是否吻合:我们设计研究时需要问:针对这个研究问题或理论,需要哪种类型的证据来回答问题或检验理论才是令人信服的?
(1)非概率抽样:主要解决问题的发现,不具备推断总体的功能
(2)概率抽样:主要解决统计推断
3.个案研究的价值:具有探索性研究的性质,个案研究的价值是从个案研究中产生问题(假设),以留待日后用更多严格的研究设计进行检验。(例:毛泽东《湖南农民运动考察报告》;费孝通《江村经济》)
(1)个案的策略性选择意味着我们在个案研究开始之前就对个案特征有所了解。适合我们事先就明确的一些特殊要求,这些个案才被选取。
(2)虽然个案研究虽然侧重的是个别的事情,但揭示了很深的普遍性原理。
4.抽样方式:从调查对象的总体中按照随机原则一部分单位作为样本,并以对样本进行调查和统计的结果来推断总体的方法。
(1)概率抽样:严格意义上的抽样;
A.基本特征
a.遵循随机原则;
b.入样概率已知或可以计算;(可以计算抽样误差:当用样本去推算总体的时候可能出现的误差)
c.技术要求比较高(时常被误用)
B.概率抽样案例
a.CGSS(中国综合社会调查)
b.中国公众科学素养调查
c.中国青少年心理发育特征调查
d.两岸四地消费者信心指数调查
(2)非概率抽样:
A.抽样特征
a.抽选样本时不依据随机原则
b.简单、方便、快捷、成本比较低
c.对技术要求不是太高
d.不能用于对总体目标量的估计和对调查精度的评估。
B.抽样方式
a.重点调查
b.典型调查
c.方便选样
d.配额选样
5.概率抽样的几个挑战
(1)挑战一:目标总体和抽样总体(目标总体:要研究的总体;抽样总体:产生样本的总体)
A.构建一个好的抽样框
a.抽样框:抽取样本,计算样本单位入样概率的依据
b.良好抽样框的标志:目标总体中的一个单位和抽样总体中的一个单位一一对应。
B.概率抽样中随机要有程序实现
a.统计软件中的抽样模块
b.随机数字表
(2)挑战二:抽样误差与非抽样误差(抽样研究的核心问题是误差问题)
A.误差出现的原因
a.抽样误差:抽样随机性带来的误差(客观存在的误差,无法避免;但只要采用严格规范的做法,这一误差可以计算和控制)
b.非抽样误差:1.抽样狂误差;2.响应误差;3.计量误差(难以测度,成因复杂,体现执行力)
【一个完美的调查是科学和艺术的结合,科学体现在对抽样误差的把握上,艺术体现在对非抽样误差的掌控上。】
【误差的计算与控制是抽样调查中面临的严重挑战】
(3)挑战三:平衡的艺术——精度与费用的关系
【边际效率递减规律:当样本量达到一定程度后,样本量再增加,虽然对精度有帮助,但是精度增加量比较小】
(4)挑战四:样本量的“陷阱”
A.问题一:估计精度是否越高越好→概率抽样对精度要求的判断十分重要。未得到最小误差而选择最大样本量不是好的选择。
B.问题二:样本量和总体规模“N”有关吗?→抽样调查总体规模越大,抽样调查的效率越高。对于很小规模的总体,要取得所期望的精度,通常必须调查较大比例的样本,在经济上不合算。
【调查方法:入户调查、电话调查、邮寄调查、文档法、观察法、实验法、座谈法、个案深访】→不同调查方法有各自特点,也与调查内容有关,有时需要将多种调查方法结合。
6.调查研究的基本特征:确定选题并提出假说,设计调查方法,搜集资料,分析和检验,解释结果或假说。
7.实验法的关键:
(1)分为实验组和对照组
(2)实验者在哪个组应随机产生
(3)实验应采用“双盲”原则
8.社会调查中很难控制其他因素,如何设计实验是一个挑战。