您当前位置: 圣才学习网首页 > 统计类 > 抽样技术

全国电视观众抽样调查抽样方案

扫码手机阅读
用圣才电子书APP或微信扫一扫,在手机上阅读本文,也可分享给你的朋友。
评论(0
  
  一、调查目的、范围和对象
  11 调查目的
  准确获取全国电视观众群体规模、构成以及分布情况;获取这些观众的收视习惯,对电视频道和栏目的选择倾向、收视人数、收视率与喜爱程度,为改进电视频道和栏目、开展电视观众行为研究提供新的依据。
  12 调查范围
  全国31个省、自治区、直辖市(港澳台除外)中所有电视信号覆盖区域。
  13 调查对象
  全国城乡家庭户中的13岁以上可视居民以及4-12岁的儿童。包括有户籍的正式住户也包括所有临时的或其他的住户,只要已在本居(村)委会内居住满6个月或预计居住6个月以上,都包括在内。不包括住在军营内的现役军人、集体户及无固定住所的人口。
  二、抽样方案设计的原则与特点
  21 设计原则
  抽样设计按照科学、效率、便利的原则。首先,作为一项全国性抽样调查,整体方案必须是严格的概率抽样,要求样本对全国及某些指定的城市或地区有代表性。其次,抽样方案必须保证有较高的效率,即在相同样本量的条件下,方案设计应使调查精度尽可能高,也即目标量估计的抽样误差尽可能小。第三,方案必须有较强的可操作性,不仅便于具体抽样的实施,也要求便于后期的数据处理。
  22 需要考虑的具体问题、特殊要求及相应的处理方法
  221 城乡区分
  城市与农村的电视观众的收视习惯与爱好有很大的区别。理所当然地应分别研究,以便于对比。最方便的处理是将他们作为两个研究域进行独立抽样,但代价是,这样做的样本点数量较大,调查的地域较为分散,相应的费用也就较高。另一种处理方式是在第一阶抽样中不考虑区分城乡,统一抽取抽样单元(例如区、县),在其后的抽样中再区分城、乡。这样做的优点是样本点相对集中,但数据处理较为复杂。综合考虑各种因素,本方案采用第二种处理方式。
  在样本区、县中,以居委会的数据代表城市;以村委会的数据代表农村。
  222 抽样方案的类型与抽样单元的确定
  全国性抽样必须采用多阶抽样,而多阶抽样中设计的关键是各阶抽样单元的选择,其中尤以第一阶抽样单元最为重要。本项调查除个别直辖市及城市外,不要求对省、自治区进行推断,从而可不考虑样本对省的代表性。在这种情况下,选择区、县作为初级抽样单元最为适宜。因为全国区、县的总数量很大,区、县样本量也会比较大,因而第一阶的抽样误差比较小。另外对区、县的分层也可分得更为精细。
  本抽样方案采用分层五阶抽样。各阶抽样单元确定为:
  第一阶抽样:区(地级市以上城市的市辖区)、县(包括县级市等);
  第二阶抽样:街道、乡、镇;
  第三阶抽样:居委会、村委会;
  第四阶抽样:家庭户;
  第五阶抽样:个人。
  为提高抽样效率,减少抽样误差, 在第一阶抽样中对区、县采用按地域及类别分层。在每一层内前三阶抽样均采用按与人口成正比的不等概率系统抽样(PPS系统抽样),而第四阶抽样采用等概率系统抽样,即等距抽样,第五阶抽样采用简单随机抽样。
  223 自我代表层的设立
  根据要求,本次调查需要对北京、上海两个直辖市以及广州、成都、长沙与西安四个省会城市进行独立分析,因而在处理上将这些城市(包括下辖的所有区、县)每个都作为单独的一层处理。为方便起见,以下把这样的层称为自我代表层。考虑到在这样处理后,全国其他区县在分层中的一些具体问题以及各地的特殊情况,将天津市也作为自我代表层处理。另外,鉴于西藏情况特殊,所属区县与其它省(自治区)的差别很大,因此也将它作为自我代表层处理。这样自我代表层共有8个,包括以下城市与地区:
  北京市、天津市、上海市;广州市、成都市、长沙市、西安市;西藏自治区。
  三、样本区、县的抽选方法
  31 全国区县的调查总体
  根据2001年的全国行政区划资料,全国(港澳台除外)共有787个市辖区,此外有5个地级市(湖州、东莞、中山、三亚、嘉峪关)不设市辖区,若将它们每个都视同一个市辖区,则共有792个区;全国共有1674个县(包括自治县及旗、自治旗、特区与林区等)、400个县级市,县级行政单位的总数为2074个,这中间包括福建省的金门县,不能进行调查,因此除金门县以外的所有2865个区、县(792个区及2073个县)构成此次调查的调查总体。
  32县分层
  为便于调查后的资料分类汇总及提高精度,应将全国区、县进行分层。分层可以按多种标识进行,从理论而言,分层标识应选取与调查指标相关程度较高的那些变量。在本次调查中也就是应选取与观众收视行为、习惯与爱好等密切相关的变量。关于这方面已有一些相应的研究结果,例如观众的年龄、性别、文化程度、职业、居住地的生活习惯与气候等。不过注意到我们不可能按观众的个体来分类,只能按观众居住的区、县来分类。而对于区、县,许多表示人口特征(除人口总数)及经济文化发展指标(除所在省的人文发展指数及县的人均GPT)的资料都无法得到,经过多方研究,我们对区县的分层按以下两种标识进行。
  (1)地域
  我国幅员广大,各地经济、社会、文化与气候的地域差异极大,而所有这些因素都与电视观众的收视行为密切相关。我们首先将所有县按所在省(自治区、直辖市)的地理位置分成3大层13个子层,[各省括号内的数字为它们的人文发展指数(Human Development Index,简称HDI),在全国的排位,参见附表]。地域分层如表1:
  1      全国区、县的地域分层
大层
所含省、自治区、直辖市
第一大层
  (东部地区)
子层10:上海(1)、北京(2)、天津(3)(每个都作为自我代表层)子层11:辽宁(5)、山东(9)
  子层12:江苏(7)、浙江(6)
  子层13:福建(8)、广东(4)、海南(13)
第二大层
  (中部地区)
子层21:黑龙江(10)、吉林(12)
  子层22:河北(11)、河南(18)、山西(16)
  子层23:安徽(20)、江西(23)
  子层24:湖北(14)、湖南(17)
第三大层
  (西部地区)
子层31:内蒙古(21)、新疆(15) 、宁夏(26)
  子层32:陕西(25)、甘肃(28)、青海(29)
  子层33:重庆(22)、四川(24)
  子层34:广西(19)、云南(27)、贵州(30)
  子层30:西藏(自我代表层)
 
  需要说明的是以上划分的层,还考虑了其他一些因素,各省按联合国制定的标准计算的人文发展指数仅是考虑因素之一。例如,按人文发展指数,广西(第19位)实际上可划在第二大层(中部地区),但考虑到国家西部大开发的范围将广西划入西部地区,我们的划分与它一致,这样便于资料的汇总发布。又如海南,根据人文发展指数(第13位)放在第一大层稍为勉强,但是根据它的地理位置以及它以旅游为主业,就观众行为而言,与广东、福建划在一子层内是合理的。
  (2)区、县类别
  同一大层的各市辖区与所隶属的城市的规模、在城市中的地理位置(市区或郊区)和居民成分构成(非农业人口占总人口的比例)有较大差异,各县也因经济文化发达程度有较大差异。我们将各大层中所有的区、县除已划为自我代表层的以外,(如下称抽样总体)分成以下5类,每类组成1个小层:
  一类区,二类区,县级市,一类县,二类县。
  全国抽样总体中所有区县共分成 11×5=55个小层。其中区的划分标准为区中非农业人口占总人口的比例,比例高于标准的为一类区,比例低于标准的为二类区;县的划分标准为人均国内生产总值,高的为一类县,低的为二类县。区县划分类别的标准在三大层中各不相同,具体标准如下:
  区类别的划分标准:
  东部地区与中部地区:非农人口在总人口中的比例大于或等于80%为一类区,小于80%为二类区;西部地区:非农人口在总人口中的比例大于或等于70%为一类区,小于70%为二类区。
  县类别的划分标准:
  东部地区:人均GDP在5000元以上为一类县;5000元以下为二类县。中部地区:人均GDP在4000元以上为一类县;4000元以下为二类县。西部地区:人均GDP在3000元以上为一类县;3000元以下为二类县。
  33自我代表层的区、县情况
  根据最新行政区划,自我代表层中的7个城市所辖的区、县构成情况如表1。
  2        自我代表城市的辖区、县构成
一类区
二类区
直辖市中的县
  及其它县级市
总计
北京市
8
5
5
18
天津市
7
7
4
18
上海市
9
7
3
19
广州市
5
5
2
12
成都市
5
2
4
8
19
长沙市
2
3
1
3
9
西安市
4
4
0
5
13
 
  西藏自治区包括1个地级市(拉萨市,下辖一个城关区)、一个县级市(日喀则市)及71个县。
  34 抽样总体区县情况
  按3.2划分标准,全国除自我代表层以外的抽样总体各小层的区、县数及人口在(抽样总体)总人口中的比例如表3与表4所示。
  3         抽样总体中各小层的区县数
地域子层
一类区
二类区
县级市
一类县
二类县
合计
东部地区11
43
62
47
19
68
239
东部地区12
30
47
53
31
37
198
东部地区13
24
41
51
59
42
217
中部地区21
56
26
40
36
32
190
中部地区22
39
67
56
140
148
450
中部地区23
26
34
19
31
95
205
中部地区24
20
44
39
42
69
214
西部地区31
27
8
34
91
61
221
西部地区32
11
16
15
51
131
224
西部地区33
5
42
14
55
85
201
西部地区34
19
27
30
74
175
325
合计
300
414
398
629
943
2684
 
  表4      抽样总体各小层人口占总人口的比例(%
地域子层
一类区
二类区
县级市
一类县
二类县
合计
东部地区11
1.3512
2.2766
3.1728
0.7672
3.6295
11.1972
东部地区12
0.6992
1.6487
3.8832
1.4105
2.2809
9.9226
东部地区13
0.5083
1.2187
3.4437
2.3497
1.7150
9.2354
中部地区21
1.0200
0.5023
1.7709
1.1035
1.0037
5.4004
中部地区22
0.9263
1.9128
2.7858
4.5291
6.3593
16.5133
中部地区23
0.5272
1.1800
1.0682
1.1637
4.9385
8.8776
中部地区24
0.6106
1.5928
2.5415
2.2757
3.2519
10.2726
西部地区31
0.4343
0.2219
0.7319
1.2265
1.3692
3.9838
西部地区32
0.2976
0.5513
0.4257
0.7233
3.0567
5.0546
西部地区33
0.1454
2.1132
0.9581
1.8715
3.8961
8.9843
西部地区34
0.3629
0.9478
1.3254
2.6499
5.2722
10.5582
合计
6.8831
14.1662
22.1072
20.0705
36.7730
100.0000
 
  35 区、县的抽样方法及样本量
  抽样总体中各层(指小层,下同)内对区、县的抽样采用按人口的PPS系统抽样,样本量一般为2;少数人口较多的小层样本量定为3。样本量的具体分配见表5。样本区、县总量为121个。
  5         各小层的区县样本量的分配
地域子层
一类区
二类区
县级市
一类县
二类县
合计
东部地区11
2
3
3
2
2
12
东部地区12
2
2
3
2
2
11
东部地区13
2
2
3
2
2
11
中部地区21
2
2
2
2
2
10
中部地区22
2
2
3
3
3
13
中部地区23
2
2
2
2
3
11
中部地区24
2
2
2
2
2
10
西部地区31
2
2
2
2
2
10
西部地区32
2
2
2
2
3
11
西部地区33
2
2
2
2
3
11
西部地区34
2
2
2
2
3
11
合计
22
23
26
23
27
121
 
  四、抽样总体中样本区、县内的抽样方法
  41 样本区内的抽样
  每个一类样本区内采用街道(镇)、居委会、家庭户及个人的4阶抽样;每个二类样本区内采用街道(乡、镇)、居(村)委会、家庭户及个人的4阶抽样,样本量皆为90。具体方法如下。
  411 对街道(乡、镇)的抽样
  样本区内对街道(乡、镇)抽样采用按人口的PPS系统抽样,每个样本区抽3个街道(乡、镇),其中一类区不抽乡。
  412 对居委会的抽样
  样本街道、镇(乡)内对居(村)委会的抽样采用按人口的PPS系统抽样,每个样本街道、镇、乡各抽2个居(村)委会(其中一类区不抽村委会)。为操作方便,这里的人口数也可用户数。
  413 对家庭户的抽样
  样本居(村)委会内对家庭户的抽样采用随机起点的等概率系统抽样,即等距抽样。每个居(村)委会固定抽取15户。在抽样时,必须首先清点居(村)委会管辖范围内的实际家庭户数,且规定排列的顺序。
  4.1.4 样本户内具体调查对象的确定
  对每个被抽中的样本户,在13岁以上(含13岁)的成员中,完全随机地确定一名为具体调查对象。为确保家庭成员中的每一个这样的成员都有相等的概率被抽中,采用二维随机表来确定。
   6          确定户内调查对象的二维随机表
序号
姓名
性别
年龄
1
2
3
4
5
6
7
8
9
10
11
12
1
 
 
 
1
1
1
1
1
1
1
1
1
1
1
1
2
 
 
 
2
1
2
1
1
2
2
1
1
2
1
2
3
 
 
 
3
2
1
1
3
2
2
1
3
1
2
3
4
 
 
 
4
1
3
2
2
3
1
4
3
2
4
1
5
 
 
 
5
4
1
2
3
4
1
2
3
5
4
2
6
 
 
 
6
3
1
5
2
4
3
5
1
4
6
2
7
 
 
 
7
1
4
3
6
2
5
2
5
7
4
3
8
 
 
 
8
4
5
7
1
2
6
3
7
5
3
1
9
 
 
 
9
5
1
4
3
8
2
7
6
5
2
8
10
 
 
 
10
3
5
9
4
1
7
2
8
6
9
4
11
 
 
 
11
6
1
5
10
4
9
8
3
2
7
6
12
 
 
 
12
7
2
9
4
11
6
1
8
3
10
5
 
  42 样本县(县级市)内的抽样
  每个样本县内采用乡(镇)、村(居)委会、家庭户及个人的4阶抽样,样本量为60。具体方法如下。
  421 对乡、镇的抽样
  确定县城所在的镇(城关镇)为必调查镇,对其余乡(镇)采用按人口的PPS系统抽样,再抽2个乡(镇),每个样本县共调查3个乡(镇)。
  422 对村(居)委会的抽样
  在每个城关镇中用按人口PPS抽样抽取2个样本居(村)委会。对其它两个样本乡、镇内,也用同样的方法抽2个村委会。为操作方便,这里的人口数也可用户数。
  423 对家庭户的抽样
  样本村(居)内对家庭户的抽样与样本居委会内对家庭户的抽样完全相同,仍采用随机起点的等概率系统抽样,即等距抽样。每个村(居)固定抽取10户。
  4.2.4 具体调查对象的确定
  在样本户中确定具体对象的方法与414中情形完全相同,即用二维随机表来确定。
  43 儿童样本的确定
  在城乡每个样本户中,除抽取一位13岁以上的观众作为调查对象外,如果还有4-12岁的儿童,则需要抽取1位进行儿童观众的调查。如果符合年龄的条件多于1位,则仍按二维随机表的方法确定。
  对于自我代表的7个城市中,为保证儿童的样本量,对每个样本户,调查所有满足年龄的儿童。
  五、自我代表层中的抽样方法
  51 自我代表城市的抽样方法
  每个需要进行推断的城市皆作为自我代表层,在层内也进行分层抽样,层的划分标准与其它子层中的区、县标准基本相同。只不过不再对县分类,且将县级市(仅长沙市有一个)也作为一般县处理。这样每个城市皆分为一类区、二类区及县三层。考虑到上海市浦东新区的特殊性(既包括完全城市化的市区,也包含相当广泛的农村),将该区作为自我代表层处理。
  考虑到在一个城市范围内的调查,交通比较方便,故为提高效率,根据每个城市的实际情况,保证(或适当增加)样本区的数量,减少每个样本区、县内的的样本量。每个样本区县规定都抽2个街道(乡、镇),每个样本街道、乡、镇抽2个居(村)委会。样本区内每个居(村)委会样本量仍为本15户,样本县(县级市)内每个村(居)委会样本量仍为10户。
  如果有可能,对一类区也可不对区进行抽样,直接对街道进行抽样。
  根据每个必调查城市所属的区县数,确定样本区、县数如下表(表中的数字为样本区、县数,括号中的数字为每个区、县的样本户数):
  7        自我代表城市的样本量
城 市
一类区
二类区
总样本量
北京市
4(60)
2(60)
2(40)
440
天津市
3(60)
2(60)
2(40)
380
上海市
4(60)
 3(60)﹡
2(40)
500
广州市
3(60)
2(60)
2(40)
380
成都市﹡
3(60)
2(60)
2(40)
380
长沙市
2(60)
3(60)
2(40)
380
西安市﹡
4(45)
2(60)
2(40)
380
总计
1320
960
560
2840
 
  ﹡其中浦东新区在商业区抽一个街道,在农业区抽一个镇。
  ﹡成都、西安两市由于一类区数量较少,故对一类区进行全数调查,其中西安市每个一类区中抽1个街道,每个街道抽3个居委会。若有条件在每个区中直接抽3个居委会最好。
  52 西藏自治区的抽样方法
  西藏自治区的抽样也采用分层抽样法,其中拉萨市城关区抽4个居委会,日喀则市除城关镇外,再抽两个乡镇,共6个居(村)委会。以上两市均作为自我代表层,每层各抽取60户;其余71个县则采用按人口的PPS抽样抽2个县,每个县调查40户。西藏自治区总样本量为200户。
  六、总样本量与抽样误差的估计
  61 总样本量
  根据前述抽样设计,本方案13岁以上观众总的样本量为:
  1)自我代表层共2840+200=3040户,其中区样本为2400户,县样本为640户。
  2)抽样总体分11个子层,55个小层,样本区县共121个,其中样本区45个,样本县(县级市)76个。每个样本区抽90户,故区样本为4050户;每个样本县抽60户,县样本共4560户,共计8610户。
  3)全国总样本量为11650户,其中区样本为6390户,县样本为5260户。
  62 抽样误差的估计
  本方案的设计效应deff估计为2.0, 相当于简单随机抽样的样本量n0 =5825, 在95%置信度下比例型目标量的绝对误差限d,经计算约为 1.28%。
  七、目标量的估计及其方差估计
  根据方案设计,(小)层内样本是近似自加权的,因此层目标量的估计及其方差估计较为简单。而地区(大层)与全国目标量的估计则可用表4中的人口比例为权加权并汇总自我代表层得出,相应的方差估计也随之可得。具体公式另给。
  参考文献
[1]       冯士雍,倪加勋,邹国华,《抽样调查理论与方法》,中国统计出版社,
  1998.
  [2] 中华人民共和国民政部编,中华人民共和国行政区划简册,中国地图出版社,2001。
  [3] 联合国开发计划署,中国人类发展报告---1999,中国财政经济出版社,1999
  [4] 胡鞍钢, 邹平等,中国发展报告 社会与发展—中国社会发展地区差距研究,浙江人民出版社,2000。
  [5] L. 基什(L.Kish)著,倪加勋等译,抽样调查,中国统计出版社,1997。
  附表:      1997年全国各省市人类发展指数HDI
省、市
  自治区
平均预期
  寿命指数
教育指数
国内生产
  总值指数
人类发展
  指数
人类发展
  指数排位
上海
0.832
0.824
0.975
0.877
1
北京
0.798
0.840
0.963
0.867
2
天津
0.789
0.810
0.957
0.852
3
广东
0.792
0.789
0.949
0.843
4
辽宁
0.754
0.801
0.939
0.831
5
浙江
0.780
0.735
0.949
0.821
6
江苏
0.773
0.735
0.945
0.817
7
福建
0.726
0.737
0.944
0.802
8
山东
0.760
0.702
0.849
0.770
9
黑龙江
0.700
0.790
0.809
0.766
10
河北
0.756
0.759
0.676
0.730
11
吉林
0.716
0.804
0.610
0.710
12
海南
0.750
0.745
0.632
0.709
13
湖北
0.704
0.761
0.655
0.707
14
新疆
0.627
0.773
0.656
0.685
15
山西
0.733
0.782
0.522
0.679
16
湖南
0.699
0.776
0.511
0.662
17
河南
0.753
0.745
0.487
0.661
18
广西
0.729
0.741
0.478
0.649
19
安徽
0.741
0.713
0.482
0.646
20
内蒙古
0.678
0.740
0.517
0.645
21
重庆
0.689
0.727
0.489
0.635
22
江西
0.685
0.764
0.455
0.635
23
四川
0.689
0.723
0.441
0.617
24
陕西
0.707
0.741
0.404
0.617
25
宁夏
0.699
0.669
0.440
0.603
26
云南
0.642
0.665
0.442
0.583
27
甘肃
0.704
0.667
0.339
0.570
28
青海
0.593
0.545
0.445
0.528
29
贵州
0.655
0.659
0.233
0.516
30
西藏
0.577
0.435
0.345
0.452
31
 

小编工资已与此挂钩!一一分钱!求打赏↓ ↓ ↓

如果你喜欢本文章,请赐赏:

已赐赏的人
最新评论(共0条)评论一句