统计问题的类型与解法(Word)

资源下载
  1. 二一教育资源

统计问题的类型与解法(Word)

资源简介

统计问题的类型与解法
统计问题是近几年高考的热点内容之一。可以这样毫不夸张地说,高考试卷中,每卷必有统计问题。从题型上看,可能是选择题或填空题,也可能是大题,难度为中档或低档。纵观近几年高考试卷,归结起来统计问题主要包括:①随机抽样的基本方法;②统计表,统计图和条件指标;③两个随机变量之间的相关关系;④线性回归方程及回归分析;⑤独立性检验等几种类型。各种类型问题结构上具有一定的特征,解答方法也有一定的规律可寻。那么在实际解答统计问题时到底应该如何抓住问题的结构特征,快捷,准确的解答问题呢?下面通过典型例题的详细解析来回答这个问题。
【典例1】解答下列问题:
1、下列抽样方法是简单随机抽样方法的是(

A在某年明信片的销售活动中,规定每100万张为一个开奖组,通过随机抽取的方式确定号码的后四位为2700的为三等奖;B某车间包装一种产品,在自动包装的传送带上,每隔30分钟抽取一包产品,称其重量是否合格;C某学校分别从行政人员,教师,后勤人员抽取2人,14人,4人了解对学校机构改革的意见;D用抽签的方法从10件从产品中抽取3件进行质量检验;
【解析】
【知识点】①简单随机抽样的定义与性质;②简单随机抽样的基本方法。
【解题思路】运用简单随机抽样的性质和简单随机抽样的基本方法,对各选项进行判断就可得出选项。
【详细解答】对A,在100万张明信片中,后四位为2700的明信片每一万张中就有一张,属于系统抽样,A不正确;对B,在自动包装的传送带上,每隔30分钟抽取一包产品,属于等距抽样,
B不正确;对C,分别从行政人员,教师,后勤人员抽取2人,14人,4人属于分层抽样,
C不正确;对D,用抽签的方法从10件从产品中抽取3件符合简单随机抽样的特征,
D正确,即选D。
2、总体由编号为01,02,----19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始,由左向右依次选取两个数字,则选出来的第5个个体的编号为(

A
08
B
07
C
02
D
01
7816
6572
0802
6314
0702
4369
9728
0198
3204
9234
4935
8200
3623
4869
6938
7481
【解析】
【知识点】①简单随机抽样的定义与性质;②简单随机抽样的基本方法;③随机数表的结构与运用。
【解题思路】运用简单随机抽样的性质,简单随机抽样的基本方法和随机数表运用的基本方法,确定出第5个个体的编号就可得出选项。
【详细解答】从随机数表第1行的第5列和第6列数字开始,由左向右依次选取两个数字,得到符合编号为01,02,----19,20的5个号码是:08,02,14,07,02,第5个个体的编号为02,C正确,选C。
3、某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,------,840随机编号,则抽取的42人中,编号落在区间[481,720]的人数为(

A
11
B
12
C
13
D
14
【解析】
【知识点】①系统抽样的定义与性质;②系统抽样的基本方法。
【解题思路】运用系统抽样的性质和系统抽样的基本方法,确定出k的值,再确定[481,720]含k的个数就可得出选项。
【详细解答】k==20,=36-23=13,编号落在区间[481,720]的人数为13人,C正确,选C。
4、将参加夏令营的600名学生编号为001,002,-------,600,采用系统抽样的方法抽取一个容量为50的样本,且随机抽得的号码为003,这600名学生分住在三个营区,从001到300在第I营区,从301到495在第II营区,从496到600在第III营区,三个营区被抽中的人数依次为(

A
26,16,8
B
25,17,8
C
25,16,9
D
24,17,9
【解析】
【知识点】①系统抽样的定义与性质;②系统抽样的基本方法。
【解题思路】运用系统抽样的性质和系统抽样的基本方法,确定出k的值,再确定区间[001,300],[301,485],[496,600],分别含k的个数就可得出选项。
【详细解答】=12,=25,=16+,=8+,三个营区被抽取的人数分别为25人,17人,8人,B正确,选B。
5、某工厂生产甲,乙,丙三种型号的产品,产品数量之比为3:5:7,现用分层抽样的方法抽出容量为n的样本,其中甲产品有18件,则样本容量n等于(

A
54
B
90
C
45
D
126
【解析】
【知识点】①分层抽样的定义与性质;②分层抽样的基本方法;③分层抽样中各层抽取数的计算公式及运用。
【解题思路】运用分层抽样的性质和分层抽样的基本方法,结合分层抽样中各层抽取数的计算公式通过运算求出甲种型号产品的抽取数得到关于n的方程,求解方程求出n的值就可得出选项。
【详细解答】甲,乙,丙三种型号的产品,产品数量之比为3:5:7,用分层抽样的方法甲种型号产品的抽取数为:==18,n=90,即B正确,选B。
6、一个电视台在因特网上就观众对某一节目的喜爱程度进行调查,参加调查的总人数为12000人,其中持各种态度的人数如下表所示:
很喜爱
喜爱
一般
不喜爱
2435
4567
3926
1072
电视台为了了解观众的具体想法和意见,打算从中抽选60人进行更为详细的调查,为此要进行分层抽样,在具体抽样时,各类人中分别应抽选多少人?
【解析】
【知识点】①分层抽样的定义与性质;②分层抽样的基本方法;③分层抽样中各层抽取数的计算公式及运用。
【解题思路】运用分层抽样的性质和分层抽样的基本方法,结合分层抽样中各层抽取数的计算公式通过运算分别求出各类人中应抽选的人数。
【详细解答】6012(人),6023(人),6020(人),
605(人),各类人中应抽选的人数分别为12人,23人,20人,5人。
『思考问题1』
(1)【典例1】随机抽样的问题,解答这类问题需要理解随机抽样的定义,了解随机抽样中各种抽样方法的特征与适用范围,掌握各种随机抽样的基本方法;
(2)运用抽签法必须注意两个基本条件:①抽签是否方便,②号签是否容易搅匀,一般地当总体容量和样本容量较小时可以采用抽签法;
(3)运用随机数时,若遇到三位数或四位数,可以选择随机数表中某行某列的数字计起,每三个(或四个)作为一个单位,自左向右选取,有超过总体号码或重复号码舍去;
(4)系统抽样的特征是:①总体容量较大,②样本容量较大,③总体中各个个体之间没有明显的差异,④每个个体被抽到的可能性相等;
(5)系统抽样的基本方法是:①将总体中的个体进行统一编号,②把总体平均分成若干个部分(若总体容量不能被样本容量整除时,可以将总体随机剔除几个个体来确定分段间隔),③在第一个部分用简单随机抽样的方法确定开始的个体编号x,④按照每一组的个体数确定个体之间相隔的距离抽取样本;
(6)分层抽样的特征是:①总体容量较大,②总体由几个个体差异明显的部分构成;
(7)各层样本单位数的确定可按公式:某层抽取的样本数=样本数,通过计算来确定。
〔练习1〕解答下列问题:
1、从全班30名女学生中抽出8名女学生对看足球比赛的喜爱程度进行调查,用抽签法抽出这个样本;
2、考生在一次英语考试中要回答的10道题是这样产生的:从15道听力题中随机抽出3道题,从20道解答题中随机抽出5道题,从10道口试题中随机抽出2道题,用抽签法确定某考生所要回答的考题的序号;
3、从全班50名学生中随机抽选8名学生去参加一项活动,试用随机数表法把这8名学生抽选出来;
4、某工厂平均每天生产某种机器零件大约10,000件,要求产品检验员每天抽取50个零件,检查其质量状况,采用系统抽样方法抽取,若抽取的第一组中的号码是0010,则第三组抽取的号码为

5、在一次游戏中,获胜者可得到5件不同的奖品,这些奖品要从已编号的50种不同奖品中随机抽取确定,用系统抽样方法确定某获胜者所得到的5件奖品的编号;
6、一个总体中的100个个体的号码为0,1,2,------,98,99,并依次将其分为10个小组,组号为0,1,2,------,8,9.要用系统抽样方法抽取一个容量为10的样本,规定如果在0组(号码为0,1,2,------8,9)随机抽取的号码为x,那么依次错位地得到后面各组的号码,即第k组中抽取的号码个位数为x+k或x+k-10(如果x+k≥10),写出x分别为2与5时,所抽取样本的10个号码。
7、一个田径队中有男运动员56人,女运动员42人,用分层抽样方法从全队的运动员中抽出一个容量为28人的样本,求男、女运动员应各抽多少人?
8、某市的三个区共有高中学生20000人,且三个区的高中学生的人数之比为2:3:5,现要用分层抽样方法从所有学生中抽取一个容量为200人的样本,求这三个区分别应抽取多少人?
9、一个城市有210家百货商店,其中大型商店有20家,中型商店有40家,小型商店有150家,为了掌握各商店的营业情况,要从中抽取一个容量为21的样本,按照分层抽样方法抽取样本时,各类百货商店要分别抽取多少家?
【典例2】解答下列问题:
1、
以下茎叶图记录了甲,乙两组各5名学生
甲组
乙组
在一次英语听力测试中的成绩(单位:分),
9
0
9
已知甲组数据的中位数为15,乙组数据的平均
x
2
1
5
y
8
值为16.8,则x,y的值分别为(

7
4
2
4
A
2,5
B
5,5
C
5,8
D
8,8
【解析】
【知识点】①茎叶图的定义与性质;②中位数的定义与求法;③平均数的定义与求法。
【解题思路】运用茎叶图的性质,中位数和平均数的求法,得到关于x,y的方程,求解方程求出x,y的值就可得出选项。
【详细解答】甲组数据的中位数为15,乙组数据的平均值为16.8,10+x=15,
=16.8,即:x=5,y=8,C正确,选C。
2、为比较甲,乙两地某月14时的气温情况,
甲地
乙地
随机选取该月中的5天,将这5天中14时的
9
8
6
2
8
9
气温数据(单位:)制成如图所示的茎叶
1
1
3
0
1
2
图,考虑以下结论:
①甲地该月14时的平均气温低于乙地该月14时的平均气温;②甲地该月14时的平均气温高于乙地该月14时的平均气温;③甲地该月14时的气温标准差小于乙地该月14时的气温标准差;④甲地该月14时的气温标准差大于乙地该月14时的气温标准差;其中根据茎叶图能得到的统计结论的编号为(

A
①③
B
①④
C
②③
D
②④
【解析】
【知识点】①茎叶图的定义与性质;②标准差的定义与求法;③平均数的定义与求法。
【解题思路】运用茎叶图的性质,标准差和平均数的求法,分别求出甲,乙两地该月14时的平均气温和气温标准差,对各统计结论解析判断就可得出选项。
【详细解答】==29,==30,29<30,
①正确,②错误;==,
==,>,④正确,③错误,B正确,选B。
3、某校随机抽取100名同学矩形“垃圾分类”的问卷测试,测试结果发现这100名同学的得分在[50,100]内,按得分分成[50,60),[60,70),[70,80),[80,90),[90,100],得到如图所示的频率分布直方图,则这100名同学的得分的中位数为(
)(2020成都市高三一诊)
A
72.5
B
75
C
77.5
D
80
【解析】
【知识点】①频率分布直方图的定义与性质;②中位数的定义与求法。
【解题思路】运用频率分布直方图的性质,中位数的求法,求出这100名同学的得分的中位数就可得出选项。
【详细解答】分数在[50,70)的频率=(0.010+0.030)10=0.4<0.5,分数在[50,80)的频率=(0.010+0.030+0.040)10=0.7>0.5,中位数在[70,80)这一组内,设中位数为70+x,0.4+0.040x=0.5,x==2.5,
这100名同学得分的中位数为70+2.5=72.5(分)

A正确,选A。
4、某校从参加高一年级期中考试的学生中随机抽
0.030
y
频率/组距
出60名学生,将其物理成绩(均为整数)分成六
0.025
段[40,50),[50,60),------[90,100)后得到
0.020
如图所示的频率分布直方图,观察图形的信息,回
0.015
答下列问题:
0.010
(1)求分数在[70,80)内的频率,并补全这个频
0.005
率分布直方图;
0
405060708090100
成绩(分)x
(2)统计方法中,同一组数据常用该组区间的中点值作为代表,据此估计本次考试中的平均成绩。
【解析】
【知识点】①频率分布直方图的定义与性质;②频率的定义与求法;③平均数的定义与求法;④统计估计的基本方法。
【解题思路】(1)运用频率分布直方图的性质,频率的求法,就可求出分数在[70,80)内的频率;(2)估计组距数列平均数的计算方法求出样本的平均数,利用统计估计的基本方法就可估计本次考试中的平均成绩。
【详细解答】(1)1-10
(0.005+0.010+2
0.015+0.025)=1-0.7=0.3,分数在[70,80)内的频率为0.3,补全这个频率分布直方图如图所示;(2)样本分数的平均数为:
=10(450.010+550.015+650.015+750.030+850.025+950.005)=66.35(分),估计本次考试中的平均成绩为66.35分。
『思考问题2』
(1)【典例2】是与统计表,统计图和统计指标相关问题,解答这类问题需要理解统计表,茎叶图,频率分布直方图,平均数,方差,标准差的定义,掌握茎叶图,频率分布直方图的作法,平均数,方差,标准差的求法,注意茎叶图,频率分布直方图的性质;
(2)茎叶图的特征是:①茎叶图能够看到真实的数据,没有任何信息损失;②茎叶图便于记录和表示;③茎叶图只便于表示两位有效数字的数据;④茎叶图也只方便记录两组数据;
(3)茎叶图的基本画法是:①用两短竖线分成把图分成两部分,②两组数据中选一组放左边,另一组放右边,③把数据的十位数记在两短竖线之间,④将数据的个位数分别记在左右两边;
(4)解答频率分布直方图问题的关键是读懂频率分布直方图,频率分布直方图中的每一个小矩形的面积是指样本数据落在该区域的频率,所有小矩形面积的和为1;
(5)作频率分布直方图的基本方法是:①求出原始数据的极差(最大值与最小值的差);②确定组数与组距;③确定各组的起始点与终点;④列出统计数据分布表;⑤画出频率分布直方图;
(6)总体估计的常用方法有:①点估计;②区间估计;
(7)点估计是直接运用样本指标作为总体指标,常用的样本指标有:①样本的平均数;②样本的标准差;③样本的方差;常用的总体指标有:①总体的平均数;②总体的标准差;③总体的方差;
(8)区间估计是根据问题要求可靠程度去确定总体指标取值的区间,其基本方法是:①由问题要求的可靠程度确定抽样的平均误差;②根据抽样平均误差确定抽样误差的允许范围;③根据抽样误差的允许范围确定总体指标的取值范围。
〔练习2〕解答下列问题:
1、将某选手的9个得分去掉1个最高分,
8
7
7
去掉1个最低分,7个剩余分数的平均分为
9
4
0
1
0
x
9
1
91分,现场作的9个分数的茎叶图后来有一
个数据模糊,无法辨认,在图中以x表示,则7个剩余分数的方差为

2、如图是某青年歌手大奖赛上七位评委为甲,


乙两名选手打出的分数的茎叶图(其中m为数字
0
7
9
0----9中的一个),去掉一个最高分和一个最低
5
4
5
5
1
8
4
4
6
4
7
分后,甲,乙两名选手得分的平均数分别为,
m
9
3
,则一定有(

A

B

C
=
D
,的大小与m的值有关
3、从某自动包装机包装的食盐中,随机抽取20袋,测得各袋质量分别为(单位:g)
492
496
494
495
498
497
501
502
504
496
497
503
506
508
507
492
496
500
501
499
根据频率分布估计总体分布的原理,该自动包装机的袋装质量在497.5—501.5之间的概率约为

4、某人在同一条件下射靶50次,其中射中5环或5环以下2次,射中6环3次,射中7环9次,射中8环21次,射中9环11次,射中10环4次。
(1)画出样本频率分布直方图;
(2)根据样本的频率分布直方图估计该射击者射中7环—9环的概率约是多少?
5、从全年级的学生的语文考试成绩中任意抽取20名学生的成绩如下(单位:分)
60
90
85
75
65
70
80
90
95
80
85
95
75
70
85
80
85
65
90
85
求全年级学生语文考试平均成绩的估计值;
6、甲、乙两台机器同时制造某种零件,抽查15天中这两台机器制造该零件的数量,结果如下:
机器甲:151
150
141
143
135
131
141
142
150
142
144
137
134
140
134
机器乙:147
146
148
155
157
149
146
148
149
146
148
158
147
147
146
哪种机器的日均产量较高?
7、从甲、乙两个总体中各抽取了一个样本:

900
920
900
850
910
920

890
960
950
850
860
890
根据上述样本估计,哪个总体的波动较小;
8、甲、乙两人在相同条件下各射靶20次,命中的环数如下:

7
8
6
8
6
5
9
10
7
4
5
6
5
6
7
8
7
9
10
9

9
5
7
8
7
6
8
6
7
7
9
6
5
8
6
9
6
8
7
7
谁射击的成绩比较稳定?
y
【典例3】解答下列问题:
3000
.
1、x和y的散点图如图所示,则下列说法中所有
2500
.
正确命题的序号为
2000
.
①x,y是负相关关系;②在该相关关系中,若用
1500
.
Y=拟合时的相关系数的平方为,用=
1000
.
x+拟合时的相关系数的平方为,则>;
500
.
.
.
.
.
③x,y之间不能建立线性回归方程。
0
1
2
3
4
5
6
7
8
9
10
x
【解析】
【知识点】①随机变量散点图的定义与性质;②随机变量相关的定义与性质;③相关系数的定义与求法;④判断随机变量相关的基本方法。
【解题思路】(1)运用变量相关的性质和判断变量相关的基本方法,结合变量散点图,对各结论的真假进行判断就可得出结果。
【详细解答】从x和y的散点图可知,变量y岁变量x的增大而减小,图中的点没有分布在一条直线附近,①③正确,拟合时的相关系数越大,表明这种拟合越合理,②正确,即:下列说法中所有正确命题的序号为①②③。
2、四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归方程,分别得到以下四个结论:①y与x负相关,且=2.347x-6.423;②y与x负相关,且=-3.476x+5.648;
③y与x正相关,且=5.437x+8.493;④y与x正相关,且=-4.326x-4.578。其中一定不正确的结论的序号是(

A
①②
B
②③
C
③④
D
①④
【解析】
【知识点】①随机变量线性相关的定义与性质;②回归方程的定义与性质;③判断随机变量相关的基本方法。
【解题思路】运用变量相关的性质和判断变量相关的基本方法,结合变量散点图,对各结论的真假进行判断就可得出结果。
【详细解答】由=2.347x-6.423知,变量y与x正相关,①错误;由=-3.476x+5.648知,变量y与x负相关,②正确;由=5.437x+8.493知,变量y与x正相关,③正确;由=-4.326x-4.578知,变量y与x负相关,④错误,即其中一定不正确的结论的序号是①④,D正确,选D。
『思考问题3』
(1)【典例3】是随机变量相关关系的问题,解答这类问题需要理解两个随机变量具有相关关系,随机变量散点图,随机变量相关系数的定义,掌握判断两个随机变量是否具有相关关系的基本方法;
(2)判断两个随机变量是否具有相关关系的基本方法是:①随机变量散点图法;②随机变量相关系数法;
(3)运用随机变量散点图法判断随机变量是否相关的基本方法是:①根据两个随机变量的一组对应值作出随机变量散点图;②根据随机变量散点图得出结论;
(4)运用随机变量相关系数判断随机变量是否相关的基本方法是:①根据两个随机变量变量的一组对应值运用公式计算出随机变量相关系数的值;②根据计算结果得出结论;
(5)判断两个随机变量是正相关还是负相关的基本方法是:①随机变量散点图法;②随机变量相关系数法;③运用线性回归方程=x+中的系数的值,若>0,则为正相关;若<0,则为负相关。
〔练习3〕解答下列问题:
1、在一组样本数据,,-----,(n2,,,------,不全相等)的散点图中,所有的样本点(,)(i=1,2,-------,n)都在直线y=x+1上,则这组样本数据的样本相关系数为(

A
-1
B
0
C
D
1
2、变量x与y相对应的一组数据为(10,1),(11,3.2),(11.8,3),(12.5,4),(13,5);变量u与v相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).
表示变量y与x的线性相关系数,表示变量v与u的线性相关系数,则(

A
<<0
B
0<<
C
<0<
D
=
【典例4】解答下列问题:
5
y
1、
某车间为了制定工时定额,需要确定加工零件所
花费的时间,为此作了四次试验,得到的数据如下:4
零件的个数x(个)
2
3
4
5
加工的时间y(小时)2.5
3
4
4.5
3
(1)在给定的坐标系中画出表中数据的散点图;
.
(2)求出y关于x的线性回归方程=x+,
2
=0.7x+1.05
并在坐标系中画出回归直线;
0
1
2
3
4
5
x
(3)试预测加工10个零件需要多少小时?注:=,=-

【解析】
【知识点】①线性回归方程的定义与性质;②随机变量散点图的定义与作法;③求线性回归方程的基本方法;④统计预测的基本方法。
【解题思路】(1)运用作随机变量散点图的基本方法就可作出表中数据的散点图;(2)根据公式求出,的值就可得到随机变量y关于x的线性回归方程,从而由回归方程作出回归直线;(3)把x=10代入线性回归方程求出的值就可预测加工10个零件需要的时间。
【详细解答】(1)在给定的坐标系中描出相应的点,得到表中数据的散点图如图所示;(2)===0.7,=-0.7=1.05,随机变量y关于x的线性回归方程为:=0.7x+1.05,在坐标系中画出回归直线如图所示;(3)当x=10时,=0.710+1.05=8.05(小时),预测加工10个零件需要8.05小时。
2、下图
是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图(注:年代代码1—7分别对应年份2008—2014)。
(1)曲线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;
(2)建立y关于t的回归方程,(系数精确到0.01),预测2016年我国生活垃圾无害化处理量。附注:参考数据:参考公式:相关系数

回归方程=x+中斜率和截距的最小二乘估计公式分别为:
【解析】
【知识点】①线性回归方程的定义与性质;②随机变量折线图的定义与性质;③随机变量相关系数的定义与求法;④求线性回归方程的基本方法;⑤统计预测的基本方法。
【解题思路】(1)运用随机变量相关系数计算公式求出随机变量y关于t的相关系数的值,从而说明可用线性回归模型拟合随机变量y关于t的关系;(2)根据公式求出,的值就可得到随机变量y关于t的线性回归方程,把t=9代入线性回归方程求出的值就可预测2016年我国生活垃圾无害化处理量。
【详细解答】(1)==4,=1.331,
=-7=40.17-741.3312.902,==2,r=0.99,随机变量y关于t的相关系数约为0.99,接近1,可用线性回归模型拟合随机变量y与t的关系;(2)=0.103,1.331-0.10340.92,
随机变量y关于t的线性回归方程为:=0.103x+0.92,当t=9时,0.1039+0.92
1.82,预测2016年我国生活垃圾无害化处理量为1.82亿吨。
『思考问题4』
(1)【典例4】是与线性回归方程和线性回归分析相关的问题,解答这类问题需要理解线性回归方程,线性回归分析的定义,掌握线性回归方程的求法和线性回归分析的方法;
(2)求线性回归方程的基本方法是:①判断两个变量是否具有线性相关关系;②运用公式:
=,
=-
求出回归系数,(也可以用待定系数法,即根据回归直线过样本点的中心求系数,),③写出线性回归方程;
(3)回归分析及回归预测的基本方法是:①依据线性回归方程视为变量y是变量x(或t)的一次函数,将变量x(或t)的值代入回归直线方程求出变量y的值;②得出同角预测。
〔练习2〕解答下列问题:
1、已知x,y的取值如下表:
x
0
1
4
5
6
8
从所得散点图中分析可知y与x线性相关,
y
1.3
1.8
5.6
6.1
7.4
9.3
且=0.95x+,则x=13时,y等于(

A
1.45
B
13.8
C
13
D
12.8
2、某产品的广告费支出x与销售额y
x
2
4
5
6
8
(单位:万元)之间有如下对应数据:
y
30
40
60
50
70
(1)画出随机变量y关于x散点图;
(2)求随机变量y关于x线性回归方程;
(3)试预测广告费支出10万元时,销售额是多少?
【典例5】解答下列问题:
1、
为调查某地区老年人是否需要志愿者提供帮助,
性别


用简单随机抽样方法从该地区调查了500位老年人,是否需要志愿者
结果如下:
需要
40
30
(1)估计该地区老年人中,需要志愿者提供帮助
不需要
160
270
的老年人的比例;
(2)能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关?
(3)根据(2)的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?说明理由。
附p(≥k)
0.050
0.010
0.001
=
K
3.841
6.635
10.828
【解析】
【知识点】①分类变量的定义与性质;②列联表的定义与性质;③独立性检验的定义与性质;④独立性检验的基本方法;⑤分层抽样的定义与基本方法。
【解题思路】(1)运用点估计的基本方法,结合列联表就可估计该地区老年人中,需要志愿者提供帮助的老年人的比例;(2)根据列联表,运用公式求出的值就可得出结论;(3)根据(2)中的结论可知老年人中,需要志愿者提供帮助与性别有关,结合分层抽样的特征应该选用分层抽样的方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例。【详细解答】(1)调查的500人,需要志愿者提供帮助的人数为40+30=70(人),一般中需要志愿者提供帮助的老年人的比例为=,即估计该地区老年人中,需要志愿者提供帮助的老年人的比例为;(2)
==9.967>6.635,有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关;(3)由(2)知该地区的老年人是否需要志愿者提供帮助与性别有关,并且从表中可以看出该地区老年人中需要志愿者提供帮助的男性老年人与女性老年人有比较明显的差异,调查时应该先确定该地区老年人的男女比例,再把老年人分成男女两个群体,采用分层抽样的方法比简单随机抽样的方法会更好。
2、某大型企业人力资源部为了研究企业员工工作的积极性和对待企业改革的态度的关系,随机抽取了100名员工进行调查,其中支持企业改革的调查者中工作积极的有46人,工作一般的有35人,而不太赞成企业改革的调查者中,工作积极的有4人,工作一般的有15人。
(1)根据以上数据建立一个2x2列联表;
(2)对于人力资源部的研究项目,根据以上数据是否可以认为企业的全体员工对待企业改革的态度与其工作积极性有关?
参考公式:=

其中n=a+b+c+d为样本容量。
P(
≥)0.50
0.40
0.25
0.15
0.10
0.05
0.025
0.010
0.005
0.001
0.455
0.708
1.323
2.072
2.706
3.841
5.024
6.635
7.879
10.828
【解析】
【知识点】①分类变量的定义与性质;②列联表的定义与性质;③独立性检验的定义与性质;④独立性检验的基本方法。
【解题思路】(1)运用列联表的性质,结合问题条件就可得出2x2列联表;(2)根据2x2列联表,运用公式求出的值就可得出结论。
【详细解答】(1)支持企业改革的调查者中工作积极的有46人,工作一般的有35人,不太赞成企业改革的调查者中,工作积极的有
工作积极
工作一般
合计
4人,工作一般的有15人,个2x2列联表如
支持
46
35
81
表所示;(2)
==7.602,
不赞成
4
15
19
7.602>6.635,有99%的把握认为企业的全体员
合计
50
50
100
工对待企业改革的态度与其工作积极性有关。
『思考问题5』
(1)【典例5】是独立性检验的问题,解答这类问题需要理解分类变量,独立性检验的定义,了解2x2列联表的意义,掌握独立性检验的基本方法;
(2)判断两个分类变量是否有关的基本方法是:①运用列联表计算的值进行判断,越大两个分类变量有关的可能性越大;②计算|ad-bc|的值进行判断,|ad-bc|越大两个分类变量有关的可能性越大;
(3)独立性检验的基本方法是:①根据样本数据制成2x2列联表;②运用公式=
计算的观察值;③比较与临界值的大小,作出推断。
〔练习5〕解答下列问题:
(1)为了普及环保知识,增强环保意识,某大学从理工类专业的A班和文史类专业的B班各抽取20名同学参加环保知识测试,统计得到成绩与专业的列联表:
优秀
非优秀
合计
②独立性检验临界值表:
A班
14
6
20
P(
≥)
0.050
0.010
B班
7
13
20
3.841
6.635
合计
21
19
40
附:参考公式及数据:
①统计量:=
(其中n=a+b+c+d为样本容量);
则下列说法正确的是(
)(2017泰安月考)
A
有99%的把握认为环保知识测试成绩与专业有关
B有99%的把握认为环保知识测试成绩与专业无关C有95%的把握认为环保知识测试成绩与专业有关D有95%的把握认为环保知识测试成绩与专业无关
(2)2016年9月20日是第28个全国爱牙日,为了迎接此节日,某地区卫生部门成立了调查小组,调查“常吃零食与患龋齿的关系”,对该地区小学六年级800名学生进行检查,按患龋齿和不患龋齿分类,并汇总数据,不常吃零食且不患龋齿的学生有60名,常吃零食但不患龋齿的学生有100名,不常吃零食但患龋齿的学生有140名。
①能否在犯错误的概率不超过0.001的前提下,认为该地区学生常吃零食与患龋齿有关系?
②4名卫生部门的工作人员随机分成两组,每组2人,一组负责数据收集,另一组负责数据处理,求工作人员甲分到收集数据组,工作人员乙分到处理数据组的概率。

展开更多......

收起↑

资源预览