资源简介 第九章 统计9.2 用样本估计总体一、画频率分布直方图的步骤(1)求极差:极差为一组数据中 与 的差.(2)决定组距与组数:当样本容量不超过100时,常分成 组,为了方便起见,一般取等长组距,并且组距应力求“取整”.(3)将数据分组.(4)列频率分布表:一般分四列:分组、 、频数、 .其中频数合计应是样本容量,频率合计是1.(5)画频率分布直方图:横轴表示分组,纵轴表示 .小长方形的面积=组距× = .各小长方形的面积和等于1.【答案】最大值 最小值 5~12 频数累计 频率 频率二、其它统计图表统计图表 主要应用扇形图 直观描述各类数据占总数的比例条形图和直方图 直观描述不同类别或分组数据的频数和频率折线图 描述数据随时间的变化趋势三、第p百分位数的定义一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有 的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.【答案】p%四、计算一组n个数据的第p百分位数的步骤第1步,按 排列原始数据.第2步,计算i=n×p%.第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的 .【答案】从小到大 平均数五、四分位数25%,50%,75%这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数,其中第25百分位数也称为第一四分位数或下四分位数,第75百分位数也称为第三四分位数或上四分位数.六、众数、中位数和平均数的概念众数:一组数据中 的数.中位数:一组数据按大小顺序排列后,处于 位置的数.如果个数是偶数,则取 两个数据的平均数.平均数:一组数据的 除以数据个数所得到的数.【答案】出现次数最多 中间 中间 和七、众数、中位数和平均数的比较名称 优点 缺点平均数 与中位数相比,平均数反映出样本数据中更多的信息,对样本中的极端值更加敏感 任何一个数据的改变都会引起平均数的改变.数据越“离群”,对平均数的影响越大中位数 不受少数几个极端数据(即排序靠前或靠后的数据)的影响 对极端值不敏感众数 体现了样本数据的最大集中点 众数只能传递数据中的信息的很少一部分,对极端值不敏感八、在频率分布直方图中计算众数、中位数、平均数1.平均数:在频率分布直方图中,样本平均数可以用每个小矩形底边中点的 与小矩形的的乘积之和近似代替.2.中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该 .3.众数:众数是 小矩形底边的中点所对应的数据.【答案】横坐标 面积 相等 最高九、方差和标准差假设一组数据是,用表示这组数据的平均数,那么这组数据的方差s2= ,标准差s= 。【答案】十、总体方差和标准差1.总体方差和标准差:如果总体中所有个体的变量值分别为Y1,Y2,…,YN,总体的平均数为,则称S2= 为总体方差,S= 为总体标准差.2.总体方差的加权形式:如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数为fi(i=1,2,…,k),则总体方差为S2=(Yi-)2.【答案】十一、样本方差和标准差如果一个样本中个体的变量值分别为y1,y2,…,yn,样本平均数为,则称s2= 为样本方差,s= 为样本标准差.【答案】十二、分层随机抽样的方差设样本容量为n,平均数为,其中两层的个体数量分别为n1,n2,两层的平均数分别为1,2,方差分别为s,s,则这个样本的方差为 .【答案】s2=[s+(1-)2]+[s+(2-)2]十三、标准差的意义标准差刻画了数据的 或 ,标准差越大,数据的离散程度越 ;标准差越小,数据的离散程度越 .【答案】离散程度 波动幅度 大 小一、选择题1.四名同学各掷骰子4次,记录每次骰子出现的点数并分别对每位同学掷得的点数进行统计处理,在四名同学以下的统计结果中,可以判断该同学掷出的骰子一定没有出现点数1的是( )A.平均数为3,众数为4 B.平均数为4,中位数为3C.中位数为3,方差为2.5 D.平均数为3,方差为2.5【答案】B【解析】对于选项,1,3,4,4符合条件,故错,对于B,平均数为4, 中位数为3,则中间两数的和为6,所以第一个数和最后一个数的和为10,而最大数为6,所以第一个数为4,显然不可能出现1,B对;对于C,1,2,4,5,中位数,平均数为,方差,为符合条件,C不符合题意;对于D,1,2,4,5,由C知,符合条件,D不符合题意.故答案为:B2.为了鼓励学生积极锻炼身体,强健体魄,某学校决定每学期对体育成绩在年级前100名的学生给予专项奖励.已知该校高三年级共有500名学生,如图是该年级学生本学期体育测试成绩的频率分布直方图.据此估计,能够获得该项奖励的高三学生的最低分数为( )A.89 B.88 C.87 D.86【答案】B【解析】由题意,,的频率为:0.02×5=0.1,的频率为:0.05×5=0.25,则0.1<0.2<0.25,则第100名在中,设分数为x,的频率为:,所以.故答案为:B.3.容量为100的某个样本数据分成10组,并填写频率分布表,若前6组频率之和为0.7,则剩下4组的频率之和为( )A.0.3% B.0.3 C.30 D.无法确定【答案】B【解析】容量为100的某个样本数据分成10组,若前6组频率之和为0.7,则剩下4组的频率之和为1-0.7=0.3.故答案为:B4.某研究机构为了实时掌握当地新增高速运行情况,在某服务区从小型汽车中抽取了80名驾驶员进行询问调查,将他们在某段高速公路的车速( )分成六段: , , , , , ,得到如图所示的频率分布直方图.下列结论错误的是( )A.这80辆小型车辆车速的众数的估计值为77.5B.这80辆小型车辆车速的中位数的估计值为77.5C.这80辆小型车辆车速的平均数的估计值为77.5D.在该服务区任意抽取一辆车,估计车速超过 的概率为0.65【答案】C【解析】解:对于A:由图可知,众数的估计值为最高矩形的中点对应的值,故A正确对于B:[60.65),[65.70),[70.75)所对应的矩形的面积分别为0.05,0.1,0.2,其和为0.35<0.5,而[75,80)对应的矩形面积为0.3,因此中位数的估计值为75+0.5-0.35x5=77.5,故B正确;对于C:平均数的估计值为62.5x0.05+67.5x0.1+72.5x0.2+77.5x0.3+82.5x0.25+87.5x0.1=77,故C错误;对于D:估计车速超过75km/的概率为(0.06+0.05+0.02)x5=0.65,故D正确.故选:C.5.“直播电商”已经成为当前经济发展的新增长点,某电商平台的直播间经营化妆品和服装两大类商品,2020年前三个季度,该直播间每个季度的收入都比上一季度的收入翻了一番,其前三季度的收入情况如图所示,则( )A.该直播间第三季度总收入是第一季度总收入的3倍B.该直播间第二季度化妆品收入是第三季度化妆品收入的C.该直播间第一季度化妆品收入是第三季度化妆品收入的D.该直播间第三季度服装收入高于前两个季度的服装收入之和【答案】B【解析】对于A,因为该直播间每个季度的收入都比上一季度的收入翻了一番,所以第三季度的总收入是第一季度的 倍,A不符合题意;对于B,设第一季度的总收入为a,则第二季度、第三季度的总收入分别为 ,第二季度的化妆品收入为 ,第三季度的化妆品收入为 ,所以第二季度化妆品收入是第三季度化妆品收入的 ,B符合题意;对于C,第一季度的化妆品收入为 ,所以第一季度化妆品收入是第三季度化妆品收入的 ,C不符合题意;对于D,第一、二季度服装收入和为 ,第三季度服装收入为 ,D不符合题意.故答案为:B6.某市居民月均用水量的频率分布直方图如图所示:其众数 ,中位数 ,平均数 的估计值分为,则下列结论正确的是( )A. B. C. D.【答案】A【解析】由直方图知,众数 ,中位数 在 上,则 ,解得 ,平均数 .∴ .故答案为:A.二、填空题7.一组样本数据 ,4,5,6, 的平均数为 ,标准差为4,则 .【答案】128【解析】根据题意: ,化简整理得: 。故答案为:128。8.为了解学生的课外阅读情况,某校采用样本量比例分配的分层随机抽样对高中三个年级的学生进行平均每周课外阅读时间(单位:小时)的调查,所得样本数据如下:年级 抽样人数 样本平均数 样本方差高一 40 5 3.5高二 30 2高三 30 3已知高中三个年级学生的总样本平均数为4.1,总样本方差为3.14,则高二年级学生的样本平均数 ,高三年级学生的样本方差 .【答案】4;1.5【解析】解:由高中三个年级学生的总样本平均数为4.1,可得 ,解得 ;因为总样本方差为3.14,所以,解得 .故答案为:4;1.5.三、解答题9.某单位需要选派一名职工去参加市工会组织的自行车争先赛,该单位对甲 乙两名骑行爱好者进行了选拔测试,在相同条件下进行了6次测试,测得他们的最大速度(单位:),其数据如下表所示:甲 26 37 29 36 34 30乙 32 28 37 33 27 35分别求出甲 乙两名骑行爱好者最大速度的数据的平均数 方差,并以此为依据判断选谁参加比赛比较合适.【答案】解:甲的最大速度的平均数,乙的最大速度的平均数.甲的最大速度的方差,乙的最大速度的方差,,而,故答案为:乙去参加比赛比较合适.【解析】根据题意由图表中的数据,结合平均数和方差公式,代入数值分别计算出结果,再把结果进行对比由此即可得出答案。10.某中学共有3000名学生,其中高一年级有1200名学生,为了解学生的睡眠情况,现用分层抽样的方法,在三个年级中抽取了200名学生,依据每名学生的睡眠时间(单位:小时),绘制出了如图所示的频率分布直方图.(1)求样本中高一年级学生的人数及图中a的值;(2)估计样本数据的中位数(保留两位小数);(3)估计全校睡眠时间不低于7个小时的学生人数.【答案】(1)解:由分层抽样等比例的性质,样本中高一年级学生的人数为.由,可得.(2)解:设中位数为x,由、,知:,∴.得,故样本数据的中位数约为7.42.(3)解:由图可知,样本数据落在的频率为.故全校睡眠时间不低于7个小时的学生人数约为人.【解析】(1)由频率分布直方体中的数据,代入数值计算出a的取值即可。(2)根据题意设出中位数,结合已知条件代入数值计算出结果即可。(3)首先由频率分布直方图中的数据,计算出频率的取值,结合题意即可计算出结果。第九章 统计9.2 用样本估计总体一、画频率分布直方图的步骤(1)求极差:极差为一组数据中 与 的差.(2)决定组距与组数:当样本容量不超过100时,常分成 组,为了方便起见,一般取等长组距,并且组距应力求“取整”.(3)将数据分组.(4)列频率分布表:一般分四列:分组、 、频数、 .其中频数合计应是样本容量,频率合计是1.(5)画频率分布直方图:横轴表示分组,纵轴表示 .小长方形的面积=组距× = .各小长方形的面积和等于1.二、其它统计图表统计图表 主要应用扇形图 直观描述各类数据占总数的比例条形图和直方图 直观描述不同类别或分组数据的频数和频率折线图 描述数据随时间的变化趋势三、第p百分位数的定义一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有 的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.四、计算一组n个数据的第p百分位数的步骤第1步,按 排列原始数据.第2步,计算i=n×p%.第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的 .五、四分位数25%,50%,75%这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数,其中第25百分位数也称为第一四分位数或下四分位数,第75百分位数也称为第三四分位数或上四分位数.六、众数、中位数和平均数的概念众数:一组数据中 的数.中位数:一组数据按大小顺序排列后,处于 位置的数.如果个数是偶数,则取 两个数据的平均数.平均数:一组数据的 除以数据个数所得到的数.七、众数、中位数和平均数的比较名称 优点 缺点平均数 与中位数相比,平均数反映出样本数据中更多的信息,对样本中的极端值更加敏感 任何一个数据的改变都会引起平均数的改变.数据越“离群”,对平均数的影响越大中位数 不受少数几个极端数据(即排序靠前或靠后的数据)的影响 对极端值不敏感众数 体现了样本数据的最大集中点 众数只能传递数据中的信息的很少一部分,对极端值不敏感八、在频率分布直方图中计算众数、中位数、平均数1.平均数:在频率分布直方图中,样本平均数可以用每个小矩形底边中点的 与小矩形的的乘积之和近似代替.2.中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该 .3.众数:众数是 小矩形底边的中点所对应的数据.九、方差和标准差假设一组数据是,用表示这组数据的平均数,那么这组数据的方差s2= ,标准差s= 。十、总体方差和标准差1.总体方差和标准差:如果总体中所有个体的变量值分别为Y1,Y2,…,YN,总体的平均数为,则称S2= 为总体方差,S= 为总体标准差.2.总体方差的加权形式:如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数为fi(i=1,2,…,k),则总体方差为S2=(Yi-)2.十一、样本方差和标准差如果一个样本中个体的变量值分别为y1,y2,…,yn,样本平均数为,则称s2= 为样本方差,s= 为样本标准差.十二、分层随机抽样的方差设样本容量为n,平均数为,其中两层的个体数量分别为n1,n2,两层的平均数分别为1,2,方差分别为s,s,则这个样本的方差为 .十三、标准差的意义标准差刻画了数据的 或 ,标准差越大,数据的离散程度越 ;标准差越小,数据的离散程度越 .一、选择题1.四名同学各掷骰子4次,记录每次骰子出现的点数并分别对每位同学掷得的点数进行统计处理,在四名同学以下的统计结果中,可以判断该同学掷出的骰子一定没有出现点数1的是( )A.平均数为3,众数为4 B.平均数为4,中位数为3C.中位数为3,方差为2.5 D.平均数为3,方差为2.52.为了鼓励学生积极锻炼身体,强健体魄,某学校决定每学期对体育成绩在年级前100名的学生给予专项奖励.已知该校高三年级共有500名学生,如图是该年级学生本学期体育测试成绩的频率分布直方图.据此估计,能够获得该项奖励的高三学生的最低分数为( )A.89 B.88 C.87 D.863.容量为100的某个样本数据分成10组,并填写频率分布表,若前6组频率之和为0.7,则剩下4组的频率之和为( )A.0.3% B.0.3 C.30 D.无法确定4.某研究机构为了实时掌握当地新增高速运行情况,在某服务区从小型汽车中抽取了80名驾驶员进行询问调查,将他们在某段高速公路的车速( )分成六段: , , , , , ,得到如图所示的频率分布直方图.下列结论错误的是( )A.这80辆小型车辆车速的众数的估计值为77.5B.这80辆小型车辆车速的中位数的估计值为77.5C.这80辆小型车辆车速的平均数的估计值为77.5D.在该服务区任意抽取一辆车,估计车速超过 的概率为0.655.“直播电商”已经成为当前经济发展的新增长点,某电商平台的直播间经营化妆品和服装两大类商品,2020年前三个季度,该直播间每个季度的收入都比上一季度的收入翻了一番,其前三季度的收入情况如图所示,则( )A.该直播间第三季度总收入是第一季度总收入的3倍B.该直播间第二季度化妆品收入是第三季度化妆品收入的C.该直播间第一季度化妆品收入是第三季度化妆品收入的D.该直播间第三季度服装收入高于前两个季度的服装收入之和6.某市居民月均用水量的频率分布直方图如图所示:其众数 ,中位数 ,平均数 的估计值分为,则下列结论正确的是( )A. B. C. D.二、填空题7.一组样本数据 ,4,5,6, 的平均数为 ,标准差为4,则 .8.为了解学生的课外阅读情况,某校采用样本量比例分配的分层随机抽样对高中三个年级的学生进行平均每周课外阅读时间(单位:小时)的调查,所得样本数据如下:年级 抽样人数 样本平均数 样本方差高一 40 5 3.5高二 30 2高三 30 3已知高中三个年级学生的总样本平均数为4.1,总样本方差为3.14,则高二年级学生的样本平均数 ,高三年级学生的样本方差 .三、解答题9.某单位需要选派一名职工去参加市工会组织的自行车争先赛,该单位对甲 乙两名骑行爱好者进行了选拔测试,在相同条件下进行了6次测试,测得他们的最大速度(单位:),其数据如下表所示:甲 26 37 29 36 34 30乙 32 28 37 33 27 35分别求出甲 乙两名骑行爱好者最大速度的数据的平均数 方差,并以此为依据判断选谁参加比赛比较合适.10.某中学共有3000名学生,其中高一年级有1200名学生,为了解学生的睡眠情况,现用分层抽样的方法,在三个年级中抽取了200名学生,依据每名学生的睡眠时间(单位:小时),绘制出了如图所示的频率分布直方图.(1)求样本中高一年级学生的人数及图中a的值;(2)估计样本数据的中位数(保留两位小数);(3)估计全校睡眠时间不低于7个小时的学生人数. 展开更多...... 收起↑ 资源列表 高一数学人教A版2019必修第二册 导学案 9.2 用样本估计总体(原卷版).docx 高一数学人教A版2019必修第二册 导学案 9.2 用样本估计总体(解析版).docx