2026届高考一轮复习基础练数学 第九章 统计与成对数据的统计分析 学案(3份打包)(含解析)

资源下载
  1. 二一教育资源

2026届高考一轮复习基础练数学 第九章 统计与成对数据的统计分析 学案(3份打包)(含解析)

资源简介

第九章 统计与成对数据的统计分析
第三节 成对数据的统计分析
知识点108 成对数据的统计相关性
回归教材
样本的相关系数 ( ).当 时,称成对样
本数据正相关;当时,称成对样本数据负相关.当越接近1时,成对样本数据的线性相关程度越强;当越接近0时,成对样本数据的线性相关程度越弱.
易错提醒 当r=0时,只表明成对样本数据间没有线性相关关系,但不排除它们之间有其他相关关系.
教材素材变式
1 [链接人A选必三P99—P100知识]
下列图中,线性相关系数最小的是()
A. B.
C. D.
变式探究
[多选]有一散点图如图所示,在5个(x,y)数据中去掉D(3,10)后,下列说法中正确的是()
A .残差平方和变小 B .相关系数r变小
C .决定系数变小 D .解释变量x与响应变量y的相关性变强
2[入B选必二P114练习A第4题变式]某同学用收集到的6组数据制作成如图所示的散点图(点旁的数据为该点坐标),并由最小二乘法计算得到回归直线的方程: ,相关系数为,相关指数为;经过残差分析确定点为“离群点”(对应残差过大的点),把它去掉后,再用剩下的5组数据计算得到回归直线的方程: ,相关系数为,相关指数为。则以下结论中,不正确的是()


3[人A选必三P101例1变式]某种机械设备随着使用年限的增加,它的使用功能逐渐减退,使用价值逐年减少,通常把它的使用价值逐年减少的“量”换算成费用,称为失效费.该种机械设备的使用年限x(单位:年)与失效费y(单位:万元)的统计数据如表所示.
使用年限x/年 2 4 5 6 8
失效费y/万元 3 4 5 6 7
根据上表数据,计算y与x的相关系数,并说明y与x的线性相关程度的强弱.(已知若,则认为y与x线性相关程度较强;若,则认为y与x线性相关程度一般;若,则认为y与x线性相关程度较弱)
附:
知识点109 一元线性回归模型及其应用
回归教材
常用结论 1. 对于满足一元线性回归模型的两个变量的n对样本数据 , 其中 , , , . 2. 观测值减去预测值所得的差称为残差.
教材素材变式
1[入B选必二PI21习题4-3A第1,3题变式]
下列说法正确的是()
A. 两个具有线性相关关系的变量的相关程度越强,其相关系数的值越接近于1
B. 经验回归方程为 时, 变量 和 负相关
C. 在经验回归方程 中, 当 每增加 1 个单位时, 相应观测值 增加 0.5 个单位
D. 由样本数据得到的经验回归直线 至少经过点 , , , 中的一个
2[多选][苏教选必二P187本章测试第6题变式]为研究某种材料的抗震强度y与抗压强度x的关系,某研究部门得到下表中的样本数据.若y与x具有线性相关关系,且经验回归方程为,则下列说法正确的是()
140 150 170 180 195
23 24 26 28 28
A.
B. 当x增加1个单位时,y增加约0.1个单位
C. 与x正相关
D. 若抗压强度为 220, 则抗震强度一定是 31.1
变式探究
[多选]已知变量x,y的取值情况如表所示,从散点图分析可知y与x线性相关,如果经验回归方程为,则下列说法正确的是()
x 0 1 2 3 4
y 2.3 4.3 4.4 4.8 m
A. 的值为 6.2
B. 经验回归直线必过点(2,4.4)
C. 样本点(4,)处的残差为-0.14
D. 将此表中的数据(2,4.4)去掉后,样本相关系数不变
3[入B选必二P128复习题C组第1题变式]某小微企业对其产品研发的年投入金额x(单位:万元)与其年销售量y(单位:万件)的数据进行统计.整理后得到如下统计表.
1 5 7 8 9
2 3 6 8 11
0.7 1.1 1.8 2.1 2.4
(1)公司拟分别用①和②两种模型作为年销售量y关于年投入金额x的回归分析模型,根据上表数据,分别求出两种模型的经验回归方程:
(2)统计学中常通过残差的平方和比较两个模型的拟合效果,若模型①和②的残差的平方和分别为9.9和4.2,请在①和②中选择拟合效果更好的模型,并估计当年投入金额为10万元时的年销售量.
参考公式: 对于一组数据 (), 其经验回归直线 的斜率和截距的最小二乘
估计分别为 , .
参考数据: , . .
知识点110列联表与独立性检验
回归教材
教材素材变式
[一题多变][人A选必三P135习题8.3第8题变式]
变式1变设问[多选]为了提高学生体育锻炼的积极性,某中学需要了解性别与学生对体育锻炼的喜好是否有关系,因此对学生是否喜欢体育锻炼进行调查,得到下表:
附:,n=a+b+c+d.
已知男生喜欢体育锻炼的人数占男生人数的,女生喜欢体育锻炼的人数占女生人数的,则下列说法正确的是()
A.列联表中的值为120,的值为180
B.随机对一名学生进行调查,此学生有90%的可能喜欢体育锻炼
C. 根据小概率值 的独立性检验,认为学生的性别与其对体育锻炼的喜好有关系,此推断犯错误的概率不超过 0.01
D. 根据小概率值 的独立性检验,认为学生的性别与其对体育锻炼的喜好无关
变式2变情境某购物网站为了了解人们网购的频率,从年龄在18~65岁的人群中随机调查了100人.根据调查数据,得到如下2×2列联表:
经常网购 不经常网购 合计
45岁以下(含45岁) 50
45岁以上 35
合计 40
补充完整题中的列联表,并依据小概率值的独立性检验,分析以45岁为分界点对网购的频率是否有差异.
参考公式:,其中.
参考数据:
知识点108 成对数据的统计相关性
1.答案:D
解析:线性相关系数的绝对值越接近0,线性相关程度越弱。D图中散点分布最分散,线性相关性最弱,故相关系数最小。
变式探究
答案:AD
解析:
去掉离群点D后,数据更集中,拟合效果变好,残差平方和变小(A正确)。
相关系数r的绝对值趋近于1,即r变大,解释变量与响应变量相关性变强(D正确),决定系数R 变大(C错误)。
2.答案:D
解析:去掉离群点E后,数据线性相关性增强,相关系数r >r >0,回归系数
b >b ,决定系数R >R (D错误)。
3.解:计算均值:,。

,。
,线性相关程度较强。
知识点109 一元线性回归模型及其应用
1.答案:B
解析:
A项:正相关r接近1,负相关r接近-1,错误。
B项:回归方程斜率-0.7<0,x与y负相关,正确。
C项:x每增加1单位,预测值y增加0.5单位,观测值不一定,错误。
D项:回归直线必过,不一定过样本点,错误。
2.答案:BC
解析:
计算,,代入回归方程,得,A错误。
斜率0.1>0,x与y正相关,x增加1单位y约增0.1单位(B、C正确)。
D项:预测值非确定值,错误。
变式探究
答案:AB
解析:
,,代入回归方程,解得,A正确。
回归直线过,B正确。
样本点(4,6.2)的预测值为,残差=6.2-6.06=0.14,C错误。
去掉(2,4.4)后,相关性可能改变,D错误。
3.解:(1) 模型①:
o,,,,,方程为。
模型②:设,,,,,,,方程为。
(2) 模型②残差平方和4.2<9.9,拟合更好。当x=10时,万件。
知识点110 列联表与独立性检验
变式1
答案:AC
解析:
男生总人数,故;女生总人数,故(A错误,文档可能数据有误,假设p=80)。
喜欢体育锻炼的总人数,占比,B错误。
列联表为:
喜欢 不喜欢 合计
男生 280 120 400
女生 120 80 200
合计 400 200 600
o,故在α=0.01下认为性别与喜好有关(C正确),α=0.001下,认为无关(D正确)。
变式2
解:列联表补充:
经常网购 不经常网购 合计
45岁以下 25 25 50
45岁以上 15 35 50
合计 40 60 100

根据α=0.05的独立性检验,认为以45岁为分界点对网购频率有差异。第九章 统计与成对数据的统计分析
第二节 用样本估计总体
知识点107 用样本估计总体
回归教材
课标要求 1.能用样本估计总体的集中趋势参数(平均数、中位数、众数)、离散程度参数(标准差、方差、极差), 理解集中趋势参数、离散程度参数的统计含义.2.能用样本估计百分位数.理解百分位数的统计含义.
教材素材变式
第1题[选择题][人A必修二P210变式]
某班级50名学生数学成绩的频率分布直方图呈右偏态分布,则下列说法正确的是( )
A. 众数 < 中位数 < 平均数
B. 平均数 < 中位数 < 众数
C. 三者大小关系无法确定
D. 众数 = 中位数 = 平均数
变式探究
下列说法正确的是()
A. 众数可以准确地反映出总体的情况
B. 一组数据的平均数一定大于这组数据中的每个数
C. 平均数与中位数都有局限性,都不能准确地反映出总体的情况.
D. 一组数据的方差越大,说明这组数据的波动越小
第2题[单选题][人B必修二P91变式]
对于数据集{2,3,3,7,9,10,12},下列说法正确的有( )
A. 第80百分位数为10.5
B. 方差小于8
C. 众数不唯一
D. 去掉最大值后中位数不变
第3题[填空题][苏教必修二P268变式]
已知15个数据的上四分位数为28,若新增两个数据30和32,则新数据集的上四分位数是______。
变式探究
已知一组数据 1,2,3,4, 的上四分位数是 ,则 的取
值范围为()
A. B. C. D.
第4题[多选题][人A必修二P209练习第3题变式]
从某厂生产的1000个零件中随机抽取10个测量直径(mm):
15.2,15.1,15.0,15.1,15.2,15.0,14.9,15.1,15.2,14.8
去掉最小值和最大值后,新样本( )
A. 平均数增大
B. 中位数不变
C. 标准差减小
D. 极差变为0.3
变式探究
有一组样本数据,其中是最小值,是最大值,则()
A. 的平均数等于 的平均数
B. 的中位数等于 的中位数
C. 的标准差不小于 的标准差
D. 的极差不大于 的极差
第5题[解答题][苏教必修二P255变式]
某校高一、高二学生数学成绩的方差分别为16和25,现按1:2比例分层抽样,共抽取90人,样本方差为21.5。估算该校总体方差。
变式1
将两组数据合并:甲组{5,7,9}(均值7,方差8/3),乙组{6,8,10}(均值8,方差8/3),则合并后的方差为( )
A. 11/3 B. 4 C. 13/3 D. 14/3
变式2
若一组样本数据 的平均数为 10, 另一组样本数据 的方差为 8, 则两组样本数据合并为一组样本数据后的平均数和方差分别为()
A. 17.54 B. 17.48 C. 15.54 D. 15.48
第6题2024 新课标Ⅱ卷 [人B必修二P84例2变式]
某农业研究部门在面积相等的100块稻田上种植一种新型水稻,得到各块稻田的亩产量(单位:kg)并整理得下表:
亩产量 [900,950) [950,1000) [1000,1050)
频数 6 12 18
亩产量 [1050,1100) [1100,1150) [1150,1200)
频数 30 24 10
根据表中数据,下列结论中正确的是()
A. 100块稻田亩产量的中位数小于1050 kg
B. 100块稻田中亩产量低于1100 kg的稻田所占比例超过80%
C. 100块稻田亩产量的极差介于200 kg至300 kg之间
D. 100块稻田亩产量的平均值介于900 kg至1000 kg之间
第7题[多选题][苏教必修二P250变式]
某次考试频率直方图显示:组距10,[70,80)频率0.3,[80,90)频率0.4。则( )
A. 成绩<75的约占15%
B. 众数在[80,90)
C. 若"A+"为前10%,阈值约90分
D. 平均分估计为82
多维探究[解答题][2024调研题]
某市统考成绩直方图显示:a=0.02,[50,60)频数40。
(1) 求总考生数;
(2) 估计第85百分位数;
(3) 按城乡4:1比例抽取20人座谈,求农村应抽人数。
第1题
答案:A
解析:右偏态分布中,数据左侧密集、右侧拖尾,平均数受较大值影响向右偏移,中位数次之,众数位于峰值处,故三者关系为众数<中位数<平均数。
变式探究
答案:C
解析:平均数和中位数均有局限性,无法准确反映总体,C正确;方差越大波动越大,D错误。
第2题
答案:D
解析:
A项:7×80%=5.6,第80百分位数为第6个数12,A错误。
B项:计算得方差≈11.14,B错误。
C项:众数唯一为3,C错误。
D项:原中位数为7,去掉12后仍为7,D正确。
第3题
答案:30
解析:原15个数据上四分位数位置为12th,新增后17个数据位置为13.5th,即第13、14个数的平均数。新增30、32后,排序后第13、14个数均为30,故上四分位数为30。
变式探究
答案:C
解析:5个数上四分位数位置为3.75(第4个数),排序后第4个数为,故。
第4题
答案:BCD
解析:
去掉14.8和15.2后,平均数从15.06变为15.075(A错),中位数仍为15.1(B正确),标准差从0.13降至0.08(C正确),极差从0.4变为0.3(D正确)。
变式探究
答案:BD
解析:去掉首尾后,中位数不变(B正确),极差≤原极差(D正确),标准差减小(C错误)。
第5题
解:高一30人,高二60人。
总体方差公式:(其中为组均值与总均值差),反推得。
变式探究
变式1
答案:A
解析:总均值=(7×3+8×3)/6=7.5,方差=。
变式2
答案:A
解析:第二组平均数24,方差8=4×原方差→原方差2。合并后平均数17,方差=54。
第6题
答案:C
解析:
A项:前4组频数和为66>50,中位数在[1050,1100),>1050kg,A错误。
B项:<1100kg的频数和为66,占比66%<80%,B错误。
C项:极差介于1150-950=200kg至1200-900=300kg,C正确。
D项:平均值=1078kg,介于1000-1100kg,D错误。
第7题
答案:ABD
解析:
A项:[70,75)频率0.15,<75占15%,A正确。
B项:[80,90)频率最高,众数在此区间,B正确。
C项:前10%阈值在[80,90),计算得≈88分,C正确。
D项:平均分=75×0.3+85×0.4+95×0.3=82,D正确。
多维探究
解:总人数=40÷(0.02×10)=200人。
85%位置=170,累计频率至[80,90)区间,计算得86分。
农村应抽20×1/5=4人。第九章 统计与成对数据的统计分析
第一节 随机抽样、统计图表
知识点104 抽样方法
回归教材
教材素材变式
第1题[选择题][人B必修二P90习题5-1A第1题变式]
某班级有50名学生,现采用随机数法抽取5名学生参加活动。已知随机数表如下(部分):
16 22 77 94 39 49 54 43 54 82 17 37 93 23 78 87 35 20 96 43
若从第1行第1列开始向右读取,则选中的第3个学生的编号是( )
A. 16 B. 22 C. 77 D. 94
第2题[多选题][人B必修二P63练习B第2题变式]
某校有高一学生600人,高二500人,高三400人。现采用分层随机抽样调查学生视力情况,下列说法正确的是( )
A. 若样本量为30,则高一抽取12人
B. 每个学生被抽到的概率相等
C. 若高二某层男生比例为60%,则样本中男生数必为30人
D. 可直接用简单随机抽样替代分层抽样
第3题[选择题][人A必修二P189习题9.1第5题变式]
某工厂甲、乙、丙车间产量比为3:2:1,现用分层抽样抽取12件产品。若乙车间抽到4件,则总样本容量为( )
A. 12 B. 18 C. 24 D. 36
第4题[选择题][人A必修二P185练习第3题变式]
某市A、B两区人口数比为2:3,人均收入分别为5000元、6000元。若采用分层抽样,且A区样本平均数为5200元,则B区样本平均数为( )
A. 6000元 B. 6200元 C. 5800元 D. 5500元
知识点105 条形图、折线图、扇形图、雷达图
回归教材
扇形图主要用于直观描述各类数据占总数的比例;折线图主要用于描述数据随时间的变化趋势;条形图主要用于直观描述不同类别或分组数的频数和频率。
教材素材变式
第1题[选择题][人B必修二P92变式]
如图,这是某款新能源汽车在速度、稳定性、安全性、易用性、续航能力这五个方面的综合评分的雷达图,则下列结论正确的是()
A. 这款新能源汽车在速度方面的综合评分高于稳定性方面的综合评分
B.这款新能源汽车在速度方面的综合评分高于易用性方面的综合评分
C. 这款新能源汽车在安全性方面的综合评分在这五个方面的综合评分中最低
D.这款新能源汽车在易用性方面的综合评分在这五个方面的综合评分中最高
第2题[选择题][沪教必修三P157习题13.4B组第1题变式]
某校为了解高三年级学生在线学习情况,统计了2020年4月18日~27日(共10天)学生在线学习人数及其增长比例数据,并制成如图所示的条形图与折线图的组合图.
根据组合图判断,下列结论正确的是()
A. 这10天学生在线学习人数的增长比例在逐日减小
B. 前5天在线学习人数的方差大于后5天在线学习人数的方差
C. 这10天学生在线学习人数在逐日增加
D. 前5天在线学习人数增长比例的极差大于后5天在线学习人数增长比例的极差
第3题[选择题][苏教必修二P236例1变式]
2024年3月, 树人中学组织三个年级的学生进行党史知识竞赛. 经统计, 得到前200名学生分布的饼状图(如图)和前200名中高一学生排名分布的频率条形图(如图), 则下列命题错误的是()
A. 成绩前200名的200人中,高一人数比高二人数多30人
B. 成绩第1-100名的100人中,高一人数不超过一半
C. 成绩第1-50名的50人中,高三最多有32人
D. 成绩第51-100名的50人中,高二人数比高一的多
第4题[多选题][苏教必修二P271变式]
某市两校学生视力达标率统计如下表,正确结论有( )
学校 男生达标率 女生达标率
甲校 78% 82%
乙校 85% 76%
A. 甲校女生达标率高于男生
B. 乙校男生达标率比甲校高7%
C. 两校女生达标率总和高于男生
D. 乙校总体达标率可能低于甲校
第5题[多选题][苏教必修二P238变式]
反映某种股票的涨跌情况,应选择()
A.条形图
B.折线图
C. 扇形图
D. 三种图均可
第6题[选择题][苏教必修二P238变式]
已知2015—2022年和2023年1~9月某新能源汽车企业的营业收入(单位:亿元)和净利润(单位:亿元)及2015—2022年营业收入的增长率的统计图如图所示,2023年第二、三、四季度的净利润相比上一季度的增长率均为10%,则下列结论正确的是()
A. 2015—2022年该企业年营业收入逐年增加
B. 2015—2022年该企业年营业收入增长率最大的是2015年
C. 2022年该企业年净利润超过2017—2021年年净利润总和
D. 2023年第四季度的净利润比第一季度的净利润多约30亿元
知识点106 频率分布直方图
回归教材
运用频率分布直方图的注意事项:
(1) 小长方形的面积 = 组距×频率组距 = 频率;
(2) 各小长方形的面积之和等于;
(3) 频数样本容量 = 频率,此关系式的变形为频数频率 = 样本容量,样本容量×频率 = 频数;
(4) 在频率分布直方图中,各小长方形的面积之比等于频率之比,各小长方形的高度之比也等于频率之比。
教材素材变式
第1题 [选择题] [人A必修二P198练习第1题变式]
题目:
某校对全校300名学生的数学成绩进行统计,得到如图所示的频率分布直方图,则这些同学的数学成绩大于等于60分的人数为( )
A. 270 B. 255 C. 180 D. 150
第2题 [解答题] [人A必修二P198练习第3题变式]
题目:
某校高三年级进行了一次数学竞赛,成绩统计如下表(部分数据缺失):
问题:
(1) 补全表格中的 ;
(2) 若全校共有1200名学生,试估计成绩在[80,90)分的学生人数。
变式探究 [解答题]
题目:
某市政府为了倡议市民节约用电,计划对居民生活用电费用实施阶梯式电价制度,即确定一户居民月用电量标准,用电量不超过的部分按照平价收费,超出部分按照议价收费.为了确定一个合理的标准,从某小区抽取了户居民进行月用电量(单位:)调查,并绘制了如图所示的频率分布直方图.
(1) 求图中的值;
(2) 若使居民用户的电费支出不受影响,应确定值为多少?
知识点104 抽样方法
第1题
答案:C
解析:从随机数表第1行第1列开始向右读取两位数,有效编号为16、22、77(77≤50),故第3个选中的编号为77。
第2题
答案:AB
解析:
A. 高一抽取人数为,正确;
B. 分层抽样中每个学生被抽到的概率均为,正确;
C. 高二样本量为,男生数为,非必然30人,错误;
D. 总体差异明显,分层抽样更精确,错误。
第3题
答案:A
解析:乙车间抽到4件,占比,总样本量。
第4题
答案:B
解析:设B区样本平均数为,总体平均数为,由分层抽样平均数公式:,解得。
知识点105 统计图表
第1题(雷达图)
答案:A
解析:雷达图中速度评分高于稳定性评分,A正确;速度与易用性评分相近,B错误;安全性评分非最低,C错误;续航能力评分最高,D错误。
第2题(条形图+折线图)
答案:C
解析:增长比例非逐日减小,A错误;前5天人数波动小,方差小于后5天,B错误;人数逐日增加,C正确;前5天增长比例极差小于后5天,D错误。
第3题(饼状图+条形图)
答案:D
解析:高一人数比高二多,A正确;前100名中高一人数≤,B正确;前50名中高三最多,C正确;51-100名中高一人数,高二人数,相等,D错误。
第4题(表格)
答案:ABD
解析:甲校女生达标率82%>男生78%,A正确;乙校男生达标率比甲校高85%-78%=7%,B正确;两校女生达标率总和82%+76%=158%,男生78%+85%=163%,C错误;乙校总体达标率可能低于甲校,D正确。
第5题(股票涨跌)
答案:B
解析:折线图更适合展示数据变化趋势,选B。
第6题(统计图)
答案:B
解析:2020年营业收入下降,A错误;2015年增长率50.57%最大,B正确;2022年净利润42.3亿元<2017-2021年总和28.2+27.8+40.7+30.5+16.1=143.3,C错误;2023年第一季度净利润16.1亿元,第四季度为,多约5.7亿元,D错误。
知识点106 频率分布直方图
第1题
答案:B
解析:成绩≥60分的频率为,由,得,故≥60分频率为,人数。
第2题
解:(1)
分数段 频数 频率
[50,60) 10 0.05
[60,70) 40 0.20
[70,80) a=50 b=0.25
[80,90) 60 0.30
[90,100] 20 0.10
总计 200 1.00
[60,70)频数=200×0.2=40;[70,80)频率=1-0.05-0.2-0.3-0.1=0.25,频数=200×0.25=50;[80,90)频数=200×0.3=60。
(2) 全校成绩在[80,90)的人数≈1200×0.3=360。
变式探究
解:(1)由,解得。
(2)前4组频率和为,前5组频率和为,85%对应的组为[200,250),设,则,解得,故。

展开更多......

收起↑

资源列表