资源简介 统计与统计案例用样本估计总体、统计图表命题角度:(1)扇形图;(2)折线图;(3)条形图和直方图;(4)用样本估计总体.典例1 (2023·新高考Ⅱ卷T19)某研究小组经过研究发现某种疾病的患病者与未患病者的某项医学指标有明显差异,经过大量调查,得到如下的患病者和未患病者该指标的频率分布直方图: 利用该指标制定一个检测标准,需要确定临界值c,将该指标大于c的人判定为阳性,小于或等于c的人判定为阴性,此检测标准的漏诊率是将患病者判定为阴性的概率,记为p(c);误诊率是将未患病者判定为阳性的概率,记为q(c).假设数据在组内均匀分布,以事件发生的频率作为相应事件发生的概率.(1)当漏诊率p(c)=0.5%时,求临界值c和误诊率q(c);(2)设函数f (c)=p(c)+q(c).当c∈[95,105]时,求f (c)的解析式,并求f (c)在区间[95,105]的最小值.命题立意 信息提取本题以流行病研究为背景,考查频率分布直方图的相关计算、函数的解析式及最值,体现了数据分析、数学运算等核心素养,属于生活实践情境和探索创新情境融合试题. (1)由频率分布直方图可知,样本中患病者的指标区间分别为[95,100),[100,105),[105,110),[110,115),[115,120),[120,125),[125,130],对应的分别为0.002,0.012,0.034,0.036,0.040,0.040,0.036;未患病者的指标区间分别为[70,75),[75,80),[80,85),[85,90),[90,95),[95,100),[100,105],对应的分别为0.038,0.040,0.040,0.036,0.034,0.010,0.002. (2)确定临界值c,指标大于c判定为阳性,小于或等于c判定为阴性. (3)漏诊率是将患病者判定为阴性的概率,记为p(c),误诊率是将未患病者判定为阳性的概率,记为q(c). (4)f (c)=p(c)+q(c),c∈[95,105].思维拆解 解题思路 名师点拨(1)第1步:求c的值. 第2步:求q(c). 解:(1)由题图知(100-95)×0.002=1%>0.5%, 所以95<c<100, 设X为患病者的该指标, 则p(c)=P(X≤c)=(c-95)×0.002=0.5%, 解得c=97.5. 设Y为未患病者的该指标, 则q(c)=P(Y>c)=(100-97.5)×0.01+5×0.002=0.035=3.5%. (1)易错:频率分布直方图中,易误以为纵坐标是频率.(2)第1步:求f (c)的解析式. 第2步:根据一次函数的单调性求最小值. (2)当c∈[95,100]时, f (c)=p(c)+q(c)=(c-95)×0.002+(100-c)×0.01+5×0.002=-0.008c+0.82≥0.02; 当c∈(100,105]时, f (c)=p(c)+q(c)=5×0.002+(c-100)×0.012+(105-c)×0.002=0.01c-0.98>0.02. 故f (c)= 所以f (c)在区间[95,105]的最小值为f (100)=0.02. (2)要结合问题背景,理解图表意义. (3)从频率分布直方图中正确读取相关数据是求解问题的关键. (4)注意分类讨论思想的应用. (5)对于一次函数y=kx+b(k≠0),当k>0时,函数单调递增;当k<0时,函数单调递减.归纳总结:频率分布直方图中的常用结论 (1)最高的小长方形底边中点的横坐标即为众数. (2)中位数左边和右边的小长方形的面积和相等. (3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和. (4)频率分布直方图中各小长方形的面积之和为1. (5)频率分布直方图中纵轴表示,故每组样本的频率为组距×,即小长方形的面积. (6)频率分布直方图中每组样本的频数为频率×总数.回归分析通过观测数据,进行回归分析,并预测结果.典例2 (2022·全国乙卷理T19文T19)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:m2)和材积量(单位:m3),得到如下数据:样本号i 1 2 3 4 5 6 7 8 9 10 总和根部横截 面积xi 0.04 0.06 0.04 0.08 0.08 0.05 0.05 0.07 0.07 0.06 0.6材积量yi 0.25 0.40 0.22 0.54 0.51 0.34 0.36 0.46 0.42 0.40 3.9(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为186 m2.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.附:相关系数.参考数值:≈1.377.命题立意 信息提取本题属于生活实践情境.以环境治理,将荒山改造成了绿水青山为背景.考查平均数、相关系数、样本估计总体,体现了数据分析、数学运算的核心素养. (1) (3)该林区所有树木的根部横截面积总和为186 m2,已知树木的材积量与其根部横截面积近似成正比. (4)相关系数 参考数值:≈1.377.思维拆解 解题思路 名师点拨(1)求平均数. (2)求相关系数. (3)估计该林区这种树木的总材积量的值. 解:(1)估计该林区这种树木平均一棵的根部横截面积==0.06, 估计该林区这种树木平均一棵的材积量==0.39. = = ≈0.01×1.377=0.013 77, 所以样本相关系数 (3)设该林区这种树木的总材积量的估计值为Y m3, 由题意可知,该种树木的材积量与其根部横截面积近似成正比,所以=, 所以Y==1 209, 即该林区这种树木的总材积量的估计值为1 209 m3. (1)计算相关系数r= 时需将分子、分母稍加变换,采用题设中给出的数据求解,即 (2)易错:对题意的理解不够,不能正确列出正比例关系式而失分.独立性检验通过临界值的判定,做到更精细的推断.典例3 (2024·全国甲卷理T17改编)某工厂进行生产线智能化升级改造.升级改造后,从该工厂甲、乙两个车间的产品中随机抽取150件进行检验,数据如下:优级品 合格品 不合格品 合计甲车间 26 24 0 50乙车间 70 28 2 100合计 96 52 2 150(1)填写如下列联表:优级品 非优级品甲车间乙车间依据小概率值α=0.05的独立性检验,能否认为甲、乙两车间产品的优级品率存在差异?依据小概率值α=0.01的独立性检验,能否认为甲、乙两车间产品的优级品率存在差异?(2)已知升级改造前该工厂产品的优级品率p=0.5.设为升级改造后抽取的n件产品的优级品率.如果>p+1.65,则认为该工厂产品的优级品率提高了.根据抽取的150件产品的数据,能否认为生产线智能化升级改造后,该工厂产品的优级品率提高了?(≈12.247)附:χ2=,n=a+b+c+d.α 0.050 0.010 0.001xα 3.841 6.635 10.828命题立意 审题指导本题以生产线智能化升级改造为背景,考查列联表,独立性检验,考查阅读理解能力,逻辑推理能力以及分析问题、解决问题的能力,综合性强,属于生活实践情境. 信息提取 思维导图(1)从该工厂甲、乙两个车间的产品中随机抽取150件进行检验,甲车间的优级品数量26件,合格品数量24件,不合格品数量0件,总共50件;乙车间的优级品数量70件,合格品数量28件,不合格品数量2件,总共100件. (2)升级改造前该工厂产品的优级品率p=0.5,为升级改造后抽取的n件产品的优级品率,如果>p+1.65,则认为该工厂产品的优级品率提高了. (1)补全列联表―→χ2―→与临界值表比较―→得解. (2)p+1.65―→与比较―→判断.思维拆解 解题思路 名师点拨(1)第1步:填写列联表. 第2步:根据公式求χ2. 第3步:根据χ2的值判断. (2)第1步:求出. 第2步:求出p+1.65· 的值. 第3步:由与p+1.65·的大小关系判断. 解:(1)列联表如下: 优级品非优级品甲车间2624乙车间7030χ2==4.687 5, 又3.841<χ2<6.635, 故依据小概率值α=0.05的独立性检验,认为甲、乙两车间产品的优级品率存在差异,依据小概率值α=0.01的独立性检验,不能认为甲、乙两车间产品的优级品率存在差异. (2)由题意得p=0.5,n=150,==, 则p+1.65=0.5+1.65≈0.57<=, 故生产线智能化升级改造后,该工厂产品的优级品率提高了. (1)χ2越大两分类变量无关的可能性越小,推断犯错误的概率越小. (2)关键:将给定的实际问题转化为对应的数学模型. (3)易错:对题意理解不够,数据分析能力不强易失分. 归纳总结:概率统计试题的综合性较强,对考生的阅读理解能力要求较高,解题时需要注意:(1)认真审题,理清已知条件中的信息; (2)分清所求与已知之间的关系; (3)注重对基本概念的理解,并加强知识间的整合能力,特别是加强对知识类交汇问题的求解能力,提升阅读理解能力.7/9 展开更多...... 收起↑ 资源预览