资源简介 能力专题16 数据处理能力探究1:利用统计图表进行数据处理【典例剖析】例1. (2022·湖南省·月考) 某地区高考实行新方案,规定:语文、数学和英语是必考科目,考生还须从物理、化学、生物、历史、地理和政治六个科目中选取三个科目作为选考科目.若一名考生从六个科目中选出了三个科目作为选考科目,则称该考生的选考方案确定;否则,称该考生的选考方案待确定.例如,考生甲选择“物理、化学和生物”三个选考科目,则考生甲的选考方案确定,“物理、化学和生物”为其选考方案.某校为了解高一年级名学生选考科目的意向,随机选取名学生进行调查,统计选考科目人数如下表:性别 选考方案确定情况 物理 化学 生物 历史 地理 政治男生 选考方案确定的有人选考方案待确定的有人女生 选考方案确定的有人选考方案待确定的有人Ⅰ估计该校高一年级确定选考化学的学生人数,并给出选考方案确定的名男生中具体的选科组合及其相应人数;Ⅱ从选考方案确定的名男生中随机选出名,求这名男生的选考方案不同的概率;Ⅲ若以该校高一学生的选考情况估计该市所有高一学生的选考情况,则在全市选考方案确定的女生中任选人,记这人中选考物理的人数为,求的分布列以及数学期望.【变式训练】练1-1.(2022·湖北省·月考) 自中华人民共和国成立以来,我国共进行了七次全国人口普查,下图为我国历次全国人口普查人口性别构成及总人口性别比以女性为,男性对女性的比例统计图,则下列说法正确的是A. 近三次全国人口普查总人口性别比呈递减趋势B. 我国历次全国人口普查总人口数呈逐次递减C. 第五次全国人口普查时,我国总人口数已经突破亿D. 第七次全国人口普查时,我国总人口性别比最高练1-2. (2022·全国·联考) 多年来,某市持续推动创建文明城市工作,通过净化出行环境,改造生活设施,扩建园林绿化等,空气质量稳步提升如图是空气质量指数与相应等级对照表以及该市月日至第二年月日的空气质量指数图,下面结论中不正确的是( )A. 月上旬的空气质量等级总体优于月下旬的空气质量B. 月上旬空气质量指数比月下旬的波动性更大C. 以上天中月日空气质量等级为优,空气质量最佳D. 以上天中空气质量指数的中位数对应的等级为良练1-3. (2022·湖北省黄冈市·模拟) 农村饮水安全是关系亿万农民切身利益的大事,为了实现全国农村自来水村村通的目标,国家将继续加大农村饮水安全工程投入某农村为了保证饮水充足,建立了甲、乙两个蓄水池,并统计了两蓄水池年月平均水深的相关数据,得到如下折线图,则下列描述中错误的是( )A. 甲蓄水池前个月的月平均水深高于米B. 甲蓄水池的月平均水深的最大值小于乙蓄水池的月平均水深的最大值C. 甲蓄水池年平均水深大于乙蓄水池年平均水深D. 甲蓄水池月平均水深的方差大于乙蓄水池月平均水深的方差练1-4. (2022·北京市·模拟) ,,三个班共有名学生,为调查他们的体育锻炼情况,通过分层抽样获得了部分学生一周的锻炼时间,数据如表单位:小时:班 班 班 Ⅰ试估计班的学生人数;Ⅱ从班和班抽出的学生中,各随机选取一个人,班选出的人记为甲,班选出的人记为乙.假设所有学生的锻炼时间相对独立,求该周甲的锻炼时间比乙的锻炼时间长的概率;Ⅲ再从,,三班中各随机抽取一名学生,他们该周锻炼时间分别是,,单位:小时,这个新数据与表格中的数据构成的新样本的平均数记为,表格中数据的平均数记为,试判断和的大小.结论不要求证明【规律方法】熟练掌握常见的柱状图、条形图、折线图、雷达图、频率分布直方图、等高条形图等图表,从统计图表中收集数据、整理数据,提取信息,进行推断,得出结论。探究2:回归分析和独立性检验中的数据处理【典例剖析】例2. (2022·广东·联考) 手机芯片是一种硅板上集合多种电子元器件实现某种特定功能的电路模块,是电子设备中最重要的部分,承担着运输和存储的功能.某公司研发了一种新型手机芯片,该公司研究部门从流水线上随机抽取件手机芯片,统计其性能指数并绘制频率分布直方图如图:产品的性能指数在的称为类芯片,在的称为类芯片,在的称为类芯片,以这件芯片的性能指数位于各区间的频率估计芯片的性能指数位于该区间的概率.Ⅰ在该流水线上任意抽取件手机芯片,求类芯片不少于件的概率;Ⅱ该公司为了解年营销费用单位:万元对年销售量单位:万件的影响,对近年的年营销费用和年销售量数据做了初步处理,得到的散点图如图所示.利用散点图判断,和其中,为大于的常数哪一个更适合作为年营销费用和年销售量的回归方程类型只要给出判断即可,不必说明理由;对数据作出如下处理:令,,得到相关统计量的值如下表:根据的判断结果及表中数据,求关于的回归方程;由所求的回归方程估计,当年营销费用为万元时,年销量万件的预报值.参考数据:参考公式:对于一组数据,,,,其回归直线的斜率和截距的最小二乘估计分别为,【变式训练】练2-1.(2022·湖北省·模拟) 某高科技企业为确定下一年度投入某种产品的研发费用,需了解年研发费用单位:千万元对年销售量单位:千万件的影响,统计了近年投入的年研发费用与年销售量的数据,经分析数据发现用函数其中,均为大于的常数拟合效果较好,并对数据作出如下处理,得到相关统计量的值如下表所示:其中,根据数据预测投人的年研发费用为亿元时的年销售量为( )参考数据及公式:,,,A. 亿件 B. 亿件 C. 亿件 D. 亿件练2-2.(2022·浙江省·联考) 在新高考改革中,浙江省新高考实行的是选的模式,即语数外三门为必考科目,然后从物理、化学、生物、政治、历史、地理、技术含信息技术和通用技术门课中选考门.某校高二学生选课情况如下列联表一和列联表二单位:人选物理 不选物理 总计 选生物 不选生物 总计男生 男生女生 女生总计 总计 表一 表二试根据小概率值的独立性检验,分析物理和生物选课与性别是否有关( )附:,.A. 选物理与性别有关,选生物与性别有关 B. 选物理与性别无关,选生物与性别有关C. 选物理与性别有关,选生物与性别无关 D. 选物理与性别无关,选生物与性别无关练 2-3. (2022·全国·联考) 某学校为了调查高中男生和女生在英语单词记忆能力上是否存在差异,从高一年级选取了名同学,其中男女生各人,调查他们一周内能准确记忆的单词量单位:个,将所得数据从小到大排列如下:男生:女生:根据上述数据判断哪个群体在一周内准确记忆的单词量更大,请说明理由.记这名同学在一周内准确记忆的单词量的中位数为,将这人中单词量超过的记为“优秀”,不超过的记为“一般”,完成下面的列联表,依据的独立性检验,能否认为男生女生的单词记忆能力有差异?单位:人性别 单词记忆能力 合计优秀 一般男生女生合计附:,练 2-4. (2022·山东省滨州市·月考) 某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的甲,乙两种新的生产方式.为比较两种生产方式的效率,选取名工人,将他们随机分成两组,每组人,第一组工人用甲种生产方式,第二组工人用乙种生产方式.根据工人完成生产任务的工作时间单位:绘制了如表格:完成任务工作时间甲种生产方式 人 人 人 人乙种生产方式 人 人 人 人将完成生产任务所需时间超过和不超过的工人数填入如表的列联表:生产方式 工作时间 合计超过 不超过甲乙合计根据中的列联表,依据小概率值的独立性检验,能否认为甲,乙两种生产方式的效率有差异?若从完成生产任务所需的工作时间在的工人中选取人去参加培训,设为选出的人中采用甲种生产方式的人数,求随机变量的分布列和数学期望.附:,.【规律方法】数据处理能力要求运用基本的统计方法对数据进行整理和分析,如建立一元线性回归模型,并利用统计图表和回归模型解释和预测随机现象;分析两个分类变量的独立性,并建立独立性检验的方法进行统计推断。要求学生关注时事,能通过对数据的分析、整理从中抽取对研究问题有用的信息,利用概率思想或统计思想分析和解决问题。能力专题16 数据处理能力——答案与解析例1.【解析】解:Ⅰ高一年级确定选考化学的学生有,选科组合为“物理、化学、生物”的共人,选科组合为“物理、化学、历史”的共人,选科组合为“物理、化学、地理”的共人,选科组合为“物理、化学、政治”的共人;Ⅱ概率为Ⅲ由题意得,所以,,,,,,故的分布列为:数学期望. 练1-1.【答案】A 【解析】解:由图可知,近三次全国人口普查总人口性别比逐次下降,呈递减趋势,故选项A正确; 由图可知,我国历次全国人口普查男女人数逐次递增,即总人口数呈逐次递增,故选项B错误; 由图可知,第五次普查为年,该年的人口数低于亿,故选项C错误; 由图可知,第七次普查时,我国总人口性别比最低,故选项 D错误. 练1-2.【答案】B 【解析】解:因为空气质量指数越高,质量等级越低,故月上旬的空气质量等级总体优于月下旬空气质量等级,故A正确;B.因为月下旬空气质量有优,良,轻度污染,中度污染,空气质量波动较大,月上旬除日外空气质量指数都在以下以上,空气质量为良,波动较小,故B错误;C.以上天中月号空气质量指数为,则空气质量等级为优,空气质量最佳,故C正确;D.以上天空气质量指数的中位数为,对应的等级为良,故D正确.故选B.练1-3.【答案】AC 【解析】解:由折线图可知,甲蓄水池在前三个月的月平均水深低于米,故 A错误;甲,乙蓄水池都在月取得月平均水深的最大值,故甲蓄水池的月平均水深的最大值小于乙蓄水池的月平均水深的最大值,故B正确;乙蓄水池月平均水案的折线图多在甲蓄平水池月平均水深的折线图的上方,故甲蓄水池年平均水深小于乙蓄水池年平均水深,故 C错误;由折线图走势可知,甲蓄水池的月平均水深波动比乙蓄水池的月平均水深波动大,故甲蓄水池月平均水深的方差大于乙蓄水池月平均水深的方差,故 D正确.故选AC.练1-4.【解析】解:Ⅰ由题意得:三个班共抽取个学生,其中班抽取个,故抽样比为,故C班有学生人,Ⅱ从班和班抽出的学生中,各随机选取一个人,共有种情况,而且这些情况是等可能发生的,当甲锻炼时间为时,甲的锻炼时间比乙的锻炼时间长有种情况;当甲锻炼时间为时,甲的锻炼时间比乙的锻炼时间长有种情况;当甲锻炼时间为时,甲的锻炼时间比乙的锻炼时间长有种情况;当甲锻炼时间为时,甲的锻炼时间比乙的锻炼时间长有种情况;当甲锻炼时间为时,甲的锻炼时间比乙的锻炼时间长有种情况;故该周甲的锻炼时间比乙的锻炼时间长的概率为;Ⅲ. 例2.【解析】解:Ⅰ由频率分布直方图,、、类芯片所占频率分别为,,,取出类芯片的概率为,设“抽出类芯片不少于件”为事件, Ⅱ用更适合; ,令,,则,,由表中数据可得,,则,所以,,即,因为,所以 当,.所以年销售量的预报值为万件. 练2-1.【答案】A 【解析】解:令,建立关于的经验回归方程,,,所以关于的经验回归方程为,因此关于的回归方程为,当时,千万件亿件.练2-2.【答案】C 【解析】解:选物理:,所以选物理与性别有关,选生物:,所以选生物与性别无关,故选C.练2-3.【解析】解:根据题意,男生的数据为 ,其平均数,女生的数据为 ,其平均数,则有,故女生在一周内准确记忆的单词量更大;根据题意,这名同学在一周内准确记忆的单词量的中位数为,则,则列联表如图:性别 单词记忆能力 合计优秀 一般男生女生合计零假设为:分类变量性别和单词记忆能力相互独立,即男生女生的单词记忆能力没有差异,则有,故依据小概率值的独立性检验,推断出不成立,即可以认为男生女生的单词记忆能力有差异,此推断犯错误的概率不大于. 练2-4.【解析】解:由题意可得,列联表如下:生产方式 工作时间 合计超过 不超过甲乙合计假设:甲,乙两种生产方式的效率无差异,根据中列联表中的数据,经计算得到,依据小概率值的独立性检验,我们推断不成立,即认为甲,乙两种生产方式的效率有差异,此推断犯错误的概率不大于.由题意知,随机变量的所有可能取值为,,,,,,故的分布列为:. 2 展开更多...... 收起↑ 资源预览