资源简介 统计一、选择题(本题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的)1.下列两个变量之间的关系是相关关系的是( )A.正方体的棱长和体积 B.单位圆中圆心角的度数和所对弧长C.学生的学籍号与学生的数学成绩 D.日照时间与水稻的亩产量2.在下列各散点图中,两个变量具有正相关关系的是( )3.已知变量x和y满足关系y=0.1x+2,变量y与z负相关.下列结论中正确的是( )A.x与y正相关,x与z负相关 B.x与y正相关,x与z正相关C.x与y负相关,x与z负相关 D.x与y负相关,x与z正相关4.在建立两个变量y与x的回归模型中,选择了4个不同的模型,模型1的相关系数为0.88,模型2的相关系数为0.66,模型3的相关系数为0.945,模型4的相关系数为0.51,其中拟合效果最好的模型是( )A.模型1 B.模型2C.模型3 D.模型45.实验测得四组(x,y)的值为(1,2),(2,3),(3,4),(4,5),则y与x之间的回归直线方程为( )A.=x+1 B.=x+2C.=2x+1 D.=x-16.某单位为了解夏季用电量与月份的关系,对本单位2021年5月份到8月份的日平均用电量y(单位:千度)进行了统计分析,得出下表数据:月份(x) 5 6 7 8日平均用电量(y) 1.9 3.4 t 7.1若y与x线性相关,且求得其线性回归方程=1.78x-7.07,则表中t的值为( )A.5.8 B.5.6C.5.4 D.5.27.某机构为研究中老年人坚持锻炼与患糖尿病、高血压、冠心病、关节炎四种慢性疾病之间的关系,随机调查部分中老年人,统计数据如表1至表4,则这四种慢性疾病可以通过坚持锻炼来预防的可能性最大的是( )A.糖尿病 B.高血压C.冠心病 D.患关节炎8.某地“两防”指挥部在汛期对当地一条河流进行监测,表(1)是最近几日该河流某段的水位情况.河流水位表(1)第x日 1 2 3 4 5 6 7水位y/米 3.5 3.7 3.8 3.9 4.3 4.4 4.8根据河流的堤防情况规定:水位超过一定高度将分别启动相应预警措施(见表(2)).水位预警分级表(2)水位 ≥4.7 ≥5.1 ≥5.6水位分类 设防水位 警戒水位 保证水位预警颜色 黄色 橙色 红色现已根据表(1)得到水位y关于x的回归直线方程为=0.21x+3.217,则( )A.第8日将启动橙色预警 B.第10日将启动红色预警C.第11日将启动红色预警 D.第12日将启动红色预警二、选择题(本题共3小题,每小题6分,共18分.在每小题给出的四个选项中,有多项符合题目要求.全部选对的得6分,部分选对的得部分分,有选错的得0分)9.对两组数据进行统计后得到的散点图如图所示,关于其线性相关系数的结论正确的是( )A.r1<0 B.r2>0C.|r1|>|r2| D.|r1|与|r2|的大小关系无法判断10.下列说法正确的是( )A.回归直线过样本点的中心()B.两个随机变量的线性相关性越强,则相关系数的绝对值就越接近于1C.对分类变量X与Y,随机变量χ2的值越大,则判断“X与Y有关系”的把握程度越小D.在回归直线方程=0.2x+0.8中,当解释变量x每增加1个单位时,预报变量平均增加0.2个单位11.在对吸烟与患肺病这两个分类变量的独立性检验中,下列说法正确的是( )(参考数据:P(χ2≥6.635)=0.01)A.若χ2≥6.635,我们有99%的把握认为吸烟与患肺病有关系B.若χ2≥6.635,那么在100个吸烟的人中约有99人患有肺病C.从独立性检验可知,如果有99%的把握认为吸烟与患肺病有关系时,那么我们就认为:每个吸烟的人有99%的可能性会患肺病D.从统计量中得知有99%的把握认为吸烟与患肺病有关系时,是指有1%的可能性使推断出现错误三、填空题(本题共3小题,每小题5分,共15分.)12.为了探究电离辐射的剂量与人体的受损程度是否有关,用两种不同剂量的电离辐射照射小白鼠(可用小白鼠模拟人体受损程度).在照射后14天内的结果如表所示:死亡 存活 合计第一种剂量 14 11 25第二种剂量 6 19 25合计 20 30 50进行统计分析时的统计假设是________.13.高中女学生的身高预报体重的回归方程是=0.75x-75.5(其中x,的单位分别是cm,kg),则此方程在样本点(160,46)处的随机误差是________.14.为了解某班学生喜欢打篮球是否与性别有关,对本班50人进行了问卷调查得到了下表:喜欢打篮球 不喜欢打篮球 合计男生 20 5 25女生 10 15 25合计 30 20 50则随机变量χ2的值为________(保留三位小数),有________%的把握认为喜欢打篮球与性别有关.四、解答题(本大题共5小题,共77分.解答时应写出必要的文字说明、证明过程或演算步骤)15.(13分)假设有两个分类变量x和y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数如下表(不完整)y1 y2 总计x1 15 30x2 25总计 60(1)请补充完整上表;(2)由(1)判断是否有99%的把握认为分类变量x和y有关系?附:χ2=,其中n=a+b+c+d.P(χ2≥x0) 0.050 0.010 0.001x0 3.841 6.635 10.82816.(15分)佩戴头盔是一项对家庭与社会负责的表现,某市对此不断进行安全教育.下表是该市某主干路口连续4年监控设备抓拍到的驾驶员不戴头盔的统计数据:年度 2018 2019 2020 2021年度序号x 1 2 3 4不戴头盔人数y 1 150 1 000 900 750(1)请利用所给数据求不戴头盔人数y与年度序号x之间的回归直线方程=x+;(2)并估算该路口2022年不戴头盔的人数.参考公式:=,=.17.(15分)某中药企业计划种植A、B两种药材,通过大量考察研究得到如下统计数据.药材A的亩产量约为300公斤,其收购价格处于上涨趋势,最近五年的价格如下表:年份 2017 2018 2019 2020 2021年份编号x 1 2 3 4 5单价y(元/公斤) 18 20 23 25 29药材B的收购价格始终为20元/公斤,其亩产量的频率分布直方图如下:(1)若药材A的单价y(单位:元/公斤)与年份编号x间具有线性相关关系;请求出y关于x的回归直线方程,并估计2022年药材A的单价;(2)利用上述频率分布直方图估计药材B的平均亩产量(同一组数据用中点值为代表);(3)若不考虑其他因素影响,为使收益最大,试判断2022年该药企应当种植药材A还是药材B?并说明理由.参考公式:=,=.18.(17分)甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:一级品 二级品 合计甲机床 150 50 200乙机床 120 80 200合计 270 130 400(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?(2)根据以上数据,能否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异?附:χ2=,其中n=a+b+c+d.P(χ2≥x0) 0.050 0.010 0.001x0 3.841 6.635 10.82819.(17分)社会生活日新月异,看纸质书的人越来越少,更多的年轻人(35岁以下)喜欢阅读电子书籍,他们认为电子书不仅携带方便,而且可以随时随地阅读,而年长者(35岁以上)更喜欢阅读纸质书.现在某书店随机抽取40名顾客进行调查,得到了如下列联表:年长者 年轻人 总计喜欢阅读电子书 16 20喜欢阅读纸质书 8总计 40(1)请将上面的列联表补充完整,并判断是否有90%的把握认为喜欢阅读电子书与年龄有关;(2)若在年轻人中按照分层抽样的方法抽取了7人,为进一步了解情况,再从抽取的7人中随机抽取4人,求抽到喜欢阅读电子书的年轻人人数X的分布列及数学期望.附:χ2=,其中n=a+b+c+d.P(χ2≥x0) 0.10 0.05 0.010 0.005x0 2.706 3.841 6.635 7.879章末过关检测(四) 统计1.解析:选项A,B中两个变量之间是确定的函数关系,不是相关关系;选项C中学生的学籍号与学生的数学成绩是不相关的;选项D中日照时间与水稻的亩产量是相关的.故选D.答案:D2.解析:对于A,散点的变化具有波动性,非正相关关系,A错误;对于B,当x变大时,y的变化趋势也是逐渐增大,可知两个变量具有正相关关系,B正确;对于C,当x变大时,y的变化趋势是逐渐减小,可知两个变量具有负相关关系,C错误;对于D,两个变量的变化无规律,二者没有相关性,D错误.故选B.答案:B3.解析:因为变量x和y满足关系y=0.1x+2中0.1>0,因此变量y与x是正相关,又变量y与z是负相关,所以x与z负相关,故选A.答案:A4.解析:在4个不同的回归模型中,模型3的相关系数r=0.945 为最大,所以拟合效果最好,故选C.答案:C5.解析:由已知可得=×(1+2+3+4)=2.5,=×(2+3+4+5)=3.5,所以这组数据的样本中心点为(2.5,3.5),因为样本中心必在回归直线上,所以把样本中心点代入四个选项中验证,可得只有y=x+1成立,故选A.答案:A6.解析:由表格中的数据可得==6.5,==,将点()代入回归直线方程得=1.78×6.5-7.07=4.5,解得t=5.6.故选B.答案:B7.解析:由表1得:χ2=≈0.43,由表2得:χ2=≈3.9,由表3得:χ2=≈0.43,由表4得:χ2=≈1.73,所以这四种慢性疾病可以通过坚持锻炼来预防的可能性最大的是高血压,故选B.答案:B8.解析:由题意可知,y关于x的回归直线方程为=0.21x+3.217.对于A,第8日的预测水位是=0.21×8+3.217=4.897∈[4.7,5.1),将启动黄色预警,A错误;对于B,第10日的预测水位是=0.21×10+3.217=5.317∈[5.1,5.6),将启动橙色预警,B错误;对于C,第11日的预测水位是=0.21×11+3.217=5.527∈[5.1,5.6),将启动橙色预警,C错误;对于D,第12日的预测水位是=0.21×12+3.217=5.737>5.6,将启动红色预警,故D正确.故选D.答案:D9.解析:由图可知,第一幅图负相关,第二幅图正相关,故A,B正确;第二幅图中的点比第一幅图中的点更趋于一直线附近,故第二幅图的相关性比第一幅图的相关性强,故|r1|<|r2|,CD错误.故选AB.答案:AB10.解析:根据相关定义分析知A,B,D正确;对分类变量X与Y,随机变量χ2的值越大,则判断“X与Y有关系”的把握程度越大,故C错误.故选ABD.答案:ABD11.解析:因为χ2≥6.635,所以有99%的把握认为吸烟与患肺病有关系,也就是说有1%的可能性使推断出现错误,因此选项AD正确,选项BC不正确,故选AD.答案:AD12.解析:根据独立性检验知,应假设“电离辐射的剂量与人体受损程度无关”.答案:电离辐射的剂量与人体受损程度无关13.解析:由样本数据得到,女大学生的身高预报体重的回归方程是=0.75x-75.5,当x=160时,=0.75×160-75.5=44.5,此方程在样本(160,46)处随机误差为46-44.5=1.5.答案:1.514.解析:χ2=≈8.333,因为8.333>7.879,所以有99.5%的把握认为喜欢打篮球与性别有关.答案:8.333 99.515.解析:(1)由题可补充列联表如下,y1 y2 总计x1 15 15 30x2 25 5 30总计 40 20 60(2)由(1)可知,χ2==7.5>6.635,所以有99%的把握认为分类变量x和y有关系.16.解析:(1)由表中数据知,,=950,=1×1 150+2×1 000+3×900+4×750=8 850,=12+22+32+42=30.所以b===-130,所以a=-b=950-(-130)×=1 275,故所求回归直线方程为y=-130x+1 275,(2)令x=5,则y=-130×5+1 275=625人,则预计该路口2022年不戴头盔的人数为625人.17.解析:(1)=23.b===2.7.a=-b=23-2.7×3=14.9,故回归直线方程为y=2.7x+14.9,当x=6时,y=31.1,从而2022年药材A的单价预计为31.1元/公斤.(2)组距为20,自左向右各组的频率依次为0.1,0.2,0.35,0.25,0.1,从而B药材的平均亩产量为360×0.1+380×0.2+400×0.35+420×0.25+440×0.1=401公斤.(3)预计2022年药材A每亩产值为300×31.1=9 330元,药材B每亩产值为20×401=8 020元<9 330元,所以药材A的每亩产值更高,应该种植药材A.18.解析:(1)由表格数据知:甲机床生产的产品中一级品的频率为=0.75;乙机床生产的产品中一级品的频率为=0.6.(2)∵χ2=>6.635,∴有99%的把握可以认为甲机床的产品质量与乙机床的产品质量有差异.19.解析:(1)根据题意,可得如下的2×2的列联表:年长者 年轻人 总计电子书 4 16 20纸质书 8 12 20总计 12 28 40则χ2=≈1.905<2.706,所以没有足够的理由认为有90%的认为喜欢阅读电子书与年龄有关.(2)在抽取的40名顾客的样本中,按照分层抽样的方法在年轻人中抽取7名,则抽到喜欢阅读电子书的年轻人人数为4名,喜欢阅读纸质书的年轻人人数为3名,所以随机变量X的所有可能取值为1,2,3,4,可得P(X=1)=;P(X=2)=;P(X=3)=;P(X=4)=,所以X的分布列为则期望为E(X)=1×. 展开更多...... 收起↑ 资源预览