2024年高考数学复习冲刺过关(天津专用)查漏补缺专题11 概率与统计 讲义(原卷版+解析版)

资源下载
  1. 二一教育资源

2024年高考数学复习冲刺过关(天津专用)查漏补缺专题11 概率与统计 讲义(原卷版+解析版)

资源简介

重难点11 概率与统计
考点一 计数原理
分类加法和分步乘法计数原理
排列与组合
二项式定理
考点二 概率
随机事件与概率
2、古典概型
3、概率综合
考点三 随机变量及其分布列
1、离散型随机变量及其分布列、数字特征
2、二项分布和超几何分布
3、正态分布
考点四 统计模型
1、随机抽样、统计图表
2、一元线性回归模型
3、列联表与独立性检验
考点一:计数原理
基本计数原理
基本计数原理
(1)分类加法计数原理:完成一件事,如果有n类办法,且:第一类办法中有m1种不同的方法,第二类办法中有m2种不同的方法……第n类办法中有mn种不同的方法,那么完成这件事共有N=m1+m2+…+mn种不同的方法.
(2)分步乘法计数原理:完成一件事,如果需要分成n个步骤,且:做第一步有m1种不同的方法,做第二步有m2种不同的方法……做第n步有mn种不同的方法.那么完成这件事共有N=m1×m2×…×mn种不同的方法.
排列与组合
1.排列与组合的概念
名称 定义
排列 从n个不同对象中取出m(m≤n)个对象 按照一定的顺序排成一列
组合 作为一组
2.排列数与组合数
(1)排列数:从n个不同对象中取出m(m≤n)个对象的所有排列的个数.
(2)组合数:从n个不同对象中取出m(m≤n)个对象的所有组合的个数.
3.排列数、组合数的公式及性质
公式 (1)A=n(n-1)(n-2)…(n-m+1)=(n,m∈N*,且m≤n). (2)C==(n,m∈N*,且m≤n).特别地,C=1
性质 (1)0!=1;A=n!. (2)C=C;C=C+C
二项式定理
1.二项式定理
二项式定理 (a+b)n=Can+Can-1b1+…+Can-kbk+…+Cbn(n∈N*)
二项展开式的通项 Tk+1=Can-kbk,它表示展开式的第k+1项
二项式系数 C(k=0,1,…,n)
2.二项式系数的性质
(1)对称性:与首末两端“等距离”的两个二项式系数相等.
(2)增减性与最大值:当n是偶数时,中间的一项取得最大值;当n是奇数时,中间的两项与相等,且同时取得最大值.
(3)各二项式系数的和:(a+b)n的展开式的各二项式系数的和为C+C+C+…+C=2n.
题型1 基本计数原理
1.(22-23高二下·天津·期末)从1,2,3,4,5五个数字中,选出一个偶数和两个奇数,组成一个没有重复数字的三位数,这样的三位数共有( )
A.24个 B.36个 C.48个 D.54个
【答案】B
【分析】先选后排,计算出结果.
【详解】先从2个偶数中选出1个,再从3个奇数中选出2个,先选后排,共有(个).
故选:B.
2.(2023·天津和平·三模)①一组数据的第三四分位数为8;
②若随机变量,且,则;
③具有线性相关关系的变量,其线性回归方程为,若样本的中心,则;
④如图,现要用5种不同的颜色对某市的4个区县地图进行着色,要求有公共边的两个地区不能用同一种颜色,共有180种不同的着色方法.
以上说法正确的个数为( )
A.1个 B.2个 C.3个 D.4个
【答案】C
【分析】将数据从小到大排列,再根据百分位数的计算规则计算①,根据正态分布的性质判断②,根据回归直线必过样本中心点判断③,按照分步乘法计数原理判断④.
【详解】对于①:将数据从小到大排列为、、、、、、、、、,
所以,则第三四分位数为,故①错误;
对于②:因为,且,
所以,所以,故②正确;
对于③:因为线性回归方程为,且样本的中心,
所以,解得,故③正确;
对于④:首先涂I有种,第二步涂II有种,第三步涂III有种,第四步涂IV有种,
按照分步乘法计数原理可得一共有种涂色方法,故④正确;
故选:C
3.(2023·天津·一模)甲、乙、丙、丁、戊五只猴子在一棵枯树上玩耍,假设它们均不慎失足下落,已知:(1)甲在下落的过程中依次撞击到树枝,,;(2)乙在下落的过程中依次撞击到树枝,,;(3)丙在下落的过程中依次撞击到树枝,,;(4)丁在下落的过程中依次撞击到树枝,,;(5)戊在下落的过程中依次撞击到树枝,,,则下列结论正确的是( )
A.最高处的树枝定是 B.最低处的树枝一定是
C.九根树枝从高到低不同的顺序共有种 D.九根树枝从高到低不同的顺序共有种
【答案】C
【分析】
由题判断出部分树枝由高到低的顺序为,还剩下,,,且树枝比高,树枝在树枝,之间,树枝比低,根据的位置不同分类讨论,求得这九根树枝从高到低不同的顺序共33种.
【详解】由题判断出部分树枝由高到低的顺序为,
还剩下,,,且树枝比高,树枝在树枝,之间,树枝比低,
最高可能为G或I,最低为F或H,故A 、B错误;
先看树枝,有4种可能,若在,之间,
则有3种可能:
①在,之间,有5种可能;
②在,之间,有4种可能;
③在,之间,有3种可能,
此时树枝的高低顺序有(种).
若不在,之间,则有3种可能,有2种可能,
若在,之间,则有4种可能,
若在,之间,则有3种可能,
此时树枝的高低顺序有(种)可能,
故这九根树枝从高到低不同的顺序共有种,故C项正确.
故选:C.
4.(2020·天津南开·二模)某学校食堂为了进一步加强学校疫情防控工作,降低学生因用餐而交叉感染的概率,规定:就餐时,每张餐桌(如图)至多坐两个人,一张餐桌坐两个人时,两人既不能相邻,也不能相对(即二人只能坐在对角线的位置上).现有3位同学到食堂就餐,如果3人在1号和2号两张餐桌上就餐(同一张餐桌的4个座位是没有区别的),则不同的坐法种数为( )
A.6 B.12 C.24 D.48
【答案】B
【分析】根据分类计数原理即可求出.
【详解】若在2人在1号餐桌,1人在2号餐桌,则有种;
若在1人在1号餐桌,2人在2号餐桌,则有种,
则共有不同的坐法6+6=12种.
故选:B.
【点睛】本题考查了计数原理中的分类原理,属于简单题.
5.(23-24高三上·天津·期末)从4名女生、6名男生中,按性别采用分层抽样的方法抽取5名学生组成课外小组,则不同的抽取方法种数为( )
A.1440 B.120 C.60 D.24
【答案】B
【分析】先根据分层抽样的特点确定抽取的男女人数,利用组合数公式可得答案.
【详解】从4名女生、6名男生中,按性别采用分层抽样的方法抽取5名学生,
所以抽取的女生人数为2,男生人数为3,共有抽取方法为:.
故选:B
利用分步乘法计数原理解题的策略 (1)明确题目中的“完成这件事”是什么,确定完成这件事需要几个步骤,且每步都是独立的. (2)将这件事划分成几个步骤来完成,各步骤之间有一定的连续性,只有当所有步骤都完成了,整个事件才算完成.
题型2 排列与组合
6.(20-21高二下·天津滨海新·期末)某高中期中考试需要考查九个学科(语文、数学、英语、生物、物理、化学、政治、历史、地理),已知语文考试必须安排在首场,且物理考试与英语考试不能相邻,则这九个学科不同的考试顺序共有( )种
A. B. C. D.
【答案】C
【分析】由题意利用分步乘法原理,不相邻问题运用插空法,可求出这九个学科不同的考试顺序的种数.
【详解】解:语文考试必须安排在首场,方法,除了物理、英语外,还有6科,这6科任意排,方法种,
这6科中间有7个空,从这7个空中,插入物理、英语这2科,方法有种,
则这九个学科不同的考试顺序共有种,
故选:C.
7.(20-21高三上·天津滨海新·阶段练习)第十四届全国运动会将于2021年在陕西举办,为宣传地方特色,某电视台拍摄宣传片五组进行制作编辑,其中包括有美食宣传片 地方风光宣传片各两个,运动场地宣传片一个,所有短片时长彼此不同,现将五组短片编辑在一起,相同题材不相邻,不同的排法共有( )
A.24种 B.48种 C.72种 D.120种
【答案】B
【分析】通过正难则反的思路分析有相邻时的排法数,利用捆绑法和插空法计数,进而得解.
【详解】五组短片的全部排法有:种,
两个美食宣传片相邻,两个地方风光宣传片不相邻的排法有:种,
两个地方风光宣传片相邻,两个美食宣传片不相邻的排法有:种,
两个美食宣传片和两个地方风光宣传片均相邻的排法有:种,
所以相同题材不相邻,不同的排法共有种.
故选:B.
【点睛】关键点点睛:本题解题的关键是利用正难则反的思想求解,相邻问题用捆绑,不相邻问题用插空.
8.(2020·天津河西·二模)用数字0,1,2,3,4组成没有重复数字且至少有两个数字是偶数的四位数,则这样的四位数的个数为
A.64 B.72 C.96 D.144
【答案】C
【分析】由题意把四位数分为含有3个偶数与2个偶数两类,每一类要考虑特殊元素0的安排情况,利用排列组合的应用可分别求出每类四位数的个数,相加即可.
【详解】根据题意,数字0,1, 2, 3, 4中有2个奇数,3个偶数.
若组成的四位数要求至少有两个数字是偶数,则四位数中含有2个或3个偶数,分2种情况讨论:
①四位数中含有3个偶数,1个奇数,因为0不能在首位,有3种情况,选取一个奇数有种,与另两个偶数安排在其他三个位置,有种情况,
则有个符合条件的四位数;
②四位数中含有2个偶数,2个奇数;若偶数中有0,在2、4中选出1个偶数,有种取法,其中0不能在首位,有3种情况,将其他3个数全排列,
安排在其他三个位置,有种情况,则有个符合条件的四位数;若偶数中没有0,将其他4个数全排列,有个符合条件的四位数;
则一共有36+36+24=96个符合条件的四位数.
故选:C
【点睛】本题主要考查分类计数原理及排列组合的运用,注意优先考虑特殊元素的安排情况,属于中档题.
9.(2008·天津·高考真题)有8张卡片分别标有数字1,2,3,4,5,6,7,8,从中取出6张卡片排成3行2列,要求3行中仅有中间行的两张卡片上的数字之和为5,则不同的排法共有
A.1344种 B.1248种 C.1056种 D.960种
【答案】B
【详解】首先确定中间行的数字只能为1,4或2,3,共有种排法.然后确定其余4个数字的排法数.用总数去掉不合题意的情况数:中间行数字和为5,还有一行数字和为5,有4种排法,余下两个数字有种排法.所以此时余下的这4个数字共有种方法.由乘法原理可知共有种不同的排法,选B.
10.(2020·天津宁河·二模)我国古代典籍《周易》用“卦”描述万物的变化.每一“重卦”由从下到上排列的6个爻组成,爻分为阳爻“”和阴爻“一一”,如图就是一重卦.在所有重卦中随机取一重卦,则该重卦恰有3个阳爻的概率是( )
A. B. C. D.
【答案】A
【分析】直接根据古典概型的概率计算公式求解即可.
【详解】解:由题,随机取一重卦有种取法,其中恰有3个阳爻有种取法,
则该重卦恰有3个阳爻的概率,
故选:A.
【点睛】本题主要考查古典概型的概率计算公式,考查排列组合等基础知识,考查运算求解能力,属于基础题.
组合问题常有以下两类题型 (1)“含有”或“不含有”问题:“含”,则先将这些元素取出,再由另外元素补足;“不含”,则先将这些元素剔除,再从剩下的元素中去选取. (2)“至少”或“最多”问题:用直接法和间接法都可以求解,通常用直接法,分类复杂时,考虑逆向思维,用间接法处理.
题型3 数列的性质
11.(23-24高三下·天津·阶段练习)多项式展开式中的系数为( )
A.985 B.750 C.940 D.680
【答案】A
【分析】由二项式定理即可列式运算,进而即可得解.
【详解】多项式展开式中的系数为.
故选:A.
12.(23-24高三上·天津滨海新·阶段练习)若的展开式的二项式系数之和为,则的展开式中的系数为( )
A.8 B.28 C.56 D.70
【答案】C
【分析】根据二项式系数和求得,根据二项式展开式的通项公式求得正确答案.
【详解】的展开式的二项式系数之和,
则展开式的通项公式为:

令,
所以的系数为.
故选:C
13.(23-24高三上·天津河东·阶段练习)在的展开式中,若第2项系数为,则a值为( )
A.2 B. C. D.
【答案】D
【分析】直接根据二项式定理列出关于的方程解出即可得结果.
【详解】的展开式中,第二项系数为,
解得,
故选:D.
14.(2021·天津静海·三模)已知的二项展开式的奇数项二项式系数和为,若,则等于( )
A. B. C. D.
【答案】B
【分析】根据奇数项二项式系数和公式求出,再利用展开式求.
【详解】的二项展开式的奇数项二项式系数和为64,
,即;
则的通项公式为,
令,则,所以.
故选:B
15.(2020·天津·模拟预测)在的二项展开式中,的系数为( )
A. B.10 C. D.5
【答案】A
【分析】求出二项式展开式的通项,即可求出的系数.
【详解】的二项展开式的通项为,
令,解得,
故的系数为.
故选:A.
(1)求二项展开式中的特定项,一般是化简通项后,令字母的指数符合要求(求常数项时,指数为零;求有理项时,指数为整数等),解出项数k+1,代回通项即可. (2)对于几个多项式积的展开式中的特定项问题,一般可以根据因式连乘的规律,结合组合思想求解,但要注意适当地运用分类方法,以免重复或遗漏.
考点二:概率
随机事件与概率
1.样本空间和随机事件
(1)样本点和样本空间
样本点:随机试验中每一种可能出现的结果称为样本点.
样本空间:由所有样本点组成的集合称为样本空间,常用Ω表示.
(2)随机事件
一般地,如果随机试验的样本空间为Ω,则随机事件A是Ω的一个非空真子集,而且若试验的结果是A中的元素,则称A发生,否则,称A不发生.
2.两个事件的关系和运算
含义 符号表示
包含关系 A发生导致B发生 A B
相等关系 B A且A B A=B
并事件(和事件) A与B至少一个发生 A∪B或A+B
交事件(积事件) A与B同时发生 A∩B或AB
互斥(互不相容) A与B不能同时发生 A∩B=
互为对立 A与B有且仅有一个发生 A∩B= ,A∪B=Ω
3.古典概型的特征
(1)有限性:样本空间所包含的样本点个数是有限的;
(2)等可能性:每个基本事件发生的可能性大小都相等.
4.古典概型的概率公式
假设样本空间含有n个样本点,如果事件C包含m个样本点,则由互斥事件的概率加法公式可知P(C)=.
其中,n(A)和n(Ω)分别表示事件A和样本空间Ω包含的样本点个数.
5.概率的性质
性质1:对任意的事件A,都有P(A)≥0;
性质2:必然事件的概率为1,不可能事件的概率为0,即P(Ω)=1,P( )=0;
性质3:如果事件A与事件B互斥,那么P(A+B)=P(A)+P(B);
性质4:如果事件A与事件B互为对立事件,那么P(B)=1-P(A),P(A)=1-P(B);
性质5:如果A B,那么P(A)≤P(B),由该性质可得,对于任意事件A,因为 A Ω,所以0≤P(A)≤1;
性质6:设A,B是一个随机试验中的两个事件,有P(A+B)=P(A)+P(B)-P(AB).
6.频率与概率
(1)频率的稳定性
一般地,如果在n次重复进行的试验中,一个事件发生的频率会很接近于这个事件发生的概率,而且,试验的次数越多,频率与概率之间差距很小的可能性越大.
(2)频率稳定性的作用:可以用频率fn(A)估计概率P(A).
事件的独立性和条件概率、全概率公式
1.相互独立事件
(1)概念:如果P(AB)=P(A)P(B)成立,则称事件A与事件B相互独立,简称为独立.
(2)性质:若事件A与B相互独立,那么A与,与B,与也都相互独立.
2.条件概率
(1)概念:一般地,当事件B发生的概率大于0(即P(B)>0)时,已知事件B发生的条件下事件A发生的概率,称为条件概率,记作P(A|B),而且P(A|B) =.
(2)两个公式
①利用古典概型:P(B|A)=;
②概率的乘法公式:P(AB)=P(A)P(B|A).
3.全概率公式
一般地,如果样本空间为Ω,A,B为事件,则BA与B是互斥的,且B=BΩ=B(A+)=BA+B,从而P(B)=P(BA+B)=P(BA)+P(B),当P(A)>0且P()>0时,有P(B)=P(A)P(B|A)+P()P(B|).
常用结论
1.如果事件A1,A2,…,An相互独立,那么这n个事件同时发生的概率等于每个事件发生的概率的积,即P(A1A2…An)=P(A1)P(A2)…P(An).
2.贝叶斯公式:设A,是一组对立事件,A+=Ω,0<P(A)<1,则对任意事件B Ω,P(B)>0,有P(A|B)==
题型1 随机事件与概率
16.(23-24高三上·天津·期末)已知某公路上经过的货车与客车的数量之比为,货车和客车中途停车修理的概率分别为和,则一辆汽车中途停车修理的概率为( )
A. B. C. D.
【答案】C
【分析】利用条件概率公式结合互斥事件即可求解.
【详解】事件表示一辆汽车中途停车修理,
事件表示该汽车是货车,
事件表示该汽车是客车,
则,,
,,

.
故选:C
17.(2023·天津·一模)某滑冰馆统计了某小区居民在该滑冰馆一个月的锻炼天数,得到如图所示的频率分布直方图(将频率视为概率),则下列说法正确的是( )
A.该小区居民在该滑冰馆的锻炼天数在区间内的最少
B.估计该小区居民在该滑冰馆的锻炼天数超过15天的概率为0.465
C.估计该小区居民在该滑冰馆的锻炼天数的中位数为16
D.估计小区居民在该滑冰馆的锻炼天数的平均值为15
【答案】B
【分析】根据直方图写出对应该滑冰馆的锻炼天数区间的频率,再结合各选项的描述及中位数、平均数的求法判断正误.
【详解】由图知:、、、、、的频率分别为、、、、、,
对于A:内的天数最少,故A错误;
对于B:估计锻炼天数超过15天的概率为,故B正确;
对于C:由、、频率和为,设中位数为x,
则,可得,故C错误;
对于D:平均天数为天,故D错误;
故选:B.
18.(22-23高三上·天津红桥·期中)甲、乙二人的投篮命中率分别为0.9、0.8,若他们二人每人投篮一次,则至少一人命中的概率为( )
A.0.72 B.0.27 C.0.26 D.0.98
【答案】D
【分析】“至少一人命中”可分为三种情况:甲、乙都中、甲中乙不中、甲不中乙中,结合二人投篮相互独立,计算即得解.
【详解】由题意“至少一人命中”可分为三种情况:甲、乙都中、甲中乙不中、甲不中乙中,
记“至少一人命中”为事件,由甲、乙二人投篮相互独立,
则.
故选:D
19.(20-21高三上·天津滨海新·阶段练习)从5双不同的袜子中取4只,使至少有2只袜子配成一双的可能取法种数为( )
A.20 B.30 C.130 D.140
【答案】C
【分析】由对立事件A为“4只没有可配对的袜子”的取法种数,总取法,即可知至少有2只袜子配成一双的可能取法种数,即可知正确选项.
【详解】“4只至少有2只袜子配成一双”的对立事件A为“4只没有可配对的袜子”,
∴A的取法数为种,而总取法有种,
∴“4只至少有2只袜子配成一双” 可能取法种数为种.
故选:C
20.(20-21高三上·天津南开·开学考试)两人独立地破译一个密码,他们能译出的概率分别为、,则密码被译出的概率为(  )
A. B. C. D.
【答案】B
【分析】利用独立事件的概率乘法公式计算出两人都破译不出密码的概率,再利用对立事件的概率公式可求得所求事件的概率.
【详解】由题意可知,两人都破译不出密码的概率为,
因此,密码被译出的概率为.
故选:B.
【点睛】本题考查利用独立事件的概率乘法公式和对立事件的概率公式求事件的概率,考查计算能力,属于基础题.
求解古典概型的综合问题的步骤 (1)将题目条件中的相关知识转化为事件; (2)判断事件是否为古典概型; (3)选用合适的方法确定样本点个数; (4)代入古典概型的概率公式求解.
题型2 古典概型
21.(22-23高三上·天津河北·期末)将三颗骰子各掷一次,记事件“三个点数都不同”,“至少出现一个点”,则条件概率,分别等于( )
A., B., C., D.,
【答案】B
【分析】由古典概型概率公式分别求得,代入条件概率公式求解即可.
【详解】由题意知:事件“三个点数都不同且至少出现一个点”,
,,,
,.
故选:B.
22.(2022·天津红桥·一模)已知盒中装有大小、质量完全相同的2个黑球,3个红球,现从盒中随机抽取2个球,则取出的两个球颜色相同的概率为( )
A. B. C. D.
【答案】D
【分析】结合古典概型的概率计算公式以及组合数的计算公式,计算出所求的概率.
【详解】依题意,取出的两个球颜色相同的概率为.
故选:D
23.(2016高三·天津红桥·学业考试)将一枚硬币先后抛掷两次,恰好出现一次正面的概率是( )
A. B. C. D.
【答案】B
【分析】利用古典概型的概率求解.
【详解】解:将一枚硬币先后抛掷两次的基本事件有(正,正),(正,反),(反,正),(反,反),共4种,
恰好出现一次正面的基本事件有(正,反),(反,正),共2种,
所以恰好出现一次正面的概率是,
故选:B
24.(2016高三·天津红桥·学业考试)从甲、乙、丙、丁四名同学中选2人参加普法知识竞赛,则甲被选中的概率为( )
A. B. C. D.
【答案】D
【分析】利用古典概型的概率求解.
【详解】解:从甲、乙、丙、丁四名同学中选2人的基本事件有(甲、乙),(甲、丙),(甲、丁),(乙、丙),(乙、丁),(丙、丁),共6种,
甲被选中的基本事件有(甲、乙),(甲、丙),(甲、丁),共3种,
所以甲被选中的概率为,
故选:D
25.(19-20高三上·天津红桥·期末)袋中共有个球,其中有个红球、个黄球和个绿球,这些球除颜色外完全相同,若从袋中一次随机抽出个球,则取出的个球颜色相同的概率为( )
A. B.
C. D.
【答案】C
【分析】分别求出抽中两个红球、黄球、绿球的概率,然后利用加法原理即可求出答案
【详解】抽中两个红球的概率为:
抽中两个黄球的概率为:
抽中两个绿球的概率为:
取出的个球颜色相同的概率为:
故选C
求条件概率的常用方法 (1)定义法:P(B|A)=. (2)样本点法:P(B|A)=.
题型2 概率综合
26.(19-20高三上·天津宁河·阶段练习)某单位名员工参加“社区低碳你我他”活动,他们的年龄在25岁至50岁之间,按年龄分组:第1组,第2组,第3组,第4组,第5组,得到的频率分布图如图所示,下表是年龄的频率分布表.
区间
人数 20
(1)补全表格中的数据(不需要写过程);
(2)现要从年龄较小的第组中用分层抽样的方法抽取6人,求从第组分别抽取的人数;
(3)在(2)的条件下,从这6人中再随机抽取2人参加社区宣传交流活动,求2人不在同一年龄组的概率.
【详解】(1)解:由频率分步直方图可知,,两组的人数与组的人数相等,均为人,
第3组的人数是第一组人数的4倍,为人,
第4组的人数是第一组人数的3倍,为人
所以,表格中的数据为:第2组的人数为20人,第3组的人数为80人,第4组的人数为60人,第5组的人数为20人.
(2)解:由频率分布表和频率分布直方图知:
第1组的频率为,
第2组的频率为,
第3组的频率为,
第组的人数比为,
要从年龄较小的第组中用分层抽样的方法抽取6人,
所以,年龄第组人数分别是1人,1人,4人.
(3)解:用分别表示从第组抽取的人,其中表示第3组抽取的人,从这6人中随机抽取2人
参加社区宣传交流活动,结果有,,基本事件总数共15种,
2人不在同一组的结果有,共9种,
所以,所求事件的概率为
27.(2024·福建三明·三模)某校开设劳动教育课程,为了有效推动课程实施,学校开展劳动课程知识问答竞赛,现有家政、园艺、民族工艺三类问题海量题库,其中家政类占,园艺类占,民族工艺类占.根据以往答题经验,选手甲答对家政类、园艺类、民族工艺类题目的概率分别为,选手乙答对这三类题目的概率均为
(1)求随机任选1题,甲答对的概率;
(2)现进行甲、乙双人对抗赛,规则如下:两位选手进行三轮答题比赛,每轮只出1道题目,比赛时两位选手同时回答这道题,若一人答对且另一人答错,则答对者得1分,答错者得分,若两人都答对或都答错,则两人均得0分,累计得分为正者将获得奖品,且两位选手答对与否互不影响,每次答题的结果也互不影响,求甲获得奖品的概率.
【详解】(1)记随机任选1题为家政、园艺、民族工艺试题分别为事件,
记随机任选1题,甲答对为事件B,
则,


(2)设乙答对记为事件C,则

设每一轮比赛中甲得分为X,
则,


三轮比赛后,设甲总得分为Y,
则,,

所以甲最终获得奖品的概率为.
28.(2024·四川成都·三模)某手机生产厂商要生产一款5G手机,在生产之前,该公司对手机屏幕的需求尺寸进行社会调查,共调查了400人,将这400人按对手机屏幕的需求尺寸分为6组,分别是:,,,,,(单位:英寸),得到如下频率分布直方图:其中,屏幕需求尺寸在的一组人数为50人.

(1)求和的值;
(2)用分层抽样的方法在屏幕需求尺寸为和两组人中抽取6人参加座谈,并在6人中选择2人做代表发言,则这2人来自同一分组的概率是多少?
【详解】(1)因为屏幕需求尺寸在的一组人数为50人,
所以其频率为.又因为组距为0.5,所以.
又因为,所以,
即,.
(2)因为屏幕需求尺寸为人数为:,
屏幕需求尺寸为人数为,
若要用分层抽样的方法抽取6人
所以要在组中抽2人,设为,;
要在组中抽4人,设,,,,
因此样本空间
,,,,,,
,,,,共15个基本事件,
而这2人来自同一分组为事件,
,共7个基本事件,
所以这2人来自同一分组的概率.
考点三:随机变量及其分布列
离散型随机变量及其分布列、数字特征
1.离散型随机变量
一般地,如果随机试验的样本空间为Ω,而且对于Ω中的每一个样本点,变量X都对应有唯一确定的实数值,就称X为一个随机变量.其所有可能的取值都是可以一一列举的随机变量称为离散型随机变量.
2.离散型随机变量的分布列
一般地,当离散型随机变量X的取值范围是{x1,x2,…,xn}时,如果对任意k∈{1,2,…,n},概率P(X=xk)=pk都是已知的,则称X的概率分布是已知的.离散型随机变量X的概率分布也可以用如下形式的表格表示,
X x1 x2 … xk … xn
P p1 p2 … pk … pn
此表称为X的概率分布或分布列.
3.离散型随机变量的分布列的性质
①pk≥0(k=1,2,…,n);
②k=p1+p2+…+pn=1.
4.离散型随机变量的均值与方差
一般地,若离散型随机变量X的分布列为
X x1 x2 … xn
P p1 p2 … pn
(1)均值
则称E(X)=x1p1+x2p2+…+xnpn=ipi为随机变量X的均值或数学期望,数学期望简称期望.它反映了离散型随机变量取值的平均水平.
(2)方差
称D(X)=[x1-E(X)]2p1+[x2-E(X)]2p2+…+[xn-E(X)]2pn=xi-E(X)]2pi为随机变量X的方差,并称为随机变量X的标准差,它们都可以度量随机变量取值与其均值的偏离程度.
5.均值与方差的性质
(1)E(aX+b)=aE(X)+b.
(2)D(aX+b)=a2D(X)(a,b为常数).
二项分布、超几何分布和正态分布
1.n次独立重复试验与二项分布
(1)n次独立重复试验
在相同条件下重复n次伯努利试验,约定这n次试验是相互独立的,此时这n次伯努利试验也常称为n次独立重复试验.
(2)二项分布
一般地,如果一次伯努利试验中,出现“成功”的概率为p,记q=1-p,且n次独立重复试验中出现“成功”的次数为X,则X的取值范围是{0,1,…,k,…,n},而且P(X=k)=Cpkqn-k(k=0,1,2,…,n),因此X的分布列如下表所示:
X 0 1 … k … n
P Cp0qn Cp1qn-1 … Cpkqn-k … Cpnq0
由于表中的第二行中的概率值恰好是二项展开式(q+p)n=Cp0qn+Cp1qn-1+…+Cpkqn-k+…+Cpnq0中对应项的值,因此称X服从参数为n,p的二项分布,记作X~B(n,p).
(3)两点分布与二项分布的均值、方差
①若随机变量X服从两点分布,则E(X)=p,D(X)=p(1-p).
②若X~B(n,p),则E(X)=np,D(X)=np(1-p).
2.超几何分布
一般地,假设一批产品共有N件,其中有M件次品.从N件产品中随机抽取n件(不放回),用X表示抽取的n件产品中的次品数,则X的分布列为P(X=k)=,k=t,t+1,t+2,…,s,其中,n,N,M∈N+,M≤N,n≤N,t=max{0,n-N+M},s=min{n,M},如果随机变量X的分布列具有上式的形式,那么称随机变量X服从超几何分布.
3.正态分布
(1)定义
一般地,如果随机变量X落在区间[a,b]内的概率,总是等于φμ,σ(x)对应的正态曲线与x轴在区间[a,b]内围成的面积,则称X服从参数为μ与σ的正态分布.
(2)正态曲线的特点
①曲线是单峰的,它关于直线x=μ对称;
②曲线在x=μ处达到峰值;
③当|x|无限增大时,曲线无限接近x轴.
(3)3σ原则
P(|X-μ|≤σ)=P(μ-σ≤X≤μ+σ)≈68.3%,
P(|X-μ|≤2σ)=P(μ-2σ≤X≤μ+2σ)≈95.4%,
P(|X-μ|≤3σ)=P(μ-3σ≤X≤μ+3σ)≈99.7%.
(4)正态分布的均值与方差
若X~N(μ,σ2),则E(X)=μ,D(X)=σ2.
题型1 离散型随机变量及其分布列、数字特征
1.(2024·天津·一模)下列说法正确的是( )
A.一组数据的第80百分位数为17;
B.根据分类变量与的成对样本数据,计算得到,根据小概率值的独立性检验,可判断与有关联,此推断犯错误的概率不大于0.05;
C.两个随机变量的线性相关性越强,相关系数的绝对值越接近于0;
D.若随机变量满足,则.
【答案】B
【分析】A选项,由百分位数的定义得到答案;B选项,,得到结论;C选项,由相关系数的性质得到C错误;D选项,由方差的性质得到D错误.
【详解】A选项,,故从小到大排列,第8个数和第9个数的平均数作为第80百分位数,
即,A错误;
B选项,由于,得到与有关联,此推断犯错误的概率不大于0.05,B正确;
C选项,两个随机变量的线性相关性越强,相关系数的绝对值越接近于1,C错误;
D选项,若随机变量满足,则,D错误.
故选:B
2.(2024·天津南开·一模)已知随机变量,且,则( )
A. B. C. D.
【答案】D
【分析】根据正态分布的性质可得,即可根据二项分布的期望公式求解.
【详解】由以及可得,
由于,故,,
故选:D
3.(23-24高三上·天津武清·阶段练习)有两个随机变量和,它们的分布列分别如下表:
1 2 3 4 5
0.03 0.3 0.5 0.16 0.01
1 2 3 4 5
0.1 0.2 0.3 0.2 0.2
则关于它们的期望,和它们的方差和,下列关系正确的是( )
A.,且 B.,且
C.,且 D.,且
【答案】A
【分析】根据方差和期望的公式即可求解.
【详解】,
,
所以且,
故选:A
4.(2023·天津·一模)下列命题错误的是( )
A.两个随机变量的线性相关性越强,相关系数的绝对值越接近于
B.设,且,则
C.线性回归直线一定经过样本点的中心
D.随机变量,若,则
【答案】B
【分析】利用相关关系判断A;由正态分布的性质判断B;由线性回归直线的性质判断C;由随机变量条件建立方程组解出即可判断D.
【详解】根据相关系数的意义可知,两个随机变量的线性相关性越强,
相关系数的绝对值越接近于,
故A正确;
由,知,
即概率密度函数的图像关于直线对称,
所以,
则,
故B错误;
根据线性回归直线的性质可知,
线性回归直线一定经过样本点的中心,
故C正确;
随机变量,若,
则,
故D正确;
故选:B.
5.(21-22高三上·天津红桥·期末)一名学生申请加入学校的个社团,假设各个社团通过这名学生的申请是相互独立的,并且概率都是,设是这名学生申请被通过的次数,则随机变量的期望为( )
A. B.
C. D.
【答案】D
【分析】由题意服从二项分布,由二项分布的期望公式可得解
【详解】由题意,服从二项分布,即
由二项分布的期望公式可得:
故选:D
求离散型随机变量ξ的均值与方差的步骤 (1)理解ξ的意义,写出ξ的所有可能取值. (2)求ξ取每个值的概率. (3)写出ξ的分布列. (4)由均值、方差的定义求E(ξ),D(ξ).
题型2 二项分布、超几何分布
6.(2021·天津宝坻·模拟预测)冠状病毒是一个大型病毒家族,已知可引起感冒以及中东呼吸综合征(MERS)和严重急性呼吸综合征(SARS)等较严重疾病,而新型冠状病毒(nCoV)是以前从未在人体中发现的冠状病毒新毒株人,感染了新型冠状病毒后常见体征有呼吸道症状,发热、咳嗽、气促和呼吸困难等在较严重病例中,感染可导致肺炎,严重急性呼吸综合征,肾衰竭,甚至死亡.假如某医药研究机构合成了甲、乙两种抗“新冠病毒”的药物.经试验,服用甲、乙两种药物痊愈的概率分别为,现已进入药物临床试用阶段.每个试用组由4位该病毒的感染者组成.其中2人试用甲种抗病毒药物,2人试用乙种抗病毒药物.如果试用组中,甲种抗病毒药物治愈人数超过乙种抗病毒药物的治愈人数,则称该组为“甲类组”.
(1))求一个试用组为“甲类组”的概率;
(2)观察3个试用组,用表示这3个试用机组“甲类组”的个数,求的分布列和数学期望.
【详解】解(1)设表示事件“一个试验组中,服用甲种抗病毒药物有效的人数人”,,
表示事件“一个试验组中,服乙有效的人有人”,
依题意有
所求的概率为
(2)的可能值为,且




的分布列为
0 1 2 3
数学期望.
7.(22-23高三上·陕西渭南·阶段练习)甲 乙两班进行消防安全知识竞赛,每班出3人组成甲乙两支代表队,首轮比赛每人一道必答题,答对则为本队得1分,答错或不答都得0分,已知甲队3人每人答对的概率分别为,乙队每人答对的概率都是,设每人回答正确与否相互之间没有影响,用X表示甲队总得分.
(1)求的概率;
(2)求甲队和乙队得分之和为4的的概率.
【详解】(1),则甲队有两人答对,一人答错,
故.
(2)设甲队和乙队得分之和为4为事件A,设乙队得分为Y,则.


,,


.
8.(20-21高三上·天津和平·阶段练习)随着马拉松运动在全国各地逐渐兴起,参与马拉松训练与比赛的人数逐年增加.为此,某市对参加马拉松运动的情况进行了统计调查,其中一项是调查人员从参与马拉松运动的人中随机抽取100人,对其每月参与马拉松运动训练的天数进行统计,得到以下统计表:
平均每月进行训练的天数
人数 10 60 30
(1)以这100人平均每月进行训练的天数位于各区间的频率代替该市参与马拉松训练的人平均每月进行训练的天数位于该区间的概率,从该市所有参与马拉松训练的人中随机抽取4个人,求恰好有2个人是“平均每月进行训练的天数不少于20天”的概率;
(2)依据统计表,用分层抽样的方法从这100个人中抽取20个,再从抽取的20个人中随机抽取4个,表示抽取的是“平均每月进行训练的天数不少于20天”的人数,求的分布列及数学期望.
【详解】(1)随机抽取1人,平均每月进行训练的天数不少于20天的概率为,
设随机抽取4个人,“平均每月进行训练的天数不少于20天”的人数为,则,
∴.
(2)从这100个人中抽取20个人中,“平均每月进行训练的天数不少于20天”的人数为人,
随机变量的所有可能取值为0,1,2,3,4,
,,,
,,
∴的分布列为
0 1 2 3 4
数学期望.
【点睛】本题考查二项分布、超几何分布、离散型随机变量的分布列和数学期望,考查学生对数据的分析与处理能力,属于中档题.
9.(2020·天津·一模)近年来,随着全球石油资源紧张、大气污染日益严重和电池技术的提高,电动汽车已被世界公认为21世纪汽车工业改造和发展的主要方向.为了降低对大气的污染和能源的消耗,某品牌汽车制造商研发了两款电动汽车车型和车型,并在黄金周期间同时投放市场.为了了解这两款车型在黄金周的销售情况,制造商随机调查了5家汽车店的销量(单位:台),得到下表:
店 甲 乙 丙 丁 戊
车型 6 6 13 8 11
车型 12 9 13 6 4
(1)若从甲、乙两家店销售出的电动汽车中分别各自随机抽取1台电动汽车作满意度调查,求抽取的2台电动汽车中至少有1台是车型的概率;
(2)现从这5家汽车店中任选3家举行促销活动,用表示其中车型销量超过车型销量的店的个数,求随机变量的分布列和数学期望.
【详解】(1)解:设“从甲店随机抽取的1台电动汽车是车型”为事件,
“从乙店,随机抽取的1台电动汽车是车型”为事件,
依题意,,,且事件、相互独立,
设“抽取的2台电动汽车中至少有1台是车型”为事件,
则.
(2)解:由表可知,车型销量超过车型销量的店有2家,
故的所有可能取值为:0,1,2,
且,


所以随机变量的分布列为:
0 1 2
所以.
【点睛】本题考查古典概型、对立事件的概率、独立事件的概率、超几何分布、离散型随机变量的分布列和数学期望等知识点,考查学生灵活运用知识的能力和运算能力.
(1)超几何分布描述的是不放回抽样问题,随机变量为抽到的某类个体的个数.超几何分布的特征是:①考察对象分两类;②已知各类对象的个数;③从中抽取若干个个体,考查某类个体数X的分布列. (2)超几何分布主要用于抽检产品、摸不同类别的小球等概率模型,其本质是古典概型.
题型3 正态分布
10.(2024·福建福州·模拟预测)甲企业生产线上生产的零件尺寸的误差服从正态分布,规定的零件为优等品,的零件为合格品.
(1)从该生产线上随机抽取100个零件,估计抽到合格品但非优等品的个数(精确到整数);
(2)乙企业拟向甲企业购买这批零件,先对该批零件进行质量抽检,检测的方案是:从这批零件中任取2个作检测,若这2个零件都是优等品,则通过检测;若这2个零件中恰有1个为优等品,1个为合格品但非优等品,则再从这批零件中任取1个作检测,若为优等品,则通过检测;其余情况都不通过检测.求这批零件通过检测时,检测了2个零件的概率(精确到0.01).
(附:若随机变量,则,,)
【详解】(1)依题意得,,,
所以零件为合格品的概率为,
零件为优等品的概率为,
所以零件为合格品但非优等品的概率为,
所以从该生产线上随机抽取100个零件,
估计抽到合格品但非优等品的个数为.
(2)设从这批零件中任取2个作检测,2个零件中有2个优等品为事件,恰有1个优等品,1个为合格品但非优等品为事件,从这批零件中任取1个检测是优等品为事件,这批产品通过检测为事件,
则,且与互斥,
所以

所以这批零件通过检测时,
检测了2个零件的概率为.
答:这批零件通过检测时,检测了2个零件的概率约为0.61.
11.(2024·湖南岳阳·三模)某地区举行专业技能考试,共有8000人参加,分为初试和复试,初试通过后,才能参加复试.为了解考生的考试情况,随机抽取了100名考生的初试成绩,并以此为样本,绘制了样本频率分布直方图,如图所示.
(1)若所有考生的初试成绩近似服从正态分布,其中为样本平均数的估计值,,试利用正态分布估计所有考生中初试成绩不低于85分的人数;
(2)复试共四道题,前两道题考生每题答对得5分,答错得0分,后两道题考生每题答对得10分,答错得0分,四道题的总得分为考生的复试成绩.已知某考生进入复试,他在复试中,前两题每题能答对的概率均为,后两题每题能答对的概率均为,且每道题回答正确与否互不影响.规定复试成绩上了20分(含20分)的考生能进入面试,请问该考生进入面试的概率有多大
附:若随机变量X服从正态分布,则:,.
【详解】(1)由题意得,样本平均数的估计值为

因为学生初试成绩服从正态分布,其中则,
所以,
所以估计初试成绩不低于85分的人数为人.
(2)记该考生的复试成绩为,则能进入面试的复试成绩为20分,25分,30分,



所以该考生进入面试的概率为.
解决正态分布问题的三个关键点 (1)对称轴为x=μ. (2)标准差为σ. (3)分布区间. 利用对称性可求指定范围内的概率值;由μ,σ,分布区间的特征进行转化,使分布区间转化为3σ特殊区间,从而求出所求概率.注意只有在标准正态分布下对称轴才为x=0.
考点四:统计模型
随机抽样、统计图表
1.总体、个体、样本
所考察问题涉及的对象全体是总体,总体中每个对象都是个体,抽取的部分对象组成总体的一个样本,一个样本中包含的个体数目是样本容量.
2.简单随机抽样
抽签法和随机数表法是比较常用的两种方法.
3.分层抽样
一般地,如果相对于要考察的问题来说,总体可以分成有明显差别的、互不重叠的几部分时,每一部分可称为层,在各层中按层在总体中所占比例进行随机抽样的方法称为分层随机抽样(简称为分层抽样).
4.统计图表
(1)常见的统计图表有条形图、扇形图、折线图、频率分布直方图、茎叶图等.
(2)作频率分布直方图的步骤
①求极差;
②决定组距与组数;
③将数据分组;
④列频率分布表;
⑤画频率分布直方图.
一元线性回归模型
1.变量的相关关系
(1)相关关系:两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.
(2)相关关系的分类:正相关和负相关.
(3)线性相关:如果变量x与变量y之间的关系可以近似地用一次函数来刻画,则称x与y线性相关.
2.相关系数
(1)r=.
(2)当r>0时,称成对样本数据正相关;当r<0时,称成对样本数据负相关.
(3)|r|≤1;当|r|越接近1时,成对样本数据的线性相关程度越强;当|r|越接近0时,成对样本数据的线性相关程度越弱.
3.一元线性回归模型
(1)我们将=x+称为y关于x的回归直线方程,
其中
(2)残差:观测值减去预测值称为残差.
列联表与独立性检验
列联表与独立性检验
(1)2×2列联表:如果随机事件A与B的样本数据如下表格形式:
A 总计
B a b a+b
c d c+d
总计 a+c b+d a+b+c+d
在这个表格中,核心的数据是中间的4个格子,所以这样的表格通常称为2×2列联表.
(2)在2×2列联表中,定义随机变量
χ2=,任意给定α(称为显著性水平),可以找到满足条件P(χ2≥k)=α的数k(称为显著性水平α对应的分位数),
①若χ2≥k成立,就称在犯错误的概率不超过α的前提下,可以认为A与B不独立(也称A与B有关),或说有1-α的把握认为A与B有关;
②若χ2这一过程通常称为独立性检验.
题型1 随机抽样、统计图表
1.(2024·天津·二模)某校举办了数学知识竞赛,把1000名学生的竞赛成绩(满分100分,成绩取整数)按,,,分成四组,并整理成如图所示的频率分布直方图,则下列说法正确的为( )
A.的值为0.015 B.估计这组数据的众数为80
C.估计这组数据的第60百分位数为87 D.估计成绩低于80分的有350人
【答案】C
【分析】利用频率分布直方图的性质可判定A,利用众数、百分位数的求法可判定B、C,根据频率分布直方图计算可估计总体判定D.
【详解】易知,解得,所以A错误;
由频率分布直方图可知众数落在区间,用区间中点表示众数即85,所以B错误;
由频率分布直方图可知前两组频率之和为,
前三组频率之和为,
故第60百分位数落在区间,设第60百分位数为,
则,解得,所以C正确;
成绩低于80分的频率为,所以估计总体有,故D错误.
故选:C.
2.(2024·天津·二模)有人通过调查统计发现,儿子成年时的身高与父亲的身高呈线性相关,且儿子成年时的身高(单位:)与父亲的身高(单位:)的经验回归方程为,根据以上信息,下列判断正确的为( ).
A.儿子成年时的身高与父亲的身高的样本相关系数
B.父亲的身高为,儿子成年时的身高一定在到之间
C.父亲的身高每增加,儿子成年时的身高平均增加
D.儿子在成年时的身高一般会比父亲高
【答案】C
【分析】根据题意,由线性回归方程的性质,对选项逐一判断,即可得到结果.
【详解】因为,且,
即与不一定相等,故A错误;
当父亲身高为时,孩子身高可能在到之间,
而不是一定,故B错误;
因为,即父亲的身高每增加,
儿子成年时的身高平均增加,故C正确;
由回归方程可知,是否比父亲高还得取决于父亲身高,因此判断不了儿子成年时一般比父亲高,故D错误;
故选:C
3.(23-24高三下·天津·阶段练习)将收集到的天津一中2021年高考数学成绩绘制出频率分布直方图,如图所示,则下列说法中不正确的是( )
A.
B.高三年级取得130分以上的学生约占总数的65%
C.高三年级的平均分约为133.2
D.高三年级成绩的中位数约为125
【答案】D
【分析】对于A,由各个矩形面积之和为1即可列式求解;对于B,求最右边两个矩形面积之和即可验算;对于C,D分别由平均数计算公式、中位数计算方法即可判断.
【详解】对于A,,故A正确;
对于B,高三年级取得130分以上的学生约占总数的,故B正确;
对于C,高三年级的平均分约为
,故C正确;
对于D,设高三年级成绩的中位数为,
由于,
所以,故D不正确.
故选;D.
4.(2023·天津河北·一模)已知甲乙两组数据分别为和,则下列说法中不正确的是( )
A.甲组数据中第70百分位数为23 B.甲乙两组数据的极差相同
C.乙组数据的中位数为25.5 D.甲乙两组数据的方差相同
【答案】A
【分析】根据百分位数的定义可得甲组数据中第70百分位数为24;计算可知两组数据的极差都为5;由中位数定义可求出乙组数据的中位数为25.5;利用方差公式计算可求得甲乙两组数据的方差均为.
【详解】对于A,每组数据为6个,因为,
所以甲组数据中第70百分位数为第5个数,即为24,所以A错误;
对于B,甲组数据的极差为,乙组数据的极差为,即B正确;
对于C,乙组数据的中位数为第三个数和第四个数的平均数,即,所以C正确;
对于D,易知甲组数据的平均数为22.5,
则甲组数据的方差为;
乙组数据的方差为;
因此甲乙两组数据的方差相同,即D正确.
故选:A
5.(2024高三下·天津·专题练习)下列说法错误的是( )
A.线性相关系数时,两变量正相关
B.两个随机变量的线性相关性越强,则相关系数r的值就越接近于1
C.在回归直线方程中,当解释变量x每增加1个单位时,预报变量平均增加0.2个单位
D.对分类变量X与Y,随机变量χ2的观测值越大,则判断“X与Y有关系”的把握程度越大
【答案】B
【分析】根据线性关系系数的意义判断变量的正负相关性、相关强弱关系,根据回归方程判断单位增量,根据独立检验的观测值大小与可靠程度的关系,判断变量关系的把握程度即可.
【详解】A:线性相关系数为正时,变量为正相关关系,正确;
B:两个随机变量的线性相关性越强,相关系数r的绝对值就越接近于1,错误;
C:在回归直线方程中,当时,,正确;
D:随机变量χ2的观测值越大,变量间的关系把握程度越大,正确.
故选:B.
统计图表的主要应用 扇形图:直观描述各类数据占总数的比例; 折线图:描述数据随时间的变化趋势; 条形图和直方图:直观描述不同类别或分组数据的频数和频率.
题型2 一元线性回归模型
6.(2024·陕西安康·模拟预测)随着移动互联网和直播带货技术的发展,直播带货已经成为一种热门的销售方式,特别是商家通过展示产品,使顾客对商品有更全面的了解.下面统计了某新手开启直播带货后从6月份到10月份每个月的销售量(万件)的数据,得到如图所示的散点图.其中6月份至10月份相应的代码为,如:表示6月份.
(1)根据散点图判断,模型①与模型②哪一个更适宜作为月销售量关于月份代码的回归方程 (给出判断即可,不必说明理由)
(2)(i)根据(1)的判断结果,建立关于的回归方程;(计算结果精确到0.01)
(ⅱ)根据结果预测12月份的销售量大约是多少万件
参考公式与数据:, ,,其中.
【详解】(1)由散点图可知增加幅度不一致,且散点图接近于曲线,非线性,
结合图象故选模型②.
(2)(i)令,则,
可得,,
则,,
所以关于的回归方程为,
即关于的回归方程;
(ⅱ)令,可得,
预测12月份的销售量大约是13.9万件.
7.(2024高三·全国·专题练习)近年来,随着国家对新能源汽车产业的支持,很多国产新能源汽车迅速崛起,其因颜值高、动力充沛、提速快、空间大、用车成本低等特点得到民众的追捧,但是充电难成为影响新能源汽车销量的主要原因,国家为了加快新能源汽车的普及程度,在全国范围内逐步增建充电桩.某地区2019-2023年的充电桩数量及新能源汽车的年销量如表所示:
年份 2019 2020 2021 2022 2023
充电桩数量x/万台 1 3 5 7 9
新能源汽车年销量y/万辆 25 37 48 58 72
(1)已知可用线性回归模型拟合y与x的关系,请用相关系数加以说明(结果精确到0.001);
(2)求y关于x的线性回归方程,预测当该地区充电桩数量为24万台时,新能源汽车的年销量是多少万辆?
参考公式:相关系数,回归方程中斜率和截距的最小二乘估计公式分别为,.
参考数据:,,,.
【详解】(1)由题知,,
又,,,
所以,
因为y与x的相关系数近似为0.999,非常接近1,
所以y与x的线性相关程度很高,可以用线性回归模型拟合y与x的关系.
(2),,
所以y关于x的线性回归方程为.
当时,,
故当充电桩数量为24万台时,该地区新能源汽车的年销量为157.25万辆.
求回归直线方程的步骤
题型3 列联表与独立性检验
8.(2024·宁夏石嘴山·三模)2023年9月23日至10月8日,第19届亚洲运动会在我国杭州举行,这是我国继北京、广州亚运会后第三次举办亚运会. 某电信公司为了解当地市民对“亚运会”相关知识的认知程度,举办了一次“亚运会”网络知识竞赛,满分100分. 现从参加了竞赛的男、女市民中各随机抽取100名市民的竞赛成绩作为样本进行数据分析,对这100名男市民的竞赛成绩进行统计后,得到如图所示的频率分布直方图.现规定成绩不低于80分的市民获优秀奖,若女市民样本中获得优秀奖的人数占比为.
(1)根据题中信息完成如下列联表,并判断是否有的把握认为该市市民在这次知识竞赛中获得优秀奖与性别有关?
(2)将样本分布的频率视为总体分布的概率,电信公司对在这次竞赛中获得优秀奖的市民每人将发放50元手机话费充值卡的奖励. 从该市所有参赛的市民中随机抽取10人,记电信公司发放的手机话费充值卡的总金额数为元,求的数学期望.
优秀奖 非优秀奖 合计


合计
附:,其中.
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
【详解】(1),,,
故男市民中得优秀奖的人数为,女市民中得优秀奖的人数为,
可得如下列联表:
优秀奖 非优秀奖 合计
男 25 75 100
女 5 95 100
合计 30 170 200
故,
故有的把握认为该市市民在这次知识竞赛中获得优秀奖与性别有关.
(2)由上可知:获奖的概率,令为获得优秀奖的市民人数,
则,有,
易知元.
9.(2024·全国·模拟预测)随着人工智能的进一步发展,逐渐进入大众视野.是一种基于人工智能的语言模型,具备卓越的自然语言处理能力、广泛的知识覆盖范围和富有创造性的回答能力,是人们学习、工作与生活中的出色助手.尽管如此,也有部分人认为会对人类未来工作产生威胁,由于其在提高工作效率方面的出色表现,将在未来取代一部分人的职业.现对200家企业开展调查,统计每家企业一年内应用的广泛性及招聘人数的增减,得到数据结果统计如下表所示:
应用广泛性 招聘人数减少 招聘人数增加 合计
广泛应用 60 50 110
没有广泛应用 40 50 90
合计 100 100 200
(1)根据小概率的独立性检验,是否有99%的把握认为企业招聘人数的增减与应用的广泛性有关?
(2)用频率估计概率,从招聘人数减少的企业中随机抽取30家企业,记其中广泛应用的企业有X家,事件“”的概率为.求X的分布列并计算使取得最大值时k的值.
附:,其中.
0.1 0.05 0.01
2.706 3.841 6.635
【答案】(1)无关;
(2)且;.
【详解】(1)零假设企业招聘人数的增减与应用的广泛性无关,
因为,
所以,根据的独立性检验,没有充分证据推断不成立,
因此可认为企业招聘人数的增减与应用的广泛性无关.
(2)由题知,从招聘人数减少的企业中随机抽取1家企业,该企业广泛应用的概率为,没有广泛应用的概率为,
因为,
所以X的分布列为且.
若是最大值,则且,
根据,
即,整理得,解得,
又且,所以.
即使取得最大值时k的值为18.
独立性检验的一般步骤 (1)根据样本数据制成2×2列联表. (2)根据公式χ2=计算. (3)比较χ2与临界值的大小关系,作统计推断.重难点11 概率与统计
考点一 计数原理
分类加法和分步乘法计数原理
排列与组合
二项式定理
考点二 概率
随机事件与概率
2、古典概型
3、概率综合
考点三 随机变量及其分布列
1、离散型随机变量及其分布列、数字特征
2、二项分布和超几何分布
3、正态分布
考点四 统计模型
1、随机抽样、统计图表
2、一元线性回归模型
3、列联表与独立性检验
考点一:计数原理
基本计数原理
基本计数原理
(1)分类加法计数原理:完成一件事,如果有n类办法,且:第一类办法中有m1种不同的方法,第二类办法中有m2种不同的方法……第n类办法中有mn种不同的方法,那么完成这件事共有N=m1+m2+…+mn种不同的方法.
(2)分步乘法计数原理:完成一件事,如果需要分成n个步骤,且:做第一步有m1种不同的方法,做第二步有m2种不同的方法……做第n步有mn种不同的方法.那么完成这件事共有N=m1×m2×…×mn种不同的方法.
排列与组合
1.排列与组合的概念
名称 定义
排列 从n个不同对象中取出m(m≤n)个对象 按照一定的顺序排成一列
组合 作为一组
2.排列数与组合数
(1)排列数:从n个不同对象中取出m(m≤n)个对象的所有排列的个数.
(2)组合数:从n个不同对象中取出m(m≤n)个对象的所有组合的个数.
3.排列数、组合数的公式及性质
公式 (1)A=n(n-1)(n-2)…(n-m+1)=(n,m∈N*,且m≤n). (2)C==(n,m∈N*,且m≤n).特别地,C=1
性质 (1)0!=1;A=n!. (2)C=C;C=C+C
二项式定理
1.二项式定理
二项式定理 (a+b)n=Can+Can-1b1+…+Can-kbk+…+Cbn(n∈N*)
二项展开式的通项 Tk+1=Can-kbk,它表示展开式的第k+1项
二项式系数 C(k=0,1,…,n)
2.二项式系数的性质
(1)对称性:与首末两端“等距离”的两个二项式系数相等.
(2)增减性与最大值:当n是偶数时,中间的一项取得最大值;当n是奇数时,中间的两项与相等,且同时取得最大值.
(3)各二项式系数的和:(a+b)n的展开式的各二项式系数的和为C+C+C+…+C=2n.
题型1 基本计数原理
1.(22-23高二下·天津·期末)从1,2,3,4,5五个数字中,选出一个偶数和两个奇数,组成一个没有重复数字的三位数,这样的三位数共有( )
A.24个 B.36个 C.48个 D.54个
2.(2023·天津和平·三模)①一组数据的第三四分位数为8;
②若随机变量,且,则;
③具有线性相关关系的变量,其线性回归方程为,若样本的中心,则;
④如图,现要用5种不同的颜色对某市的4个区县地图进行着色,要求有公共边的两个地区不能用同一种颜色,共有180种不同的着色方法.
以上说法正确的个数为( )
A.1个 B.2个 C.3个 D.4个
3.(2023·天津·一模)甲、乙、丙、丁、戊五只猴子在一棵枯树上玩耍,假设它们均不慎失足下落,已知:(1)甲在下落的过程中依次撞击到树枝,,;(2)乙在下落的过程中依次撞击到树枝,,;(3)丙在下落的过程中依次撞击到树枝,,;(4)丁在下落的过程中依次撞击到树枝,,;(5)戊在下落的过程中依次撞击到树枝,,,则下列结论正确的是( )
A.最高处的树枝定是 B.最低处的树枝一定是
C.九根树枝从高到低不同的顺序共有种 D.九根树枝从高到低不同的顺序共有种
4.(2020·天津南开·二模)某学校食堂为了进一步加强学校疫情防控工作,降低学生因用餐而交叉感染的概率,规定:就餐时,每张餐桌(如图)至多坐两个人,一张餐桌坐两个人时,两人既不能相邻,也不能相对(即二人只能坐在对角线的位置上).现有3位同学到食堂就餐,如果3人在1号和2号两张餐桌上就餐(同一张餐桌的4个座位是没有区别的),则不同的坐法种数为( )
A.6 B.12 C.24 D.48
5.(23-24高三上·天津·期末)从4名女生、6名男生中,按性别采用分层抽样的方法抽取5名学生组成课外小组,则不同的抽取方法种数为( )
A.1440 B.120 C.60 D.24
利用分步乘法计数原理解题的策略 (1)明确题目中的“完成这件事”是什么,确定完成这件事需要几个步骤,且每步都是独立的. (2)将这件事划分成几个步骤来完成,各步骤之间有一定的连续性,只有当所有步骤都完成了,整个事件才算完成.
题型2 排列与组合
6.(20-21高二下·天津滨海新·期末)某高中期中考试需要考查九个学科(语文、数学、英语、生物、物理、化学、政治、历史、地理),已知语文考试必须安排在首场,且物理考试与英语考试不能相邻,则这九个学科不同的考试顺序共有( )种
A. B. C. D.
7.(20-21高三上·天津滨海新·阶段练习)第十四届全国运动会将于2021年在陕西举办,为宣传地方特色,某电视台拍摄宣传片五组进行制作编辑,其中包括有美食宣传片 地方风光宣传片各两个,运动场地宣传片一个,所有短片时长彼此不同,现将五组短片编辑在一起,相同题材不相邻,不同的排法共有( )
A.24种 B.48种 C.72种 D.120种
8.(2020·天津河西·二模)用数字0,1,2,3,4组成没有重复数字且至少有两个数字是偶数的四位数,则这样的四位数的个数为
A.64 B.72 C.96 D.144
9.(2008·天津·高考真题)有8张卡片分别标有数字1,2,3,4,5,6,7,8,从中取出6张卡片排成3行2列,要求3行中仅有中间行的两张卡片上的数字之和为5,则不同的排法共有
A.1344种 B.1248种 C.1056种 D.960种
10.(2020·天津宁河·二模)我国古代典籍《周易》用“卦”描述万物的变化.每一“重卦”由从下到上排列的6个爻组成,爻分为阳爻“”和阴爻“一一”,如图就是一重卦.在所有重卦中随机取一重卦,则该重卦恰有3个阳爻的概率是( )
A. B. C. D.
组合问题常有以下两类题型 (1)“含有”或“不含有”问题:“含”,则先将这些元素取出,再由另外元素补足;“不含”,则先将这些元素剔除,再从剩下的元素中去选取. (2)“至少”或“最多”问题:用直接法和间接法都可以求解,通常用直接法,分类复杂时,考虑逆向思维,用间接法处理.
题型3 数列的性质
11.(23-24高三下·天津·阶段练习)多项式展开式中的系数为( )
A.985 B.750 C.940 D.680
12.(23-24高三上·天津滨海新·阶段练习)若的展开式的二项式系数之和为,则的展开式中的系数为( )
A.8 B.28 C.56 D.70
13.(23-24高三上·天津河东·阶段练习)在的展开式中,若第2项系数为,则a值为( )
A.2 B. C. D.
14.(2021·天津静海·三模)已知的二项展开式的奇数项二项式系数和为,若,则等于( )
A. B. C. D.
15.(2020·天津·模拟预测)在的二项展开式中,的系数为( )
A. B.10 C. D.5
(1)求二项展开式中的特定项,一般是化简通项后,令字母的指数符合要求(求常数项时,指数为零;求有理项时,指数为整数等),解出项数k+1,代回通项即可. (2)对于几个多项式积的展开式中的特定项问题,一般可以根据因式连乘的规律,结合组合思想求解,但要注意适当地运用分类方法,以免重复或遗漏.
考点二:概率
随机事件与概率
1.样本空间和随机事件
(1)样本点和样本空间
样本点:随机试验中每一种可能出现的结果称为样本点.
样本空间:由所有样本点组成的集合称为样本空间,常用Ω表示.
(2)随机事件
一般地,如果随机试验的样本空间为Ω,则随机事件A是Ω的一个非空真子集,而且若试验的结果是A中的元素,则称A发生,否则,称A不发生.
2.两个事件的关系和运算
含义 符号表示
包含关系 A发生导致B发生 A B
相等关系 B A且A B A=B
并事件(和事件) A与B至少一个发生 A∪B或A+B
交事件(积事件) A与B同时发生 A∩B或AB
互斥(互不相容) A与B不能同时发生 A∩B=
互为对立 A与B有且仅有一个发生 A∩B= ,A∪B=Ω
3.古典概型的特征
(1)有限性:样本空间所包含的样本点个数是有限的;
(2)等可能性:每个基本事件发生的可能性大小都相等.
4.古典概型的概率公式
假设样本空间含有n个样本点,如果事件C包含m个样本点,则由互斥事件的概率加法公式可知P(C)=.
其中,n(A)和n(Ω)分别表示事件A和样本空间Ω包含的样本点个数.
5.概率的性质
性质1:对任意的事件A,都有P(A)≥0;
性质2:必然事件的概率为1,不可能事件的概率为0,即P(Ω)=1,P( )=0;
性质3:如果事件A与事件B互斥,那么P(A+B)=P(A)+P(B);
性质4:如果事件A与事件B互为对立事件,那么P(B)=1-P(A),P(A)=1-P(B);
性质5:如果A B,那么P(A)≤P(B),由该性质可得,对于任意事件A,因为 A Ω,所以0≤P(A)≤1;
性质6:设A,B是一个随机试验中的两个事件,有P(A+B)=P(A)+P(B)-P(AB).
6.频率与概率
(1)频率的稳定性
一般地,如果在n次重复进行的试验中,一个事件发生的频率会很接近于这个事件发生的概率,而且,试验的次数越多,频率与概率之间差距很小的可能性越大.
(2)频率稳定性的作用:可以用频率fn(A)估计概率P(A).
事件的独立性和条件概率、全概率公式
1.相互独立事件
(1)概念:如果P(AB)=P(A)P(B)成立,则称事件A与事件B相互独立,简称为独立.
(2)性质:若事件A与B相互独立,那么A与,与B,与也都相互独立.
2.条件概率
(1)概念:一般地,当事件B发生的概率大于0(即P(B)>0)时,已知事件B发生的条件下事件A发生的概率,称为条件概率,记作P(A|B),而且P(A|B) =.
(2)两个公式
①利用古典概型:P(B|A)=;
②概率的乘法公式:P(AB)=P(A)P(B|A).
3.全概率公式
一般地,如果样本空间为Ω,A,B为事件,则BA与B是互斥的,且B=BΩ=B(A+)=BA+B,从而P(B)=P(BA+B)=P(BA)+P(B),当P(A)>0且P()>0时,有P(B)=P(A)P(B|A)+P()P(B|).
常用结论
1.如果事件A1,A2,…,An相互独立,那么这n个事件同时发生的概率等于每个事件发生的概率的积,即P(A1A2…An)=P(A1)P(A2)…P(An).
2.贝叶斯公式:设A,是一组对立事件,A+=Ω,0<P(A)<1,则对任意事件B Ω,P(B)>0,有P(A|B)==
题型1 随机事件与概率
16.(23-24高三上·天津·期末)已知某公路上经过的货车与客车的数量之比为,货车和客车中途停车修理的概率分别为和,则一辆汽车中途停车修理的概率为( )
A. B. C. D.
17.(2023·天津·一模)某滑冰馆统计了某小区居民在该滑冰馆一个月的锻炼天数,得到如图所示的频率分布直方图(将频率视为概率),则下列说法正确的是( )
A.该小区居民在该滑冰馆的锻炼天数在区间内的最少
B.估计该小区居民在该滑冰馆的锻炼天数超过15天的概率为0.465
C.估计该小区居民在该滑冰馆的锻炼天数的中位数为16
D.估计小区居民在该滑冰馆的锻炼天数的平均值为15
18.(22-23高三上·天津红桥·期中)甲、乙二人的投篮命中率分别为0.9、0.8,若他们二人每人投篮一次,则至少一人命中的概率为( )
A.0.72 B.0.27 C.0.26 D.0.98
19.(20-21高三上·天津滨海新·阶段练习)从5双不同的袜子中取4只,使至少有2只袜子配成一双的可能取法种数为( )
A.20 B.30 C.130 D.140
20.(20-21高三上·天津南开·开学考试)两人独立地破译一个密码,他们能译出的概率分别为、,则密码被译出的概率为(  )
A. B. C. D.
求解古典概型的综合问题的步骤 (1)将题目条件中的相关知识转化为事件; (2)判断事件是否为古典概型; (3)选用合适的方法确定样本点个数; (4)代入古典概型的概率公式求解.
题型2 古典概型
21.(22-23高三上·天津河北·期末)将三颗骰子各掷一次,记事件“三个点数都不同”,“至少出现一个点”,则条件概率,分别等于( )
A., B., C., D.,
22.(2022·天津红桥·一模)已知盒中装有大小、质量完全相同的2个黑球,3个红球,现从盒中随机抽取2个球,则取出的两个球颜色相同的概率为( )
A. B. C. D.
23.(2016高三·天津红桥·学业考试)将一枚硬币先后抛掷两次,恰好出现一次正面的概率是( )
A. B. C. D.
24.(2016高三·天津红桥·学业考试)从甲、乙、丙、丁四名同学中选2人参加普法知识竞赛,则甲被选中的概率为( )
A. B. C. D.
25.(19-20高三上·天津红桥·期末)袋中共有个球,其中有个红球、个黄球和个绿球,这些球除颜色外完全相同,若从袋中一次随机抽出个球,则取出的个球颜色相同的概率为( )
A. B.
C. D.
求条件概率的常用方法 (1)定义法:P(B|A)=. (2)样本点法:P(B|A)=.
题型2 概率综合
26.(19-20高三上·天津宁河·阶段练习)某单位名员工参加“社区低碳你我他”活动,他们的年龄在25岁至50岁之间,按年龄分组:第1组,第2组,第3组,第4组,第5组,得到的频率分布图如图所示,下表是年龄的频率分布表.
区间
人数 20
(1)补全表格中的数据(不需要写过程);
(2)现要从年龄较小的第组中用分层抽样的方法抽取6人,求从第组分别抽取的人数;
(3)在(2)的条件下,从这6人中再随机抽取2人参加社区宣传交流活动,求2人不在同一年龄组的概率.
27.(2024·福建三明·三模)某校开设劳动教育课程,为了有效推动课程实施,学校开展劳动课程知识问答竞赛,现有家政、园艺、民族工艺三类问题海量题库,其中家政类占,园艺类占,民族工艺类占.根据以往答题经验,选手甲答对家政类、园艺类、民族工艺类题目的概率分别为,选手乙答对这三类题目的概率均为
(1)求随机任选1题,甲答对的概率;
(2)现进行甲、乙双人对抗赛,规则如下:两位选手进行三轮答题比赛,每轮只出1道题目,比赛时两位选手同时回答这道题,若一人答对且另一人答错,则答对者得1分,答错者得分,若两人都答对或都答错,则两人均得0分,累计得分为正者将获得奖品,且两位选手答对与否互不影响,每次答题的结果也互不影响,求甲获得奖品的概率.
28.(2024·四川成都·三模)某手机生产厂商要生产一款5G手机,在生产之前,该公司对手机屏幕的需求尺寸进行社会调查,共调查了400人,将这400人按对手机屏幕的需求尺寸分为6组,分别是:,,,,,(单位:英寸),得到如下频率分布直方图:其中,屏幕需求尺寸在的一组人数为50人.

(1)求和的值;
(2)用分层抽样的方法在屏幕需求尺寸为和两组人中抽取6人参加座谈,并在6人中选择2人做代表发言,则这2人来自同一分组的概率是多少?
考点三:随机变量及其分布列
离散型随机变量及其分布列、数字特征
1.离散型随机变量
一般地,如果随机试验的样本空间为Ω,而且对于Ω中的每一个样本点,变量X都对应有唯一确定的实数值,就称X为一个随机变量.其所有可能的取值都是可以一一列举的随机变量称为离散型随机变量.
2.离散型随机变量的分布列
一般地,当离散型随机变量X的取值范围是{x1,x2,…,xn}时,如果对任意k∈{1,2,…,n},概率P(X=xk)=pk都是已知的,则称X的概率分布是已知的.离散型随机变量X的概率分布也可以用如下形式的表格表示,
X x1 x2 … xk … xn
P p1 p2 … pk … pn
此表称为X的概率分布或分布列.
3.离散型随机变量的分布列的性质
①pk≥0(k=1,2,…,n);
②k=p1+p2+…+pn=1.
4.离散型随机变量的均值与方差
一般地,若离散型随机变量X的分布列为
X x1 x2 … xn
P p1 p2 … pn
(1)均值
则称E(X)=x1p1+x2p2+…+xnpn=ipi为随机变量X的均值或数学期望,数学期望简称期望.它反映了离散型随机变量取值的平均水平.
(2)方差
称D(X)=[x1-E(X)]2p1+[x2-E(X)]2p2+…+[xn-E(X)]2pn=xi-E(X)]2pi为随机变量X的方差,并称为随机变量X的标准差,它们都可以度量随机变量取值与其均值的偏离程度.
5.均值与方差的性质
(1)E(aX+b)=aE(X)+b.
(2)D(aX+b)=a2D(X)(a,b为常数).
二项分布、超几何分布和正态分布
1.n次独立重复试验与二项分布
(1)n次独立重复试验
在相同条件下重复n次伯努利试验,约定这n次试验是相互独立的,此时这n次伯努利试验也常称为n次独立重复试验.
(2)二项分布
一般地,如果一次伯努利试验中,出现“成功”的概率为p,记q=1-p,且n次独立重复试验中出现“成功”的次数为X,则X的取值范围是{0,1,…,k,…,n},而且P(X=k)=Cpkqn-k(k=0,1,2,…,n),因此X的分布列如下表所示:
X 0 1 … k … n
P Cp0qn Cp1qn-1 … Cpkqn-k … Cpnq0
由于表中的第二行中的概率值恰好是二项展开式(q+p)n=Cp0qn+Cp1qn-1+…+Cpkqn-k+…+Cpnq0中对应项的值,因此称X服从参数为n,p的二项分布,记作X~B(n,p).
(3)两点分布与二项分布的均值、方差
①若随机变量X服从两点分布,则E(X)=p,D(X)=p(1-p).
②若X~B(n,p),则E(X)=np,D(X)=np(1-p).
2.超几何分布
一般地,假设一批产品共有N件,其中有M件次品.从N件产品中随机抽取n件(不放回),用X表示抽取的n件产品中的次品数,则X的分布列为P(X=k)=,k=t,t+1,t+2,…,s,其中,n,N,M∈N+,M≤N,n≤N,t=max{0,n-N+M},s=min{n,M},如果随机变量X的分布列具有上式的形式,那么称随机变量X服从超几何分布.
3.正态分布
(1)定义
一般地,如果随机变量X落在区间[a,b]内的概率,总是等于φμ,σ(x)对应的正态曲线与x轴在区间[a,b]内围成的面积,则称X服从参数为μ与σ的正态分布.
(2)正态曲线的特点
①曲线是单峰的,它关于直线x=μ对称;
②曲线在x=μ处达到峰值;
③当|x|无限增大时,曲线无限接近x轴.
(3)3σ原则
P(|X-μ|≤σ)=P(μ-σ≤X≤μ+σ)≈68.3%,
P(|X-μ|≤2σ)=P(μ-2σ≤X≤μ+2σ)≈95.4%,
P(|X-μ|≤3σ)=P(μ-3σ≤X≤μ+3σ)≈99.7%.
(4)正态分布的均值与方差
若X~N(μ,σ2),则E(X)=μ,D(X)=σ2.
题型1 离散型随机变量及其分布列、数字特征
1.(2024·天津·一模)下列说法正确的是( )
A.一组数据的第80百分位数为17;
B.根据分类变量与的成对样本数据,计算得到,根据小概率值的独立性检验,可判断与有关联,此推断犯错误的概率不大于0.05;
C.两个随机变量的线性相关性越强,相关系数的绝对值越接近于0;
D.若随机变量满足,则.
2.(2024·天津南开·一模)已知随机变量,且,则( )
A. B. C. D.
3.(23-24高三上·天津武清·阶段练习)有两个随机变量和,它们的分布列分别如下表:
1 2 3 4 5
0.03 0.3 0.5 0.16 0.01
1 2 3 4 5
0.1 0.2 0.3 0.2 0.2
则关于它们的期望,和它们的方差和,下列关系正确的是( )
A.,且 B.,且
C.,且 D.,且
4.(2023·天津·一模)下列命题错误的是( )
A.两个随机变量的线性相关性越强,相关系数的绝对值越接近于
B.设,且,则
C.线性回归直线一定经过样本点的中心
D.随机变量,若,则
5.(21-22高三上·天津红桥·期末)一名学生申请加入学校的个社团,假设各个社团通过这名学生的申请是相互独立的,并且概率都是,设是这名学生申请被通过的次数,则随机变量的期望为( )
A. B.
C. D.
求离散型随机变量ξ的均值与方差的步骤 (1)理解ξ的意义,写出ξ的所有可能取值. (2)求ξ取每个值的概率. (3)写出ξ的分布列. (4)由均值、方差的定义求E(ξ),D(ξ).
题型2 二项分布、超几何分布
6.(2021·天津宝坻·模拟预测)冠状病毒是一个大型病毒家族,已知可引起感冒以及中东呼吸综合征(MERS)和严重急性呼吸综合征(SARS)等较严重疾病,而新型冠状病毒(nCoV)是以前从未在人体中发现的冠状病毒新毒株人,感染了新型冠状病毒后常见体征有呼吸道症状,发热、咳嗽、气促和呼吸困难等在较严重病例中,感染可导致肺炎,严重急性呼吸综合征,肾衰竭,甚至死亡.假如某医药研究机构合成了甲、乙两种抗“新冠病毒”的药物.经试验,服用甲、乙两种药物痊愈的概率分别为,现已进入药物临床试用阶段.每个试用组由4位该病毒的感染者组成.其中2人试用甲种抗病毒药物,2人试用乙种抗病毒药物.如果试用组中,甲种抗病毒药物治愈人数超过乙种抗病毒药物的治愈人数,则称该组为“甲类组”.
(1))求一个试用组为“甲类组”的概率;
(2)观察3个试用组,用表示这3个试用机组“甲类组”的个数,求的分布列和数学期望.
7.(22-23高三上·陕西渭南·阶段练习)甲 乙两班进行消防安全知识竞赛,每班出3人组成甲乙两支代表队,首轮比赛每人一道必答题,答对则为本队得1分,答错或不答都得0分,已知甲队3人每人答对的概率分别为,乙队每人答对的概率都是,设每人回答正确与否相互之间没有影响,用X表示甲队总得分.
(1)求的概率;
(2)求甲队和乙队得分之和为4的的概率.
8.(20-21高三上·天津和平·阶段练习)随着马拉松运动在全国各地逐渐兴起,参与马拉松训练与比赛的人数逐年增加.为此,某市对参加马拉松运动的情况进行了统计调查,其中一项是调查人员从参与马拉松运动的人中随机抽取100人,对其每月参与马拉松运动训练的天数进行统计,得到以下统计表:
平均每月进行训练的天数
人数 10 60 30
(1)以这100人平均每月进行训练的天数位于各区间的频率代替该市参与马拉松训练的人平均每月进行训练的天数位于该区间的概率,从该市所有参与马拉松训练的人中随机抽取4个人,求恰好有2个人是“平均每月进行训练的天数不少于20天”的概率;
(2)依据统计表,用分层抽样的方法从这100个人中抽取20个,再从抽取的20个人中随机抽取4个,表示抽取的是“平均每月进行训练的天数不少于20天”的人数,求的分布列及数学期望.
9.(2020·天津·一模)近年来,随着全球石油资源紧张、大气污染日益严重和电池技术的提高,电动汽车已被世界公认为21世纪汽车工业改造和发展的主要方向.为了降低对大气的污染和能源的消耗,某品牌汽车制造商研发了两款电动汽车车型和车型,并在黄金周期间同时投放市场.为了了解这两款车型在黄金周的销售情况,制造商随机调查了5家汽车店的销量(单位:台),得到下表:
店 甲 乙 丙 丁 戊
车型 6 6 13 8 11
车型 12 9 13 6 4
(1)若从甲、乙两家店销售出的电动汽车中分别各自随机抽取1台电动汽车作满意度调查,求抽取的2台电动汽车中至少有1台是车型的概率;
(2)现从这5家汽车店中任选3家举行促销活动,用表示其中车型销量超过车型销量的店的个数,求随机变量的分布列和数学期望.
(1)超几何分布描述的是不放回抽样问题,随机变量为抽到的某类个体的个数.超几何分布的特征是:①考察对象分两类;②已知各类对象的个数;③从中抽取若干个个体,考查某类个体数X的分布列. (2)超几何分布主要用于抽检产品、摸不同类别的小球等概率模型,其本质是古典概型.
题型3 正态分布
10.(2024·福建福州·模拟预测)甲企业生产线上生产的零件尺寸的误差服从正态分布,规定的零件为优等品,的零件为合格品.
(1)从该生产线上随机抽取100个零件,估计抽到合格品但非优等品的个数(精确到整数);
(2)乙企业拟向甲企业购买这批零件,先对该批零件进行质量抽检,检测的方案是:从这批零件中任取2个作检测,若这2个零件都是优等品,则通过检测;若这2个零件中恰有1个为优等品,1个为合格品但非优等品,则再从这批零件中任取1个作检测,若为优等品,则通过检测;其余情况都不通过检测.求这批零件通过检测时,检测了2个零件的概率(精确到0.01).
(附:若随机变量,则,,)
11.(2024·湖南岳阳·三模)某地区举行专业技能考试,共有8000人参加,分为初试和复试,初试通过后,才能参加复试.为了解考生的考试情况,随机抽取了100名考生的初试成绩,并以此为样本,绘制了样本频率分布直方图,如图所示.
(1)若所有考生的初试成绩近似服从正态分布,其中为样本平均数的估计值,,试利用正态分布估计所有考生中初试成绩不低于85分的人数;
(2)复试共四道题,前两道题考生每题答对得5分,答错得0分,后两道题考生每题答对得10分,答错得0分,四道题的总得分为考生的复试成绩.已知某考生进入复试,他在复试中,前两题每题能答对的概率均为,后两题每题能答对的概率均为,且每道题回答正确与否互不影响.规定复试成绩上了20分(含20分)的考生能进入面试,请问该考生进入面试的概率有多大
附:若随机变量X服从正态分布,则:,.
解决正态分布问题的三个关键点 (1)对称轴为x=μ. (2)标准差为σ. (3)分布区间. 利用对称性可求指定范围内的概率值;由μ,σ,分布区间的特征进行转化,使分布区间转化为3σ特殊区间,从而求出所求概率.注意只有在标准正态分布下对称轴才为x=0.
考点四:统计模型
随机抽样、统计图表
1.总体、个体、样本
所考察问题涉及的对象全体是总体,总体中每个对象都是个体,抽取的部分对象组成总体的一个样本,一个样本中包含的个体数目是样本容量.
2.简单随机抽样
抽签法和随机数表法是比较常用的两种方法.
3.分层抽样
一般地,如果相对于要考察的问题来说,总体可以分成有明显差别的、互不重叠的几部分时,每一部分可称为层,在各层中按层在总体中所占比例进行随机抽样的方法称为分层随机抽样(简称为分层抽样).
4.统计图表
(1)常见的统计图表有条形图、扇形图、折线图、频率分布直方图、茎叶图等.
(2)作频率分布直方图的步骤
①求极差;
②决定组距与组数;
③将数据分组;
④列频率分布表;
⑤画频率分布直方图.
一元线性回归模型
1.变量的相关关系
(1)相关关系:两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.
(2)相关关系的分类:正相关和负相关.
(3)线性相关:如果变量x与变量y之间的关系可以近似地用一次函数来刻画,则称x与y线性相关.
2.相关系数
(1)r=.
(2)当r>0时,称成对样本数据正相关;当r<0时,称成对样本数据负相关.
(3)|r|≤1;当|r|越接近1时,成对样本数据的线性相关程度越强;当|r|越接近0时,成对样本数据的线性相关程度越弱.
3.一元线性回归模型
(1)我们将=x+称为y关于x的回归直线方程,
其中
(2)残差:观测值减去预测值称为残差.
列联表与独立性检验
列联表与独立性检验
(1)2×2列联表:如果随机事件A与B的样本数据如下表格形式:
A 总计
B a b a+b
c d c+d
总计 a+c b+d a+b+c+d
在这个表格中,核心的数据是中间的4个格子,所以这样的表格通常称为2×2列联表.
(2)在2×2列联表中,定义随机变量
χ2=,任意给定α(称为显著性水平),可以找到满足条件P(χ2≥k)=α的数k(称为显著性水平α对应的分位数),
①若χ2≥k成立,就称在犯错误的概率不超过α的前提下,可以认为A与B不独立(也称A与B有关),或说有1-α的把握认为A与B有关;
②若χ2这一过程通常称为独立性检验.
题型1 随机抽样、统计图表
1.(2024·天津·二模)某校举办了数学知识竞赛,把1000名学生的竞赛成绩(满分100分,成绩取整数)按,,,分成四组,并整理成如图所示的频率分布直方图,则下列说法正确的为( )
A.的值为0.015 B.估计这组数据的众数为80
C.估计这组数据的第60百分位数为87 D.估计成绩低于80分的有350人
2.(2024·天津·二模)有人通过调查统计发现,儿子成年时的身高与父亲的身高呈线性相关,且儿子成年时的身高(单位:)与父亲的身高(单位:)的经验回归方程为,根据以上信息,下列判断正确的为( ).
A.儿子成年时的身高与父亲的身高的样本相关系数
B.父亲的身高为,儿子成年时的身高一定在到之间
C.父亲的身高每增加,儿子成年时的身高平均增加
D.儿子在成年时的身高一般会比父亲高
3.(23-24高三下·天津·阶段练习)将收集到的天津一中2021年高考数学成绩绘制出频率分布直方图,如图所示,则下列说法中不正确的是( )
A.
B.高三年级取得130分以上的学生约占总数的65%
C.高三年级的平均分约为133.2
D.高三年级成绩的中位数约为125
4.(2023·天津河北·一模)已知甲乙两组数据分别为和,则下列说法中不正确的是( )
A.甲组数据中第70百分位数为23 B.甲乙两组数据的极差相同
C.乙组数据的中位数为25.5 D.甲乙两组数据的方差相同
5.(2024高三下·天津·专题练习)下列说法错误的是( )
A.线性相关系数时,两变量正相关
B.两个随机变量的线性相关性越强,则相关系数r的值就越接近于1
C.在回归直线方程中,当解释变量x每增加1个单位时,预报变量平均增加0.2个单位
D.对分类变量X与Y,随机变量χ2的观测值越大,则判断“X与Y有关系”的把握程度越大
统计图表的主要应用 扇形图:直观描述各类数据占总数的比例; 折线图:描述数据随时间的变化趋势; 条形图和直方图:直观描述不同类别或分组数据的频数和频率.
题型2 一元线性回归模型
6.(2024·陕西安康·模拟预测)随着移动互联网和直播带货技术的发展,直播带货已经成为一种热门的销售方式,特别是商家通过展示产品,使顾客对商品有更全面的了解.下面统计了某新手开启直播带货后从6月份到10月份每个月的销售量(万件)的数据,得到如图所示的散点图.其中6月份至10月份相应的代码为,如:表示6月份.
(1)根据散点图判断,模型①与模型②哪一个更适宜作为月销售量关于月份代码的回归方程 (给出判断即可,不必说明理由)
(2)(i)根据(1)的判断结果,建立关于的回归方程;(计算结果精确到0.01)
(ⅱ)根据结果预测12月份的销售量大约是多少万件
参考公式与数据:, ,,其中.
7.(2024高三·全国·专题练习)近年来,随着国家对新能源汽车产业的支持,很多国产新能源汽车迅速崛起,其因颜值高、动力充沛、提速快、空间大、用车成本低等特点得到民众的追捧,但是充电难成为影响新能源汽车销量的主要原因,国家为了加快新能源汽车的普及程度,在全国范围内逐步增建充电桩.某地区2019-2023年的充电桩数量及新能源汽车的年销量如表所示:
年份 2019 2020 2021 2022 2023
充电桩数量x/万台 1 3 5 7 9
新能源汽车年销量y/万辆 25 37 48 58 72
(1)已知可用线性回归模型拟合y与x的关系,请用相关系数加以说明(结果精确到0.001);
(2)求y关于x的线性回归方程,预测当该地区充电桩数量为24万台时,新能源汽车的年销量是多少万辆?
参考公式:相关系数,回归方程中斜率和截距的最小二乘估计公式分别为,.
参考数据:,,,.
求回归直线方程的步骤
题型3 列联表与独立性检验
8.(2024·宁夏石嘴山·三模)2023年9月23日至10月8日,第19届亚洲运动会在我国杭州举行,这是我国继北京、广州亚运会后第三次举办亚运会. 某电信公司为了解当地市民对“亚运会”相关知识的认知程度,举办了一次“亚运会”网络知识竞赛,满分100分. 现从参加了竞赛的男、女市民中各随机抽取100名市民的竞赛成绩作为样本进行数据分析,对这100名男市民的竞赛成绩进行统计后,得到如图所示的频率分布直方图.现规定成绩不低于80分的市民获优秀奖,若女市民样本中获得优秀奖的人数占比为.
(1)根据题中信息完成如下列联表,并判断是否有的把握认为该市市民在这次知识竞赛中获得优秀奖与性别有关?
(2)将样本分布的频率视为总体分布的概率,电信公司对在这次竞赛中获得优秀奖的市民每人将发放50元手机话费充值卡的奖励. 从该市所有参赛的市民中随机抽取10人,记电信公司发放的手机话费充值卡的总金额数为元,求的数学期望.
优秀奖 非优秀奖 合计


合计
附:,其中.
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
9.(2024·全国·模拟预测)随着人工智能的进一步发展,逐渐进入大众视野.是一种基于人工智能的语言模型,具备卓越的自然语言处理能力、广泛的知识覆盖范围和富有创造性的回答能力,是人们学习、工作与生活中的出色助手.尽管如此,也有部分人认为会对人类未来工作产生威胁,由于其在提高工作效率方面的出色表现,将在未来取代一部分人的职业.现对200家企业开展调查,统计每家企业一年内应用的广泛性及招聘人数的增减,得到数据结果统计如下表所示:
应用广泛性 招聘人数减少 招聘人数增加 合计
广泛应用 60 50 110
没有广泛应用 40 50 90
合计 100 100 200
(1)根据小概率的独立性检验,是否有99%的把握认为企业招聘人数的增减与应用的广泛性有关?
(2)用频率估计概率,从招聘人数减少的企业中随机抽取30家企业,记其中广泛应用的企业有X家,事件“”的概率为.求X的分布列并计算使取得最大值时k的值.
附:,其中.
0.1 0.05 0.01
2.706 3.841 6.635
独立性检验的一般步骤 (1)根据样本数据制成2×2列联表. (2)根据公式χ2=计算. (3)比较χ2与临界值的大小关系,作统计推断.

展开更多......

收起↑

资源列表