2023届高三数学高考复习知识点:概率统计 素材

资源下载
  1. 二一教育资源

2023届高三数学高考复习知识点:概率统计 素材

资源简介

概率统计
01 简单随机抽样
一、全面调查与抽样调查
1、全面调查
(1)定义:对每一个调查对象都进行调查的方法,成为全面调查,又称普查.在一个调查中,我们把调查对象的全体称为成为总体,组成总体的每一个调查对象称为个体。
(2)优点和缺点:优点是所有资料较为全面可靠;缺点是调查花费的人力、物力、财力较多,且调查时间较长,全面调查只在样本少的情况下适合采用。
2、抽样调查
(1)定义:根据一定目的,从总体中抽取一部分个体进行调查,并以此为依据对总体的情况作出估计和推断的调查方法,称为抽样调查。
(2)相关的概念:
①总体:所要考察对象的全体叫做总体
②样本:从总体中抽取出的若干个个体组成的集合叫作总体的一个样本
③个体:总体中的每一个考察对象叫作个体
④样本容量:样本中个体的数目叫作样本容量
⑤样本数据:调查样本获得的变量值称为样本的观测数据,简称样本数据。
(3)优点和缺点:优点是迅速及时;节约人力、物力和财力
缺点是调查结果不如全面调查全面、系统。
二、简单随机抽样
1、放回简单随机抽样
一般地,设一个总体含有(为正整数)个个体,从中逐个抽取()个个体作为样本,如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做放回简单随机抽样.
2、不放回简单随机抽样
如果抽取是不放回的,且每次抽取时总体内未进入样本的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样.
3、简单随机抽样与简单随机样本
放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样,
通过简单随机抽样获得的样本成为简单随机样本。
4、简单随机抽样的特点:
(1)总体个数有限:简单随机抽样要求被抽取样本的总体个数有限,这样便于通过样本对总体进行分析;
(2)逐个抽取:简单随机抽验是从总体中种逐个进行抽取,这样便于实际操作;
(3)不放回抽样:简单随机抽样是一种不放回抽样,这样便于样本的获取和一些相关的计算。
(4)等可能抽样:不仅每次从总体中抽取一个个体时各个个体被抽到的可能性相等,而且在整个抽样过程中,各个个体被抽到的可能性也相等,从而保证了这种抽样方法的公平性。
5、常用的简单随机抽样有抽签法和随机数表法
三、抽签法与随机数法
1、抽签法
(1)定义:把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个样本容量为n的样本。
(2)抽签法的操作步骤:
第一步,编号:将个个体编号(号码可以从1到,也可以使用已有的号码)
第二步,写签:将个号码写到大小、形状相同的号签上.
第三步,抽签:将号签搅拌均匀,每次从中抽取一个号签,连续不放回地抽取次,并记录其编号.
第四部,定样:从总体中找出与号签上的号码对应的个体,组成样本.
(3)抽签法的注意事项:
①对个体编号时,也可以利用已有的编号.
②制作号签时,所使用的工具(如纸条、小球等)的形状、大小要一样,以确保每个号签被抽到的可能性相等.
③抽取样本前总体要“均匀搅拌”,目的是让每个号签被抽到的机会相等.
(4)优点与缺点
优点:简单易形,当总体的个体数不多时,使总体处于“搅拌”均匀的状态比较容易,
此时,每个个体都有均等的机会被抽中,从而能够保证样本的代表性;
缺点:仅适用于个体数较少的总体,当总体的容量较大时,费时费力又不方便,
况且,如果号签搅拌的不均匀,可能导致抽样不公平。
2、随机数法
(1)定义:简单随机抽样中,另一个经常被采用的方法是随机数表法,即利用随机试验或信息技术(即计算器、电子表格软件和R统计软件)生成的随机数进行抽样.
(2)随机数表法步骤:
①把总体中的每个个体编号。
②用随机数工具产生编号范围内的整数随机数.
③把产生的随机数作为抽中的编号,使与编号对应的个体进入样本。重复上述过程,知道抽足样本所需要的数量.
【注意】如果产生的随机数有重复,即同一编号被多次抽到,可以剔除重复的编号并重新产生随机数,知道产生的不同标号个数等于样本所需要的数量.
(3)优点和缺点
优点:操作简单易行,它很好地解决了用抽签法当总总体中的个数较多时制签难的问题,
在总体容量不大的情况下是行之有效的。
缺点:总体中的个数很多,对个体编号的工作量太大,即使用随机数表法操作也不方便快捷。
3、抽签法与随机数法的比较
相同点:(1)抽签法与随机数法都是简单随机抽样,并且要求被抽取样本的总体的个数有限;
(2)抽签法与随机数法都是从总体中逐个进行抽取,都是不放回抽样;
不同点:抽签法适用于总体个数较少的情况;随机数法适用于总体个数较多的情形。
四、简单随机抽样中的两类特征数
1、总体平均数
一般地,总体中有个个体,它们的变量值分别为,,…,,则称为总体均值,又称总体平均数
如果总体的个变量值中,不同的值共有()个,不妨记为,,…,,其中出现的频数,则总体均值还可以写成加权平均数的形式.
2、样本平均数
如果从总体中抽取一个容量为的样本,它们的变量值分别为,,…,,则称为样本均值,又称样本平均数。在简单随机抽样中,我们常用样本平均数去估计总体平均数。
02 分层抽样和获取数据的途经
一、分层随机抽样的概念
1、分层随机抽样的定义:一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.
2、比例分配:在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.
3、分层随机抽样使用的原则
(1)将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则;
(2)分层随机抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每层样本数量与每层个体数量的比等于抽样比.
4、分层随机抽样的步骤
(1)分层:按某种特征将总体分成若干部分(层);
(2)计算抽样比:抽样比;
(3)定数:按抽样比确定每层抽取的个体数;
(4)抽样:每层分贝按简单随机抽样的方法抽取样本
(5)成样:综合各层抽样,组成样本。
5、分层随机抽样的相关计算关系:
(1)=;
(2)总体中某两层的个体数之比等于样本中这两层抽取的个体数之比.
(3)样本的平均数和各层的样本平均数的关系为:=+=+.
二、获取数据的基本途径
选择获取数据的途径主要是根据所要研究问题的类型,以及获取数据的难易程度.有的数据可以有多种获取途径,有的数据只能通过一种途径获取,选择合适的方法和途径能够更好地提高数据的可靠性.
1、通过调查获取数据:
(1)使用类型:对于有限总体问题,我们一般通过抽样调查或普查的方法获取数据;
(2)注意问题:要充分有效地利用背景信息选择或创建更好的抽样方法,并有效地避免抽样过程中的人为错误
2、通过试验获取数据
(1)适用类型:没有现存的数据可以查询
(2)注意问题:严格控制实验环境,通过精心的设计安排试验,以提高数据质量
3、通过观察获取数据
(1)适用类型:自然现象
(2)注意问题:要通过长久的持续观察获取数据
4、通过查询获得数据
(1)适用类型:众多专家研究过,其收集的数据有所存储
(2)注意问题:必须根据问题背景知识“清洗数据”,去伪存真
03 样本估计总体
一、频率分布直方图
1、频率分布直方图
(1)列出样本数据的频率分布表和频率分布直方图的步骤:
①计算极差:找出数据的最大值与最小值,计算它们的差;
②决定组距与组数:当样本容量不超过100时,按照数据的多少分成5~12组,且;
③将数据分组:通常对组内数值所在区间区左闭右开区间,最后一组取闭区间;也可以将样本数据多取一位小数分组.
④列频率分布表:对落入各小组的数据累计,算出各小数的频数,除以样本容量,得到各小组的频率.
⑤绘制频率分布直方图:以数据的值为横坐标,以的值为纵坐标绘制直方图。
(2)频率分布直方图的特点:
①,
②个小长方形的面积等于1,
③.
(3)频率分布折线图:将频率分布直方图各个长方形上边的中点用线段连接起来,就得到频率分布折线图,
一般把折线图画成与横轴相连,所以横轴左右两端点没有实际意义.
(4)总体密度曲线:样本容量不断增大时,所分组数不断增加,分组的组距不断缩小,
频率分布直方图可以用一条光滑曲线来描绘,这条光滑曲线就叫做总体密度曲线.
总体密度曲线精确地反映了一个总体在各个区域内取值的规律.
2、根据频率分布直方图求平均数、中位数和众数
众数、中位数、平均数与频率分布直方图的关系
(1)平均数:在频率分布直方图中,样本平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替.
(2)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.
(3)众数:众数是最高小矩形底边的中点所对应的数据.
二、百分位数的计算
1.第p百分位数的定义
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,
且至少有(100-p)%的数据大于或等于这个值.
2.计算一组n个数据的第p百分位数的步骤
第1步,按从小到大排列原始数据.
第2步,计算i=n×p%.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;
若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
三、样本估计总体
1、用样本的平均数估计总体平均数
(1)众数:在样本数据中,出现次数最多的那个数据;
(2)中位数:将样本数据按大小顺序排列,若数据的个数为奇数,则最中间的数据为中位数,
若样本数据个数为偶数,则取中间两个数据的平均数作为中位数。
(3)平均数:设样本的数据为,则样本的算术平均数为;
(4)众数、中位数和平均数的比较
名称 优点 缺点
平均数 与中位数相比,平均数反映出样本数据中更多的信息,对样本中的极端值更加敏感 任何一个数据的改变都会引起平均数的改变.数据越“离群”,对平均数的影响越大
中位数 不受少数几个极端数据(即排序靠前或靠后的数据)的影响 对极端值不敏感
众数 体现了样本数据的最大集中点 众数只能传递数据中的信息的很少一部分,对极端值不敏感
(5)平均数相关结论:
①如果两组数和的平均数分别是和,则一组数的平均数是;
②如果一组数的平均数为,则一组数的平均数为。
③如果一组数的平均数为,则一组数的平均数为
2、根据频率分布直方图求平均数、中位数和众数
(1)平均数:在频率分布直方图中,样本平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替.
(2)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.
(3)众数:众数是最高小矩形底边的中点所对应的数据.
四、总体离散程度的估计(方差、标准差)
用样本的标准差估计总体的标准差
(1)数据的离散程度可以用极差、方差或标准差来描述;
(2)极差(又叫全距)是一组数据的最大值和最小值之差,反映一组数据的变动幅度;
(3)样本方差描述了一组数据围绕平均数波动的大小;
一般地,设样本的数据为,样本的平均数为,
定义样本方差为;
简化公式:
=(方差等于原数据平方的平均数减去平均数平均数的平方)
(4)样本的标准差是方差的算术平方根.
样本标准差.
标准差越大数据离散程度越大,数据家分散;标准差越小,数据集中在平均数周围.
(5)方差相关结论:
①如果一组数的方差为,则一组数的方差为;
②如果一组数的方差为,则一组数的方差为。
04 随机事件与概率
一、有限样本空间
1、随机试验:我们把对随机现象的实现和对它的观察称为随机试验.
特点:(1)试验可以在相同条件下重复进行;
(2)试验的所有可能结果都是明确可知的,并且不止一个;
(3)每次试验总是恰好出现这些可能结果中的一个,但事先不能确定出现哪一个结果。
2、样本点和样本空间
(1)样本点:我们把随机试验E的每个可能的基本结果称为样本点,用ω表示样本点;
(2)样本空间:全体样本点的集合称为试验E的样本空间,用Ω表示样本空间;
(3)有限样本空间:如果一个随机试验有n个可能结果ω1,ω2,…,ωn,则称样本空间Ω={ω1,ω2,…,ωn}为有限样本空间,Ω={ω1,ω2,…,ωn}
3、样本空间中样本点的求法:
(1)列举法:也称枚举法,对于一些情境比较简单,样本点个数不是很多的概率问题,计算时只需要一一列举,即可得出随机事件所包含的言本店,注意列举时必须按一定的顺序,做到不重不漏。
(2)列表法:碎玉样本点个数不是太多的情况,可以采用列表法。通常把对问题的思考分析归结为“有序实数对”,以便更直接地得到样本点个数,列表法的有点是准确、全面、不易遗漏,期中最常用的方法是坐标系法。
(3)树状图法:树状图适用于按一顺序排雷的较复杂问题中言本店个数的求解,是一种常用的方法。
二、三种事件的定义
1、随机事件:我们将样本空间Ω的子集称为随机事件,简称事件,并把只包含一个样本点的事件称为基本事件.随机事件一般用大写字母A,B,C,…表示.在每次试验中,当且仅当A中某个样本点出现时,称为事件A发生;
2、必然事件:Ω作为自身的子集,包含了所有的样本点,在每次试验中总有一个样本点发生,所以Ω总会发生,我们称Ω为必然事件;
3、不可能事件:空集 不包含任何样本点,在每次试验中都不会发生,我们称 为不可能事件。
注意:判断一个事件是哪类事件要看两点
一看条件:因为三种事件都是相对于一定条件而言的;
二看结果是否发生:一定发生的是必然事件,不一定发生的是随机事件,
一定不发生的是不可能事件.
三、事件的关系判断
1.互斥(互不相容):一般地,如果事件A与事件B不能同时发生,
也就是说A∩B是一个不可能事件,即A∩B= ,
则称事件A与事件B互斥(或互不相容)
2、互为对立:一般地,如果事件A与事件B在任何一次试验中有且仅有一个发生,
即A∪B=Ω,且A∩B= ,那么称事件A与事件B互为对立.
事件A的对立事件记为
四、事件的运算
1、包含关系:一般地,若事件A发生,则事件B一定发生,
我们就称事件B包含事件A(或事件A包含于事件B),
即B A(或A B),
特殊情形:如果事件B包含事件A,事件A也包含事件B,即B A且A B,
则称事件A与事件B相等,记作A=B
2、并事件(和事件):一般地,事件A与事件B至少有一个发生,
这样的事件中的样本点或者在事件A中,或者在事件B中,
则称这个事件为事件A与事件B的并事件(或和事件) A∪B(或A+B)
3、交事件(积事件):一般地,事件A与事件B同时发生,
这样的一个事件中的样本点既在事件A中,也在事件B中,
则称这样的事件为事件A与事件B的交事件(或积事件) A∩B(或AB)
五、古典概型的判断
1、古典概型的定义
我们将具有以下两个特征的试验称为古典概型试验,
其数学模型称为古典概率模型,简称古典概型.
(1)有限性:样本空间的样本点只有有限个;
(2)等可能性:每个样本点发生的可能性相等.
2、古典概型的概率计算公式
一般地,设试验E是古典概型,样本空间Ω包含n个样本点,事件A包含其中k个样本点,
则定义事件A的概率P(A)==,
其中n(A)和n(Ω)分别表示事件A和样本空间Ω包含的样本点个数.
六、概率的基本性质
性质1:对任意的事件A,都有P(A)≥0.
性质2:必然事件的概率为1,不可能事件的概率为0,即P(Ω)=1,P( )=0.
性质3:如果事件A与事件B互斥,那么P(A∪B)=P(A)+P(B).
性质4:如果事件A与事件B互为对立事件,那么P(B)=1-P(A),P(A)=1-P(B).
性质5:如果A B,那么P(A) ≤P(B).
性质6:设A,B是一个随机试验中的两个事件,我们有P(A∪B)= P(A)+P(B)-P(A∩B).
05 事件的相互独立性
一、相互独立事件
1、定义:对任意两个事件A与B,如果P(AB)= P(A)P(B)成立,则称事件A与事件B相互独立,简称为独立.
2、判断事件是否相互独立的方法
(1)定义法:若事件A的发生对事件B的发生概率没有影响,反之亦然,则这两个事件是相互独立的
(2)公式法:若对两事件A,B有P(AB)=P(A)P(B),则事件A,B相互独立.
3、用相互独立事件的乘法公式解题的步骤:
(1)用恰当的字母表示题中有关事件;
(2)根据题设条件,分析事件间的关系;
(3)将需要计算概率的事件表示为所设事件的乘积或若干个事件的乘积之和(相互乘积的事件之间必须满足相互独立);
(4)利用乘法公式计算概率.
二、相互独立事件的概率计算公式
已知两个事件A,B相互独立,它们的概率分别为P(A),P(B),则有
事件 表示 概率
A,B同时发生 AB P(A)P(B)
A,B都不发生 P()P()
A,B恰有一个发生 (A )∪(B) P(A)P()+P()P(B)
A,B中至少有一个发生 (A)∪(B)∪(AB) P(A)P()+P()P(B)+P(A)P(B)
A,B中至多有一个发生 (A )∪(B)∪( ) P(A)P()+P()P(B)+P()P()
06 频率与概率
一、频率与概率
1、频率的稳定性
大量的试验证明,在任何确定次数的随机试验中,一个随机事件A发生的频率具有__随机性__.
一般地,随着试验次数n的增大,频率偏离概率的幅度会缩小,即事件A发生的频率fn(A)会逐渐稳定于事件A发生的概率P(A),
我们称频率的这个性质为频率的稳定性_.
因此我们可以用频率fn(A)估计概率P(A).
2、频率的求法
频率是事件A发生的次数m与试验总次数n的比值,利用此公式可求出它们的频率,
频率本身是随机变量,当n很大时,频率总是在一个稳定值附近摆动,这个稳定值就是概率.
3、频率和概率区别和联系
区别:
(1)在相同的条件下重复n次试验,观察某一事件A是否出现,称n次试验中事件A出现的次数nA为事件A出现的频数,称事件A出现的比例fn(A)=为事件A出现的频率.
(2)概率是度量随机事件发生的可能性大小的量
(3)频率是一个变量,随着试验次数的变化而变化,概率是一个定值,是某事件的固有属性.
联系:
对于给定的随机事件A,由于事件A发生的频率fn(A)随着试验次数的增加稳定于概率P(A),
因此可以用频率fn(A)来估计概率P(A).
二、游戏公平性的标准及判断方法
(1)游戏规则是否公平,要看对游戏的双方来说,获胜的可能性或概率是否相同.若相同,则规则公平,否则就是不公平的.
(2)具体判断时,可以求出按所给规则双方的获胜概率,再进行比较.
三、随机数的产生及模拟应用
1、随机数的产生
(1)标号:把n个大小、形状相同的小球分别标上1,2,3,…,n.
(2)搅拌:放入一个袋中,把它们充分搅拌.
(3)摸取:从中摸出一个.
这个球上的数就称为从1~n之间的随机整数,简称随机数.
2、伪随机数的产生
(1)规则:依照确定的算法.
(2)特点:具有周期性(周期很长).
(3)性质:它们具有类似__随机数__的性质.
计算机或计算器产生的随机数并不是真正的随机数,我们称为__伪随机数__.
3、产生随机数的常用方法
①用计算器产生;②用计算机产生;③抽签法.
4、随机模拟方法(蒙特卡洛方法)
利用计算机或计算器产生的随机数来做模拟试验,通过模拟试验得到的频率来估计概率,
这种用计算机或计算器模拟试验的方法称为随机模拟方法或蒙特卡洛方法.
5、随机数产生的方法比较
方法 抽签法 用计算器或计算机产生
优点 保证机会均等 操作简单,省时、省力
缺点 耗费大量人力、物力、时间, 或不具有实际操作性 由于是伪随机数,故不能保证完全等可能
07 统计专题:统计图表的应用
1、频率分布直方图
(1)列出样本数据的频率分布表和频率分布直方图的步骤:
①计算极差:找出数据的最大值与最小值,计算它们的差;
②决定组距与组数:当样本容量不超过100时,按照数据的多少分成5~12组,且;
③将数据分组:通常对组内数值所在区间区左闭右开区间,最后一组取闭区间;也可以将样本数据多取一位小数分组.
④列频率分布表:对落入各小组的数据累计,算出各小数的频数,除以样本容量,得到各小组的频率.
⑤绘制频率分布直方图:以数据的值为横坐标,以的值为纵坐标绘制直方图。
(2)频率分布直方图的特点:
①,
②各个小长方形的面积等于1,
③.
2、条形图
在直角坐标系中,用横轴(横轴上的数字)表示样本数据类型,用纵轴上的单位长度表示一定的数量,根据每个样本(或某个范围内的样本)的数量多少画出长短不同的等宽矩形,然后把这些矩形按照一定的顺序排列起来,这样一种表达和分析数据的统计图称为条形图。
3、折线图
在直角坐标系中,用横轴上的数字表示样本值,用纵轴上的单位长度表示一定的数量,根据样本值和数量的多少描出相应的各点,然后把各点用线段顺次连接,得到一条折线,用这种折线表示出样本数据的情况,这样的一种表示和分析数据的统计图称为折线图。
4、扇形图
用一个圆表示整体,圆中各扇形分别代表总体中的不同部分,每个扇形的大小反映所表示的那部分占总体的百分比的大小,这样一种表示和分析数据的统计图称为扇形图。

展开更多......

收起↑

资源预览