资源简介 中小学教育资源及组卷应用平台概率与统计专题二: 超几何分布一、必备秘籍一般地,假设一批产品共有件,其中有件次品.从件产品中随机抽取件(不放回),用表示抽取件产品中的次品数,则的分布列为,其中,,,,,,,则称随机变量服从超几何分布.1.公式 中个字母的含义—总体中的个体总数—总体中的特殊个体总数(如次品总数)—样本容量—样本中的特殊个体数(如次品数)注意:(1)“由较明显的两部分组成”:如“男生、女生”,“正品、次品”;(2) 不放回抽样;(3) 注意分布列的表达式中,各个字母的含义及随机变量的取值范围.二、例题讲解(2021·贵州省思南中学高三月考(理))1.某班利用课外活动时间举行了一次“函数求导比赛”活动,为了解本次比赛中学生的总体情况,从中抽取了甲、乙两个小组的样本分数的茎叶图如图所示.(1)分别求出甲、乙两个小组成绩的平均数与方差,并判断哪个小组的成绩更稳定?(2)从甲组同学成绩不低于70分的人中任意抽取3人,设表示所抽取的3名同学的得分在的人数,求的分布列及数学期望.【答案】(1)甲的平均数,方差;乙的平均数,方差;乙小组的更稳定.(2)分布列见解析,.【分析】(1)根据平均数和方差的计算方法,计算出平均数和方程,并作出判断.(2)结合超几何分布的概率计算公式,计算出分布列并求得数学期望.【详解】(1)甲小组的平均数:甲小组的方差:,乙小组的平均数:乙小组的方差:.两个小组成绩的平均数相同,甲的方差比乙的方差要大,所以乙小组的成绩更稳定.(2)甲组同学成绩不低于70分的人有人,从中任意抽取3人,得分在的人数为人.,,,的分布列如下:故.(2021·合肥市第六中学高三开学考试(理))2.近日,国家卫健委公布了2020年9月到12月开展的全国性近视专项调查结果:2020年,我国儿童青少年总体近视率为.为掌握某校学生近视情况,从该校高三(1)班随机抽取7名学生,其中4人近视、3人不近视.现从这7人中随机抽取球3人做进一步医学检查.(1)用表示抽取的3人中近视的学生人数,求随机变量的分布列与数学期望;(2)设为事件“抽取的3人,既有近视的学生,又有不近视的学生”,求事件发生的概率.【答案】(1)分布列见解析;期望;(2).【分析】(1)题目考察超几何分布的概率,写出的所有可能取值,用公式求概率(2)求出既有近视的学生,又有不近视的学生的所有情况的概率,相加即为事件发生的概率【详解】解:(1)随机变量的所有可能取值为0,1,2,3,且所以,随机变量的分布列为:X 0 1 2 3P随机变量的数学期望.(2)设B为事件“抽取的3名学生中,不近视2人,近视1人”;设为事件“抽取的3名学生中,不近视1人,近视2人”,则,且与互斥,从而,所以事件A发生的概率为感悟升华(核心秘籍) 1、判断一个实验是否服从超几何分布的标准:实验对象由较明显的两部分组成;有时候有明显的标志:不放回. 2、注意再求分布列时不漏,不重复.三、实战练习(2021·安徽高三开学考试(理))1. 为预防某种疾病发生,某团队研发一种药物进行提前干预,现进入临床试验阶段.为了考察这种药物预防疾病的效果,进行动物试验,得到如下列联表.患病 未患病 总计服药 10 45未服药 50总计 30(1)请将上面的列联表补充完整;(2)现按分层抽样的方法从未患病动物中抽取10只作为样本,从该样本中随机抽取4只动物,设其中未服用药的动物为只,求的分布与列与期望.【答案】(1)列联表答案见解析;(2)分布列答案见解析,数学期望:.【解析】【分析】(1)根据列联表的数据,即可依次补全;(2)首先利用分层抽样,求得服药和未服药的个数,再按照超几何分布求随机变量的概率,即可求得分布列和数学期望.【详解】(1)列联表补充如下患病 未患病 总计服药 10 45 55未服药 20 30 50总计 30 75 105(2)根据题意,10只未患病动物中,有6只服药,4只未服药;所以的值可能为0,1,2,3,4,,,,,,分布列如下:0 1 2 3 4P则(2021·湖南益阳市箴言中学高三其他模拟)2. 2021年五一节期间,我国高速公路继续执行“节假日高速公路免费政策”.某路桥公司为掌握五一节期间车辆出行的高峰情况,在某高速公路收费站点记录了3日上午9:20~10:40这一时间段内通过的车辆数,统计发现这一时间段内共有600辆车通过该收费站点,它们通过该收费站点的时刻的频率分布直方图如下图所示,其中时间段9:20~9:40记作,9:40~10:00记作,10:00~10:20记作,10:20~10:40记作,例如:9:46,记作时刻46.(1)估计这600辆车在9:20~10:40时间内通过该收费站点的时刻的平均值(同一组中的数据用该组区间的中点值代替)(2)为了对数据进行分析,现采用分层抽样的方法从这600辆车中抽取10辆,再从这10辆车中随机抽取4辆,设抽到的4辆车中,在9:20~10:00之间通过的车辆数为X,求X的分布列;(3)根据大数据分析,车辆在每天通过该收费站点的时刻T服从正态分布,其中可用3日数据中的600辆车在9:20~10:40之间通过该收费站点的时刻的平均值近似代替,用样本的方差近似代替(同一组中的数据用该组区间的中点值代替).假如4日上午9:20~10:40这一时间段内共有1000辆车通过该收费站点,估计在9:46~10:40之间通过的车辆数(结果保留到整数)附:若随机变量T服从正态分布,则,,.【答案】(1)10:04;(2)答案见解析;(3)819.【解析】【分析】(1)将频率分布直方图中每个小长方形的中点横坐标作为该组数据的代表值,频率作为概率,根据平均值的求解方法即可求解;(2)根据抽样比计算出各区间抽取的车辆数,写出X的所有可能取值,并计算每个X对应的概率即可得分布列;(3)由(1)问分布列及频率分布直方图可求得和,再根据正态密度曲线的对称性即可求解.【详解】解:(1)这600辆车在9:20~10:40时间段内通过该收费点的时刻的平均值为:,即10:04;(2)由频率分布直方图和分层抽样的方法可知,抽取的10辆车中,在10:00前通过的车辆数就是位于时间分组这一区间内的车辆数,即,所以X的可能取值为0,1,2,3,4.所以,,,,.所以X的分布列为:0 1 2 3 4(3)由(1)得,.所以,估计在9:46~10:40之间通过的车辆数也就是在通过的车辆数,由,得,所以估计在9:46~10:40之间通过的车辆数为.(2021·浑源县第七中学校(理))3. 由商务部和北京市人民政府共同举办的2020年中国国际服务贸易交易会(简称服贸会)于9月4日开幕,主题为“全球服务,互惠共享”.某高校为了调查学生对服贸会的了解情况,决定随机抽取100名学生进行采访.根据统计结果,采访的学生中男女比例为,已知抽取的男生中有10名不了解服贸会,抽取的女生中有25名了解服贸会,请你解答下面所提出的相关问题(1)完成列联表,并回答“是否有的把握认为学生对服贸会的了解情况与性别有关”.了解情况 性别 了解 不了解 合计男生女生合计 100(2)若从被采访的学生中利用分层抽样的方法抽取5人,再从这5人中随机抽取3人在校内开展一次“介绍服贸会”的专题活动,记抽取男生的人数为,求出的分布列及数学期望.附:,0.15 0.10 0.05 0.025 0.010 0.005 0.0012.072 2.706 3.841 5.024 6.635 7.879 10.828【答案】(1)表格见解析,没有;(2)分布列见解析,.【解析】【分析】(1)根据已知,计算有关数据,填写列联表;代入公式计算求得K2的观测值,看是否大于1-99%=0.01的临界值即可得到结论;(2)先确定抽取的5人中男生有3人,女生有2人.然后利用超几何分布求得分布列,并根据定义计算期望.【详解】(1)列联表如下:了解情况 性别 了解 不了解 合计男生 50 10 60女生 25 15 40合计 75 25 100,没有的把握认为学生对服贸会的了解情况与性别有关;(2)根据题意,抽取的5人中男生有3人,女生有2人.从这5人中随机抽取3人,则男生人数的所有可能取值为1,2,3,则,,.的分布列为1 2 3P.(2021·全国高三二模)4. 某初中为了解学生的肥胖是否与经常饮用碳酸饮料有关,现对40名七年级学生进行了问卷调查,得到数据如表所示(平均每天喝以上为常喝,体重超过为肥胖.单位:人)经常饮用 不经常饮用 合计肥胖 8 18不肥胖 15合计 40(1)将列联表补充完整,并回答能否有的把握认为学生是否肥胖和经常饮用碳酸饮料有关?(2)已知经常饮用碳酸饮料且肥胖的8名同学中,有5名男同学,3名女同学,现从这5名男同学和3名女同学中选5人进行家访,求被选中的男生人数的分布列和期望.参考公式及数据:,.0.100 0.050 0.010 0.0012.706 3.841 6.635 10.828【答案】(1)列联表答案见解析,没有的把握认为学生是否肥胖和经常饮用碳酸饮料有关;(2)分布列答案见解析,数学期望:.【解析】【分析】(1)将列联表补充完整,根据数据计算的观测值,参考已知数据判断结果;(2)列出的取值,根据超几何分布写出各情况概率,即可写出分布列与期望.【详解】(1)经常饮用 不经常饮用 合计肥胖 8 10 18不肥胖 7 15 22合计 15 25 40由调查数据可知,的观测值没有的把握认为学生是否肥胖和经常饮用碳酸饮料有关.(2)被选中的男生人数的取值为2,3,4,5则,,,分布列为2 3 4 5期望.【点睛】思路点睛:求离散型随机变量的分布列及期望的一般步骤:(1)根据题中条件确定随机变量的可能取值;(2)求出随机变量所有可能取值对应的概率,即可得出分布列;(3)根据期望的概念,结合分布列,即可得出期望(在计算时,要注意随机变量是否服从特殊的分布,如超几何分布或二项分布等,可结合其对应的概率计算公式及期望计算公式,简化计算)(2021·赤峰二中高三其他模拟(理))5. 学期结束时,学校对食堂进行测评,测评方式:从全校学生中随机抽取100人给食堂打分,打分在60以下视为“不满意” 在60~80视为“基本满意”,在80分及以上视为“非常满意”.现将他们给食堂打的分数分组:,得到如下频率分布直方图:(1)求这100人中“不满意”的人数并估计食堂得分的中位数;(2)若按满意度采用分层抽样的方法,从这100名学生中抽取15人,再从这15人中随机抽取3人,记这3人中对食堂“非常满意”的人数为X.(i)求X的分布列;(ii)若抽取的3人中对食堂“非常满意”的同学将获得食堂赠送的200元现金,其他同学将获得100元现金,请估计这3人将获得的现金总额.【答案】(1)“不满意”的人数为,中位数为;(2)(i)分布列答案见解析;(ii)360元.【解析】【分析】(1) 利用频率分布直方图求得中位数(2)用分层抽样的方法计算“非常满意”的学生应抽取(人),(i)分析的取值为0,1,2,3,并根据超几何分布求 出 对 应 概 率;列 出 分 布 列(ii) 3人获得的现金总额.再利期望性质求得解.【详解】(1)这100人中“不满意”的人数为.由频率分布直方图易得,食堂得分的中位数为.(2)(i)若按满意度采用分层抽样的方法,从这100名学生中抽取15人,则“不满意”与“基本满意”的学生应抽取(人),“非常满意”的学生应抽取(人),∴X的取值为0,1,2,3,,,故X的分布列为X 0 1 2 3P(ii)由(i)得,则3人获得的现金总额,(元),即3人获得的现金总额估计为360元.【点睛】本题主要考查统计图表、概率、中位数、随机变量分布列以及数学期望等基础知识与基本技能.意在考查考生的数据处理能力和应用意识.熟悉数学期望性质是快速解题的关键.(2021·陕西西安·高三其他模拟(理))6. 某中学高一(1)班在接种了“新冠疫苗”之后,举行了“疫情防控,接种疫苗”知识竞赛.这次竞赛前名同学成绩的茎叶图如图所示,已知前名女生的平均得分为分.(1)①求茎叶图中的值;②如果在竞赛成绩高于分且按男生和女生分层抽样抽取人,再从这人中任选人作为后期举行的“接种疫苗,感恩祖国”主题班会中心发言人,求这人中有女生的概率;(2)如果在竞赛成绩高于分的学生中任选人参加学校座谈会,用表示人中成绩超过分的人数,求的分布列和期望.【答案】(1)①;②;(2)分布列见解析,期望为.【解析】【分析】(1)①利用平均数公式可求得的值;②求得样本中的男生人数和女生人数,利用组合计数原理、古典概型以及对立事件的概率公式可求得所求事件的概率;(2)分析可知随机变量的可能取值有、、、,计算出随机变量在不同取值下的概率,可得出随机变量的分布列,由此可求得随机变量的数学期望值.【详解】(1)①由茎叶图可知,前名女生的平均得分为,解得;②竞赛成绩高于分的女生有人,男生有人,按男生和女生分层抽样抽取人,则样本中的男生人数为,女生人数为,记事件从人中任选人作为后期举行的“接种疫苗,感恩祖国”主题班会中心发言人,这人中有女生,则;(2)竞赛成绩高于分的学生共有人,成绩高于分的学生共有人,由题意可知,随机变量的可能取值有、、、,则,,,,所以,随机变量的分布列如下表所示:因此,.【点睛】方法点睛:求随机变量的期望和方差的基本方法如下:(1)已知随机变量的分布列,直接利用期望和方差公式直接求解;(2)已知随机变量的期望、方差,求的期望与方差,利用期望和方差的性质(,)进行计算;(3)若能分析出所给的随机变量服从常用的分布(如:两点分布、二项分布等),可直接利用常用分布列的期望和方差公式进行计算.(2021·全国高三专题练习(理))7. 自“新冠肺炎”爆发以来,中国科研团队一直在积极地研发“新冠疫苗”,在科研人员不懈努力下,我国公民率先在2020年年末开始可以使用安全的新冠疫苗,使我国的“防疫”工作获得更大的主动权,研发疫苗之初,为了测试疫苗的效果,科研人员以白兔为实验对象,进行了一些实验.(1)实验一:选取10只健康白兔,编号1至10号,注射一次新冠疫苗后,再让它们暴露在含有新冠病毒的环境中,实验结果发现,除2号、3号和7号白兔仍然感染了新冠病毒,其他白兔未被感染,现从这10只白兔中随机抽取4只进行研究,将仍被感染的白兔只数记作,求的分布列和数学期望.(2)科研人员在另一个实验中发现,疫苗可多次连续注射,白兔多次注射疫苗后,每次注射的疫苗对白兔是否有效互相不影响,相互独立,试问,若将实验一中未被感染新冠病毒的白兔的频率当做疫苗的有效率,那么一只白兔注射两次疫苗能否保证有效率达到96%,如若可以请说明理由,若不可以,请问每支疫苗的有效率至少要达到多少才能满足以上要求.【答案】(1)分布列见解析;期望为;(2)不可以;每支疫苗的有效率至少要达到80%才能满足以上要求.【解析】【分析】(1)先分析出的可取值,然后根据超几何分布模型求解取不同值时的概率,由此可求得的分布列,并根据分布列可计算出数学期望;(2)根据已知条件先分析出注射一次疫苗的有效率,然后计算注射两次疫苗的有效率并与作比较,得到结果为无法保证后先假设疫苗的有效率,利用减去两次疫苗都无效的概率等于,由此求解出结果.【详解】解:(1)因为可取,所以所以,,.所以的分布列如下:;(2)因为实验一中未被感染新冠病毒的白兔的频率为,所以注射一次疫苗的有效率为,又因为每次注射的疫苗对白兔是否有效相互独立,所以一只白兔注射两次疫苗的有效率为:,所以无法保证,设每支疫苗有效率至少达到才能满足要求,则,解得所以每支疫苗的有效率至少要达到才能满足以上要求.【点睛】关键点点睛:超几何分布模型的理解:一般地,在含有件次品的件产品中,任取件,其中恰有件次品,则,即:其中,且;如果随机变量的分布列具有上表的形式,则称随机变量服从超几何分布.(2021·辽宁高三其他模拟)8. 1.2020年11月22日,第29届全国中学生数学奥林匹克决赛举行,若将本次成绩转化为百分制,现从中随机抽取了100名学生的成绩,经统计,这批学生的成绩全部在,之内,将数据按照,,,,,,,的分组作出频率分布直方图,如图所示.已知,,成等差数列且.(1)求频率分布直方图中,,的值;(2)并估计这100名学生成绩的众数;(3)若按照分层抽样从成绩在,,,的两组中抽取了6人,再从这6人中随机抽取3人,记为3人中成绩在,的人数,求的分布列和数学期望.【答案】(1);(2)75;(3)分布列见解析,.【解析】【分析】(1)根据频率分布直方图的性质,可得,根据,,成等差数列,可得,又,联立解得:,,.(2)众数即频率分布直方图图中最高矩形的底边中点的横坐标,即可得出估计这100名学生成绩的众数.(3)由题意可得:成绩在,共有人,在,共有人,在,抽取了4人,在,中抽取了2人,利用超几何分布列即可得出分布列与期望.【详解】(1)根据频率分布直方图的性质,可得,,,成等差数列,,又,联立解得:,,.(2)众数即频率分布直方图图中最高矩形的底边中点的横坐标,故估计这100名学生成绩的众数是75.(3)由题意可得:成绩在,共有人,在,共有人,在,抽取了4人,在,中抽取了2人,随机变量的取值为0,1,2.则,,,的分布列为:0 1 2.(2021·全国高三专题练习)9. 某校高一年级进行安全知识竞赛(满分为100分),所有学生的成绩都不低于75分,从中抽取100名学生的成绩进行分组调研,第一组,第二组,,第五组(单位:分),得到如下的频率分布直方图.(1)若竞赛成绩不低于85分为优秀,低于85分为非优秀,且成绩优秀的男学生人数为35,成绩非优秀的女学生人数为25,请判断是否有95%的把握认为竞赛成绩的优秀情况与性别有关;(2)用分层抽样方法,在成绩不低于85的学生中抽取6人,再从这6人中随机选3人发言谈体会,设这3人中成绩在的人数为,求的分布列与数学期望.附:,.临界值表:0.10 0.05 0.025 0.01 0.0052.706 3.841 5.024 6.635 7.879【答案】(1)有;(2)分布列见解析,.【解析】【分析】(1)由题意得出列联表,根据计算公式得到,进而判断结果;(2)用分层抽样的方法,应分别在竞赛成绩在,,的组内抽3人,2人,1人,再根据超几何分布得出分布列,从而求得数学期望.【详解】(1)由已知,竞赛成绩在的学生人数为,竞赛成绩在的学生人数为,竞赛成绩在的学生人数为,所以竞赛成绩不低于85(优秀)的学生人数为60,低于85(非优秀)的学生人数为40.因为成绩优秀的男学生人数为35,成绩非优秀的女学生人数为25,所以列联表如下:非优秀 优秀 合计男生 15 35 50女生 25 25 50合计 40 60 100所以的观测值.因为,所以有95%的把握认为竞赛成绩的优秀情况与性别有关.(2)由(1)知竞赛成绩在的学生人数为30,竞赛成绩在的学生人数为20,竞赛成绩在的学生人数为10,所以用分层抽样的方法,应分别在竞赛成绩在,,的组内抽3人,2人,1人,所以的可能取值为0,1,2,3,所以,,,,所以的分布列为0 1 2 3所以.【点睛】超几何分布的特征是:①考查对象分两类;②已知各类对象的个数;③从中抽取若干个个体,考查某类个体个数X的概率分布,超几何分布主要用于抽检产品、摸不同类别的小球等概率模型,其实质是古典概型.(2021·全国高三其他模拟)10. 垃圾分类指的是按照一定规定或者标准将垃圾分类储存、投放和搬运,从而转变成公共资源的一系列活动的总称我国的垃圾分类大致分为厨余垃圾、可回收垃圾、有害垃圾、其他垃圾四类,而正确的掌握垃圾分类也是中学生的必修课之一.某学校从甲、乙两个班级中各随机抽取了8名学生参加垃圾分类知识的检测,并将检测后的成绩统计如表所示:甲 73 64 74 78 65 72 87 85乙 74 85 76 74 77 86其中,,,.(1)求,的值;(2)现从乙班同学中随机抽取4人,记80分以上的人数为,求的分布列以及数学期望.【答案】(1),;(2)分布列见解析;期望为.【解析】【分析】(1)设,的个位数分别为,,利用,,将表中数据代入公式求解.(2)根据题意得到的可能取值为0,1,2,3,然后分别求得其相应的概率,列出分布列,再求期望.【详解】(1)记,的个位数分别为,.,故,①而,故,②联立①②解得,,,则,.(2)依题意,的可能取值为0,1,2,3,则,,,,故的分布列为,0 1 2 3故.【点睛】方法点睛:求解离散型随机变量X的分布列的步骤:①理解X的意义,写出X可能取的全部值;②求X取每个值的概率;③写出X的分布列.求离散型随机变量的分布列的关键是求随机变量所取值对应的概率,在求解时,要注意应用计数原理、古典概型等知识.(2021·全国(理))11. 随着如今人们生活水平的不断提高,旅游成了一种生活时尚,尤其是老年人的旅游市场在不断扩大.为了了解老年人每年旅游消费支出(单位:元)的情况,相关部门抽取了某地区名老年人进行问卷调查,并把所得数据列成如下所示的频数分布表:组别频数(1)求所得样本平均数(精确到元);(2)根据样本数据,可近似地认为老年人的旅游费用支出X服从正态分布,若该地区共有老年人人,试估计有多少位老年人旅游费用支出在元以上;(3)已知样本数据中旅游费用支出在范围内的名老人中有名女性,名男性.现想选其中名老人回访,记选出的男生人数为,求的分布列.附:若,,,.【答案】(1)元;(2)位;(3)分布列见解析.【解析】【分析】(1)将每组的中点值乘以对应组的人数,将所得结果全部相加并除以可得出该样本的平均数;(2)由题可得,计算出的值,乘以即可得解;(3)由题意可知,随机变量的可能取值有、、、,计算出随机变量在不同取值下的概率,进而可得出随机变量的分布列.【详解】(1)设样本平均数为,则有:(元);(2),,,所以旅游费用在元以上的概率为,,所以估计有位老人旅游费用支出在元以上;(3)由题意可知,的取值为、、、,,,,.所以,随机变量的分布列为【点睛】思路点睛:求解随机变量分布列的基本步骤如下:(1)明确随机变量的可能取值,并确定随机变量服从何种概率分布;(2)求出每一个随机变量取值的概率;(3)列成表格,对于抽样问题,要特别注意放回与不放回的区别,一般地,不放回抽样由排列、组合数公式求随机变量在不同取值下的概率,放回抽样由分步乘法计数原理求随机变量在不同取值下的概率.21世纪教育网 www.21cnjy.com 精品试卷·第 2 页 (共 2 页)21世纪教育网(www.21cnjy.com) 展开更多...... 收起↑ 资源预览