资源简介 4.3 独立性检验 第1课时通过实例,理解2×2列联表的统计意义.·课前预习要点一 列联表1.定义:将两个(或两个以上) 分类变量 进行交叉分类得到的频数分布表称为列联表.2.2×2列联表:一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其2×2列联表为:要点二 独立性检验利用统计量χ2来确定在多大程度上可以认为“两个分类变量有关系”的方法称为独立性检验.χ2=,其中n=a+b+c+d.当χ2的取值较大时,表示假设H0不成立 .一般地,若χ2的观测值x0≥6.635,说明H0不成立,从而认为两个分类变量有关系,这种推断犯错误的概率不超过0.01.基 础 自 测1.判断正误(正确的画“√”,错误的画“×”)(1)列联表中的数据是两个事件的频数.( )(2)事件A与B的独立性检验无关,即两个事件互不影响.( )(3)χ2的大小是判断事件A与B是否相关的统计量.( )2.为调查中学生近视情况,测得某校150名男生中有80名近视,在140名女生中有70名近视.在检验这些学生眼睛近视是否与性别有关时,用下列哪种方法最有说服力( )A.回归分析 B.均值与方差C.独立性检验 D.概率3.在吸烟与患肺病是否有关的研究中,下列属于两个分类变量的是( )A.吸烟,不吸烟B.患病,不患病C.是否吸烟,是否患病D.以上都不对4.下面是一个2×2列联表,则表中a处的值为________.y1 y2 合计x1 a b 73x2 2 25 c合计 d 46题型探究·课堂解透——强化创新性题型1 随机变量χ2的意义例1 关于随机变量χ2的叙述,下列说法错误的是( )A.χ2是一个不连续的随机变量B.χ2的观测值越大,说明两分类变量X与Y的关系越强C.χ2的观测值越大,说明“两分类变量X与Y有关系”这一结论的可信度越大D.当χ2的观测值接近0时,应该接受“两个分类变量X与Y无关”这一假设巩固训练1 对于分类变量X与Y的随机变量χ2的值,下列说法正确的是( )A.χ2越大,“X与Y有关系”的可信程度越小B.χ2越小,“X与Y有关系”的可信程度越小C.χ2越接近于0,“X与Y没有关系”的可信程度越小D.χ2越大,“X与Y没有关系”的可信程度越大题型2 随机变量χ2的应用例2 某中学为了解2022届高二学生的性别和喜爱游泳是否有关,对100名高二学生进行了问卷调查,得到如下列联表:喜欢游泳 不喜欢游泳 总计男生 10女生 20总计已知从这100人中随机抽取1人,抽到喜欢游泳的学生的概率为.(1)请将上述列联表补充完整;(2)试根据上述数据判断“喜欢游泳”与“性别”是否有关系.方法归纳利用χ2判断两个分类变量是否有关系的步骤巩固训练2 为了解高中生作文水平与课外阅读量之间的关系,某研究机构随机抽取了60名高中生,通过问卷调查,得到如下调查结果:作文水平较高 作文水平一般 合计课外阅读量较大 22 10 32课外阅读量一般 8 20 28合计 30 30 60试根据上述数据判断“作文水平”与“课外阅读量”是否有关系.第1课时[基础自测]1.(1)√ (2)× (3)√2.解析:“近视”与“性别”是两个分类变量,检验其是否有关,应用独立性检验判断.故选C.答案:C3.解析:“是否吸烟”是分类变量,它的两个不同取值:吸烟和不吸烟.“是否患病”是分类变量,它的两个不同取值:患病和不患病.可知A,B都是一个分类变量所取的两个不同值.故选C.答案:C4.解析:依题意得b=46-25=21,a=73-b=52.答案:52题型探究·课堂解透例1 解析:两个分类变量取值是离散的,所以χ2的观测值越大,“X与Y有关系”这一结论的可信度越大,而不是“两分类变量X与Y有关系”的程度越大,故选C.答案:C巩固训练1 解析:根据独立性检验的基本思想可知,分类变量X与Y的随机变量χ2的观测值越大,“X与Y没有关系”的可信程度越小,则“X与Y有关系”的可信程度越大;χ2越小,“X与Y有关系”的可信程度越小,“X与Y没有关系”的可信程度越大,故ACD错误,B正确.故选B.答案:B例2 解析:(1)因为在100人中随机抽取1人抽到喜欢游泳的学生的概率为,所以喜欢游泳的学生人数为100×=60.其中女生有20人,男生有40人,列联表补充如下:喜欢游泳 不喜欢游泳 合计男生 40 10 50女生 20 30 50总计 60 40 100(2)假设H0:喜欢游泳与性别没有关系,根据列联表中的数据得:χ2==≈16.67.由于16.67>6.635,故否定假设H0,所以认为喜欢游泳与性别有关系.巩固训练2 解析:假设H0:作文水平与课外阅读量没有关系χ2=≈9.643,由于9.643>6.635,故否定假设H0,所以认为作文水平与课外阅读量有关系. 展开更多...... 收起↑ 资源预览