资源简介 (共20张PPT)概率论与数理统计x3: 区间估计背景和概念 求置信区间的ò般步骤概率论与数理统计1 背景和概念2 求置信区间的ò般步骤x3: 区间估计x3: 区间估计背景和概念 求置信区间的ò般步骤概率论与数理统计点估计是用一个具体的数值去估计未知参数, 而对于一个未知量, 人们在测量或者计算的时候, 有时常不以得到近似值为满足, 还 需要反映这种近似值的精确度. 比如, 在测量一个物体的长度, 不 仅要关注长度的值, 有时我们更关注于控制测量的误差. 在数理 统计中, 我们希望给出一个范围, 并希望知道这个范围包含参数θ 真实值的可信程度. 这种形式的估计称为区间估计. 这一类带有 一定概率的区间, 以后称作置信区间. 首先我们给出置信区间的 定义如下.背景和概念x3 . 区间估计背景和概念 求置信区间的一般步骤概率论与数理统计设总体X的分布中含有一个未知参数θ , θ 2 Θ (Θ是θ可能取值的 范围), X1 , X2 , · · · , Xn为取自总体X的一个样本. 若对于给定的α (0 < α < 1), 存在两个统计量θ = θ (X1 , X2 , · · · , Xn)和θ = θ(X1 , X2 , · · · , Xn), 使得P(θ (X1 , X2 , · · · , Xn) < θ < θ(X1 , X2 , · · · , Xn)) ≥ 1 — α, (1)则称随机区间(θ , θ )是参数θ的置信水平为1 — α的置信区间, θ和θ 分别称为置信水平为1 — α的双侧置信区间的置信下限和置信上 限, 1 — α称为置信水平或置信度.背景和概念x3 . 区间估计背景和概念 求置信区间的一般步骤定义概率论与数理统计上述定义中(1)式中的概率“ ≥ 1 — α"通常取“= 1 — α"J 写“ ≥" 的原因是在某些离散型总体中J 有时取不到等号J 我们只能取大于1 — α 且最接近于1 — α 的概率. (1)式的意义是指在重复抽样 下J 将得到许多不同的区间(θ (x1 , x2 , · · · , xn), θ (x1 , x2 , · · · , xn)),根据大数定律J 这些区间中大约有100(1 — α)% 的区间包含未知 参数. 但对于一次抽样所得到的一个区间J 决不能说“θ (x1 , x2 , · · · , xn) < θ < θ (x1 , x2 , · · · , xn)成立的概率为1 — α". 因为这时θ (x1 , x2 , · · · , xn)和θ(x1 , x2 , · · · , xn)是两个确定的数J 从而 只有两种可能J 要么这个区间包含θ的真实值J 要么这个区间不包 含θ的真实值J 不存在概率一说.背景和概念x3 . 区间估计背景和概念 求置信区间的一般步骤注概率论与数理统计在对参数θ做区间估计时, 常常提出以下两个要求:(1) 可信度高, 即随机区间(θ ; θ )要以很大的概率包含真实值θ , 即α取得很小.(2) 估计精度高, 即要求区间的长度θ - θ尽可能小, 或某种能体现 这一要求的其他准则.背景和概念x3: 区间估计背景和概念 求置信区间的一般步骤说明概率论与数理统计在对参数θ做区间估计时, 常常提出以下两个要求:(1) 可信度高, 即随机区间(θ ; θ )要以很大的概率包含真实值θ , 即α取得很小.(2) 估计精度高, 即要求区间的长度θ - θ尽可能小, 或某种能体现 这一要求的其他准则.背景和概念x3: 区间估计背景和概念 求置信区间的一般步骤说明概率论与数理统计在对参数θ做区间估计时, 常常提出以下两个要求:(1) 可信度高, 即随机区间(θ ; θ )要以很大的概率包含真实值θ , 即α取得很小.(2) 估计精度高, 即要求区间的长度θ - θ尽可能小, 或某种能体现 这一要求的其他准则.背景和概念x3: 区间估计背景和概念 求置信区间的一般步骤说明概率论与数理统计设轴承内环的锻压零件的平均高度X服从正态分布N(μ; 0.42). 现 从中抽取20只内环, 测得其平均高度x = 32.3mm. 求内环平均高 度μ 的置信水平为95%的置信区间.那么, 在实际问题中, 如何寻求置信区间呢 我们通过如下的例子来说明求置信区间的一般步骤.例x3 . 区间估计背景和概念 求置信区间的一般步骤概率论与数理统计设轴承内环的锻压零件的平均高度X服从正态分布N(μ; 0.42). 现 从中抽取20只内环, 测得其平均高度x = 32.3mm. 求内环平均高 度μ 的置信水平为95%的置信区间.那么, 在实际问题中, 如何寻求置信区间呢 我们通过如下的例子 来说明求置信区间的一般步骤.x3 . 区间估计背景和概念 求置信区间的一般步骤例概率论与数理统计根据标准正态分布分位点的定义知P { = 1 - α;我们知道样本均值X是总体均值μ的无偏估计量, X 的取值比较集 中于μ 附近. 由于x3 . 区间估计背景和概念 求置信区间的一般步骤解N(0; 1); 其中σ = 0.4;σ/pnX - μ概率论与数理统计(2)此即P {X - < μ < X + = 1 - α;水平为1 - α的一个置信区间(X - ; X + ) : (3)x3: 区间估计背景和概念 求置信区间的一般步骤解概率论与数理统计这里1 - α = 0:95; α = 0:05; = 0:025. 查标准正态分布表得到u0:025 = 1:96. 将x = 32:3; σ = 0:4; n = 20代入(3)式得x - u0:025 = 32:12;x + u0:025 = 32:48;所以μ的一个置信区间为(32:12; 32:48).x3: 区间估计背景和概念 求置信区间的一般步骤解概率论与数理统计由此我们给出求未知参数θ的置信区间的一般步骤:(1) 寻求一个样本X1 , X2 , · · · , Xn和θ的函数W = W(X1 , · · · , Xn; θ), 使得W 的分布不依赖于θ及其他未知参数, 称具有这种性质的函 数W为枢轴量;(2) 对于给定的置信水平1 — α , 选取两个常数a, b, 使得 P(a < W(X1 , X2 , · · · , Xn; θ) < b) = 1 — α;(3) 若能从a < W(X1 , X2 , · · · , Xn; θ) < b得到与之等价的不等式θ < θ < θ , 其中θ = θ (X1 , X2 , · · · , Xn), θ = θ(X1 , X2 , · · · , Xn)都 是统计量, 则区间(θ , θ)就是θ的一个置信水平为1 — α的置信区间.x3 . 区间估计背景和概念 求置信区间的一般步骤注概率论与数理统计由此我们给出求未知参数θ的置信区间的一般步骤:(1) 寻求一个样本X1 , X2 , · · · , Xn和θ的函数W = W(X1 , · · · , Xn; θ), 使得W 的分布不依赖于θ及其他未知参数, 称具有这种性质的函 数W为枢轴量;(2) 对于给定的置信水平1 — α , 选取两个常数a, b, 使得 P(a < W(X1 , X2 , · · · , Xn; θ) < b) = 1 — α;(3) 若能从a < W(X1 , X2 , · · · , Xn; θ) < b得到与之等价的不等式θ < θ < θ , 其中θ = θ (X1 , X2 , · · · , Xn), θ = θ(X1 , X2 , · · · , Xn)都 是统计量, 则区间(θ , θ)就是θ的一个置信水平为1 — α的置信区间.x3 . 区间估计背景和概念 求置信区间的一般步骤注概率论与数理统计由此我们给出求未知参数θ的置信区间的一般步骤:(1) 寻求一个样本X1 , X2 , · · · , Xn和θ的函数W = W(X1 , · · · , Xn; θ), 使得W 的分布不依赖于θ及其他未知参数, 称具有这种性质的函 数W为枢轴量;(2) 对于给定的置信水平1 — α , 选取两个常数a, b, 使得 P(a < W(X1 , X2 , · · · , Xn; θ) < b) = 1 — α;(3) 若能从a < W(X1 , X2 , · · · , Xn; θ) < b得到与之等价的不等式θ < θ < θ , 其中θ = θ (X1 , X2 , · · · , Xn), θ = θ(X1 , X2 , · · · , Xn)都 是统计量, 则区间(θ , θ)就是θ的一个置信水平为1 — α的置信区间.x3 . 区间估计背景和概念 求置信区间的一般步骤注概率论与数理统计由此我们给出求未知参数θ的置信区间的一般步骤:(1) 寻求一个样本X1 , X2 , · · · , Xn和θ的函数W = W(X1 , · · · , Xn; θ), 使得W 的分布不依赖于θ及其他未知参数, 称具有这种性质的函 数W为枢轴量;(2) 对于给定的置信水平1 — α , 选取两个常数a, b, 使得 P(a < W(X1 , X2 , · · · , Xn; θ) < b) = 1 — α;(3) 若能从a < W(X1 , X2 , · · · , Xn; θ) < b得到与之等价的不等式θ < θ < θ , 其中θ = θ (X1 , X2 , · · · , Xn), θ = θ(X1 , X2 , · · · , Xn)都 是统计量, 则区间(θ , θ)就是θ的一个置信水平为1 — α的置信区间.x3 . 区间估计背景和概念 求置信区间的一般步骤注概率论与数理统计需要注意的是, 满足同一置信水平的置信区间可能有很多个, 比 如在该例中, 我们求出了未知参数μ的置信水平为0.95的一个置信 区间为(X - 1.96 ; X + 1.96 . (4)事实上, 对任意0 < α1 ; α2 < 1, 满足α1 + α2 = 0.05, u 1 和u 2 分 别是标准正态分布的上α1 分位点和上α2 分位点, 则区间(X - u 1 ; X + u 2 )都是μ的置信水平为0.95的置信区间.x3 . 区间估计背景和概念 求置信区间的一般步骤说明概率论与数理统计例如, 取α1 = 0:02; α2 = 0:03, 得置信区间为(X - 2:06 ; X + 1:88 : (5)x3: 区间估计背景和概念 求置信区间的ò般步骤说明概率论与数理统计一般来说, 若枢轴量的分布是对称的、单峰的, 那么关于峰点对 称的置信区间的长度最短, 所以在该例中, 区间(4)的长度最短, 精 确度最好.而区间(5)的长度为(1.88 + 2.06) = 3.94 > 3.92 .那么, 在这众多的区间中, 我们应该选择哪个呢 根据给置信区间 的准则, 希望得到的区间的长度越短越好, 长度越短, 精确度越高.x3 . 区间估计背景和概念 求置信区间的一般步骤说明上述区间(4)的长度为 21.96 σpn = 3.92σ pn ;概率论与数理统计 展开更多...... 收起↑ 资源预览