6.4 常用的数据描述方法 课件(共20张PPT)- 《概率论与数理统计》同步教学(机工版)

资源下载
  1. 二一教育资源

6.4 常用的数据描述方法 课件(共20张PPT)- 《概率论与数理统计》同步教学(机工版)

资源简介

(共20张PPT)
“悟道诗---严加安”
随机非随意,概率破玄机;
无序隐有序,统计解迷离.
第六章
数理统计基本概念与抽样分布
第四节 常用的数据描述方法
二、样本分布函数
一、折线图与直方图
四、小结
三、箱线图
例6.4.1 经调查,得到某高校某专业701班、702班、703班、704班等四个班的高等数学成绩,共计120个,具体信息如下
1班:81 83 84 51 84 88 70 93 65 79 76 76 63 44 70 59 79 75 48 89 72 86 71 71 29 62 54 72 79 73
2班:98 60 83 78 73 69 63 55 63 54 52 68 78 60 60 74 54 73 63 60 64 86 75 45 60 68 62 77 93 70
3班:92 60 86 90 64 83 44 85 65 52 88 79 61 73 66 73 67 69 74 87 73 82 65 83 68 90 61 63 94 83
4班:74 60 63 82 88 70 79 65 69 60 65 77 82 65 80 76 46 87 75 91 65 88 78 90 87 88 48 68 74 70
例6.4.2 为考察运动员水平,现随机调查甲(男)、乙(女)两名跳远运动员的跳远数据(单位:米)各50次 ,得详细信息如下
甲:7.94 7.99 7.91 8.17 7.71 7.58 7.97 8 7.85 7.75 7.75 8.04 7.57 7.6 7.55 7.79 7.79 7.83 7.52 7.48 7.66 7.33 7.7 7.75 7.47 7.57 7.79 7.74 7.73 7.5 7.35 8.03 7.88 7.59 7.57 8.03 7.77 7.77 8 7.91
乙:6.18 6.28 6.3 6.46 5.91 5.67 6.27 6.33 6.19 6.12 6.12 6.44 6.08 5.98 5.75 6.27 6.2 6.11 5.8 5.72 5.96 5.63 6.11 6.27 5.95 5.96 6.32 6.18 6.23 5.82 5.78 6.36 6 5.96 5.84 6.24 6.06 6.06 6.3 6.03 5.64 6.04 5.88 5.96 6.01 6.01 6.21 6.15 6.23 6.38
一、折线图与直方图
将例6.4.1中所有学生的成绩分为五类:优(90-100)、良(80-89)、中(70-79)、及格(60-69)、不及格(0-59),分别用1,2,3,4,5表示,这样120名学生的高等数学成绩的频数、频率和累计频率分布如下表所示.
成绩 频数 频率 累计频率
1 9 0.075 0.075
2 25 0.208 0.283
3 35 0.292 0.575
4 36 0.300 0.875
5 15 0.125 1.000
合计 120 1.000  
定义6.4.1 对于总体 ,设 为一组样本, 为样本观测值,将 从小到大排列成 ,合并相同项,设共有 个互不相同的数,分别为 ,每个数的个数分布为 ,且 ,

二、样本分布函数
则称其为样本分布函数,亦称为样本的经验分布函数.
注6.4.1 样本分布函数 的性质:
(1)单调非减性:当 时, ;
(2)有界性: ,且
(3)右连续性: 在每个样本观测值 处都是右连续的,点 是 的跳跃间断点,且相应的跃度为 .
例6.4.3 从某总体 中抽取样本容量为10的一个样本,经测量,得到的观测值分别为:
求样本分布函数.
将样本观测值从小到大排列为
解:
因此,随机变量Y在X=1条件下的条件分布律为
可以看到,对任意的实数x,样本分布函数 表示事件 发生的频率,而总体分布函数 表示事件 发生的概率.
由大数定律,在一定条件下,事件发生的频率依概率收敛于该事件发生的概率.而格里汶科(Glivenko)和坎泰利(Cantelli)于1933年从理论上严格地证明了样本分布函数与总体分布函数之间关系的结论.
定理6.4.1(格里汶科-坎泰利定理) 设总体 的分布函数为 ,样本分布函数为 ,则 关于x均匀地依概率1收敛于.即对任意的实数x,
“数理统计基本定理”
箱线图于1977年由美国著名统计学家约翰·图基发明,是一种利用数据排序分组来发现异常值和比较不同部分的分布特征的统计图形,也称为盒式图或箱形图.箱线图是利用样本的五个数(最小值、第一四分位数、中位数、第三四分位数、最大值)进行描述概括,由箱子和线段组成的图形.
三、箱线图
以例6.4.1 中701班的高等数学成绩为例,按以上的作法给出相应的箱线图.
上图可以看出:701班大部分同学的成绩介于44分与93分之间,有一个异常值29分,数据的下半部分(中位数以下)比上半部分(中位数以上)的跨度大.
以例6.4.1 中701~704班的高等数学成绩为例,按以上的作法给出相应的箱线图.
上图可以比较清楚地看到,最高分出现在702班,但总体来说702班成绩偏低,703班成绩较好.
以例6.4.2 中运动员甲、乙的跳远数据为例,按上面的作法给出相应的箱线图(见下图).两组数据对应的箱线图很清楚地显示了甲、乙两人的跳远数据不同分布.
小结
1. 主要概念:折线图、直方图,样本分布函数

展开更多......

收起↑

资源预览