中职信息技术高教版基础模块下册第四单元:4.4初识大数据第一课时 课件(共19张PPT)

资源下载
  1. 二一教育资源

中职信息技术高教版基础模块下册第四单元:4.4初识大数据第一课时 课件(共19张PPT)

资源简介

(共19张PPT)
初识大数据(第一课时)
年 级:高一年级
学 科:信息技术基础模块(高教版)
开门见山
导入视频
大数据的特征
4V特征
数据体量大
Volume
A
数据类型多
Variety
B
产生速度快
Velocity
C
价值密度低
Value
D
大数据的特征
体量大
A
类型多
B
速度快
C
密度低
D
1024
1024
1024
1024
1024
1024
1024
1024
约为500个汉字
约为1000000000000000000000000倍!
一般情况下,大数据以PB、EB、ZB为单位进行计量
相当于50%的全美学术研究图书馆藏书信息内容
5EB相当于至今全世界人类所讲过的话语
1ZB如同全世界海滩上的沙子数量总和
1YB相当于7000位人类体内的微细胞总和
大数据的特征
体量大
A
类型多
B
速度快
C
密度低
D
一般情况下,大数据以PB、EB、ZB
为单位进行计量
1PB相当于50%的全美学术研究图书馆藏书信息内容
5EB相当于至今全世界人类所讲过的话语
1ZB如同全世界海滩上的沙子数量总和
1YB相当于7000位人类体内的微细胞总和
大数据的特征
体量大
A
类型多
B
速度快
C
密度低
D
结构化
数据
半结构化
数据
非结构化
数据
例如:列车时刻表
例如:电子邮件,网页
例如:图像、音频、视频
通常存储在文件系统中
通常存储在专用系统中
通常存储在电子表格或关系数据库中
大数据的特征
体量大
A
类型多
B
速度快
C
密度低
D
通常存储在电子表格或关系数据库中
非结构化数据
半结构化数据
结构化数据
通常存储在专用系统中
通常存储在文件系统中
大数据的特征
体量大
A
类型多
B
速度快
C
密度低
D
数据产生的速度快,数据处理的速度快
对处理速度有要求,一般要在秒级时间范围内给出分析结果,时间太长就失去价值了。
秒级定律
这个速度要求是大数据处理技术和传统的数据挖掘技术最大的区别。
天眼系统
大数据的特征
体量大
A
类型多
B
速度快
C
密度低
D
价值高但价值密度低,且价值与数量成反比
挖掘大数据的价值类似沙里淘金,从海量数据中挖掘稀疏但珍贵的信息;
A
价值密度低,是大数据的一个典型特征;
车祸发生的瞬间之于监控
B
C
大数据的特征
体量大
A
类型多
B
速度快
C
密度低
D
随堂小测
1. 下列数据中属于大数据的是( )
①各地交通摄像头记录的全部数据
②学生网上高考报名数据
③电商平台的用户浏览,交易时产生的数据
④全体手机用户的联网信息、实时定位数据
A.①②③ B.①②④ C.①③④ D.②③④
C
大数据的特征
体量大
A
类型多
B
速度快
C
密度低
D
2. 道路监控摄像头,24小时不间断地记录着视频数据,根据第3节中图像数据的计算公式,引入帧频参数进行计算,对于1个720p(1280×720像素、24位色)的高清摄像头,按25FPS拍摄,可以计算出每秒的数据量,乘以86400秒就是1天的数据量。若按200:1的压缩比进行存储,大致可以估算出1个720p高清摄像头1天产生的数据量,请列式计算。
参考公式:
①数据量(位/秒)= (画面尺寸*彩色位数(bit)*帧数)
②数据量*时间/8=文件总字节
答:(1280×720×24×25)/8×86400/200=29859840000B = 27.81GB
随堂小测
应用实战
挑战书
学校
路径规划
上海迪士尼
导航软件
大数据的应用解析
大数据处理流程
数据预处理
A
数据存储
B
数据挖掘
C
数据采集
D
连连看
1
2
3
4
导航软件中的道路信息如何来的?
导航软件应用什么技术对新增道路进行及时更新?
搜索结果“千人千面”如何实现的?
大量的定制化用户数据和道路数据是如何存储的?
大数据的应用解析
采集
预处理
A
数据
挖掘
B
数据
存储
C
数据
呈现
D
导航软件中的道路信息是如何而来的?
摄像头被动众包
社交软件主动众包
物联传感
社交网络
大数据采集技术
大数据采集技术是指
通过物联传感、社交网络等方式获得各种类型海量数据的技术。
大数据的应用解析
采集
预处理
A
数据
挖掘
B
数据
存储
C
数据
呈现
D
导航软件提供“千人千面”的活地图服务是如何实现的?
导航软件云端记录了大量的道路和用户数据,形成用户特征,通过用户的特征给用户推荐最为合适的私人定制式的路线规划,满足用户更多维度的出行需求
数据挖掘:发掘先前未知具潜在有用的信息模型或规则,以产生有价值的信息和知识,帮助决策者做出适当的决策,数据挖掘所处理的问题类型分为分类、预测、有序关联规则四种。
大数据的应用解析
采集
预处理
A
数据
挖掘
B
数据
存储
C
数据
呈现
D
导航软件采集到了大量的道路和用户数据,这些巨量的数据将如何存放和管理
数据存储:大数据存储需要分布式文件系统和分布式数据库的支持
云存储
大数据的应用解析
采集
预处理
A
数据
挖掘
B
数据
存储
C
数据
呈现
D
除了像导航软件中提供的可直观看到的图像之外,有很多大数据不能直接被
我们看到,使用什么技术手段能让大数据直观可见呢?
数据呈现:大数据的可视化技术,能够帮助人们有效理解数据,以真正利用好大数据,分结构可视化、功能可视化、关联关系可视化和发展趋势可视化。
区域热力区
词云
大数据的未来
《未来大数据医疗视频》
小结
大数据的特征
数据体量大
Volume
A
数据类型多
Variety
B
产生速度快
Velocity
C
价值密度低
Value
D
大数据处理的流程
数据
采集预处理
A
数据挖掘
B
数据存储
C
数据呈现
D
未来

展开更多......

收起↑

资源预览