5.1 认识大数据 课件(共38张PPT) 2023—2024学年粤教版(2019)高中信息技术必修1

资源下载
  1. 二一教育资源

5.1 认识大数据 课件(共38张PPT) 2023—2024学年粤教版(2019)高中信息技术必修1

资源简介

(共38张PPT)
5.1认识大数据
信息技术必须一《数据与计算》
学习目标
大数据是什么
大数据的特征
大数据与传统数据的区别
大数据对日常生活的影响
大数据的技术背景
大数据的产生是与
人类日益普及的网络行
为所伴生的:物联网、
云计算、移动互联等。
产生的数据以大爆发性
的速度增长。
大数据已成为人们
提取信息、做出决策的
重要依据,是推动信息
社会发展的重要资源。
01
大数据是什么
大数据是什么
观看《认识大数据》视频,了解大数据的概念
,并填写项目活动记录表。
无法在可承受的时间范围内用常规软件工具
进行高效捕捉、管理和处理的数据集合,是需
要新处理模式才能具有更强的决策力、洞
察发现力和流程优化能力的海量、高增
长率和多样化的信息资产。
下面哪些是大数据?
1、2022年安徽省参加高考的学生总数。
在一定时间范围内,
用常规软件工具捕
捉、管理和处理的
数据不属于大数据
2 、淮南一中期末考试之后,所有学生的考试成绩。
3 、100本《百科全书》。
4 、第六次全国人口普查统计的各地人口的数量、年龄、性别等数据
5 、网络购物平台一天所生成的数据量。
2021中国产生的数据:10ZB(118万亿亿字节)
11,805,916,207,174,113,034,240 字节
ZB、EB 、PB 、TB 、GB 、MB 、KB
数据来源:东方财富网(前瞻产业研究院)
数据的存储单位
1 Byte (字节) = 8 bit (位)
1KB( 千 字 节 )= 1024 B
1MB(兆字节)= 1024 KB
1GB(吉字节)= 1024 MB
1TB(太字节)= 1024 GB
1PB(拍字节)= 1024 TB
1EB(艾字节)= 1024 PB
1ZB(泽字节)= 1024 EB
1YB(尧字节)= 1024 ZB
一首三分钟的歌曲,如果用最高质量
的mp3的格式,把它录下来的话大
概8MB,1个ZB可以存多少首歌曲?
140万亿首!可以算一下,一个人要
听一遍的话,得8亿多年才可以听完

02
大数据的特征
大数据的特征
1 、从互联网产生大数据的角度来看
2 、从互联网思维的角度来看
3 、从大数据存储与计算的角度来看
活动一
以小组为单位,探究大
数据的特征并完成项目
活动记录表。
从互联网产生大数据的角度——4V特征(重点)
高速(velocity)
多样(variety)
大量(volume)
价值密度低(value)
多样(variety):网络日志、音频、视频、图片、地理位置….
价值密度低(value):在连续不间断的监控视频中,只有几秒钟有用
高速(velocity):数据来自世界各地,每时每刻都在变化
email:Email:2.04亿封被发出
Google:200万次搜索请求被提交
大数据
Youtube:2880分钟的视频被上传
刚刚过去的一分钟
Facebook:69.5万条状态被更新
Twitter:98000条推送被发出
12306:1840张车票被卖出
数据世界里
发生了什么?
从互联网思维角度认识大数据
精确
让位
模糊
样本
趋于
总体
相关
重于
因果
强调大数据生成的动态性
强调数据之间的离散性
强调大数据研究统计性








抽样



不抽样
计算能力
存储能力
精确?






研究趋势、把握整体
强调大数据研究统计性
全球零售业巨头沃尔玛在对消费者购物行为分析时发现,
男性顾客在购买婴儿尿片时,常常会顺便搭配几瓶啤酒
来犒劳自己,于是尝试推出了将啤酒和尿布摆在一起的
促销手段。没想到这个举措居然使尿布和啤酒的销量都
大幅增加了。






大数据存储与计算角度
分布式存储
分布式并行计算
大数据存储在互
联网不同的服务
器和各客户终端
应用分布式并行计算
处理互联网的大数据
03
传统数据与大数据的区别


大数据与传统数据的区别
传统数据
大数据
数据体量巨大
数据类型繁多
价值密度低
数据量小
数据类型少
价值密度高
更新速度慢
追求数据精确性
本地存储
更新速度快
追求数据模糊性性
分布式存储
04
大数据对日常生活的影响
活动二
以小组为单位,探究大
数据在日常生活中的应
用以及对日常生活的影
响,并完成项目活动记
录表。
中 国 是 全 球 最 大
的移动支付市场。
每三个手机用户,
就 有 两 个 在 使 用
移动支付。
应 用 交 通 系 统 的
大 数 据 , 网 络 约
车 出 行 , 智 能 导
航行车避免堵车,
方便寻路。
网络购物不仅能够
节省出行购物时间,
而且可以帮助企业
判断用户需求,进
行产品推介。
应用网络预约挂号,
减轻与节省患者看
病的辛劳与时间,
同时方便医生提前
分析患者病史数据。
方便
支付
方便
出行
方便购物与
产品推介
5.1.3大数据对日常生活的影响
双面性——生活更加便捷
1.方便购物
5.1.3大数据对日常生活的影响
双面性——生活更加便捷
2.方便支付
5.1.3大数据对日常生活的影响
双面性——生活更加便捷
3.方便出行
5.1.3大数据对日常生活的影响
双面性——生活更加便捷
4.方便交流
微信,
是一个生活方式
I’m QQ,
每一天,乐在沟通
钉钉,
让工作学习更简单
5.1.3大数据对日常生活的影响
双面性——生活更加便捷
5.方便看病及诊病
5.1.3大数据对日常生活的影响
双面性——对生活的负面影响
1.个人信息泄露
人脸识别第一案
国内
1. 微博5.38亿用户数据在暗网出售
2. 青岛市胶州中心医院 6千余人个人信息被泄露
3. B站知名UP主“党妹”数百G视频素材丢失损失惨重
4. 浙江一家银行泄露客户信息被罚30万
5. 江苏南通5000多万条个人信息在“暗网”倒卖
6. 建设银行员工贩卖5万多条客户信息
个人信息成为“商品”被贩卖
快递运单号泄露个人信息
国外
1. 近50万台服务器、路由器和IoT设备密码被泄露
2. 万豪,美高梅酒店1580万客人信息泄露
3. 化妆品巨头雅思兰黛因不安全服务器泄露4.4亿用户敏感信息
4. 以色列640万选民数据遭泄露
5. 2.67亿个Facebook帐户信息在暗网出售
6. 泰国最大的移动运营商泄露 83亿条用户数据记录
7. 易捷航空遭遇网络攻击,900万客户数据被泄露
8. 成人网站泄露超百亿条用户敏感记录
“脸书facebook”泄露用户信息
9. 多所美国大学遭到勒索软件攻击
10. 谷歌浏览器造成大规模用户安全信息泄露
5.1.3大数据对日常生活的影响
双面性——对生活的负面影响
2.网络暴力
5.1.3大数据对日常生活的影响
双面性——对生活的负面影响
3.信息泄露、信息诈骗
课堂练习
1 .下列行为可能使用大数据的是( )。
① 为了避免堵车,利用高德地图,查看道路拥堵情况
② 利用人脸识别打开门禁道闸,进入校园③水银温度计上显示当前气温是30℃
④全民K 歌提示你打败了全国90% 的人⑤微信运动显示你今天走了10000 步A .①②③④ B .
①②④⑤
C .②③④⑤
D .①②③④⑤
【答案】B ①②④⑤是从海量的数据范围里进行分析,处理,得到结果的。③水银温度计上 显示当前气
温是30℃ ,不涉及从很多数据中分析,没有使用到大数据。故本题选B 选项
2. 下列有关大数据的说法,错误的是( )
A 、大数据是分布式存储,分布式并行计算的
B 、大数据具有 4v 特征 , 体量大 , 数据类型繁多、价值密度低、变化速度快。 C 、大数据的样本趋于
总体,相关性重于因果
D 、大数据的样本趋于总体,相关性低于因果
【答案】D
课堂练习
3 .以下属于大数据应用实例的是( )。①某系统通过用户视频点播的基础数据如评 分、
播放、快进等,分析计算出用户可能喜爱的影片,并为他提供定制化的推荐②某网站通 过追
踪用户在其网络的行为,识别用户在它的网络中的好友,从而给出新的好友推荐建议③ 某
交通流量数据公司依靠分析历史和实时路况数据,能给出及时的路况报告,以帮助司机避 开
正在堵车的路段,并且帮他们提前规划好行程④某保险公司天都会对美国境内超过100 万 个
地点、未来两年的天气情况进行超过1 万次模拟,而后将根系结构和土壤孔隙度的相关数 据,
与模拟结果相结合,为成千上万的农民提供农作物保险A .①②④
③④ D .①②③④
B .①②③ C .②
【答案】D P101 大数据的概念
总结
作业
网络购物平台客户行为数据的
采集和分析?

展开更多......

收起↑

资源预览