5.1走近数据分析 课件(共27张PPT)-2022—2023学年高中信息技术教科版(2019)必修1

资源下载
  1. 二一教育资源

5.1走近数据分析 课件(共27张PPT)-2022—2023学年高中信息技术教科版(2019)必修1

资源简介

(共27张PPT)
第5单元
数据分析与人工智能
Contents
5.1 走近数据分析
e7d195523061f1c0c2b73831c94a3edc981f60e396d3e182073EE1468018468A7F192AE5E5CD515B6C3125F8AF6E4EE646174E8CF0B46FD19828DCE8CDA3B3A044A74F0E769C5FA8CB87AB6FC303C8BA3785FAC64AF54247D6964A8FBCED17CC661E9BBDBC040BE2E9BB5E7852A1CA2182FF1ADFE626A1F75E2AA4E3E887391BF8A0180D4EB5E92BD1FF04EF24E0AA94
1
2
5.2 探秘人工智能
PRESENTATION TEMPLATE
SIMPLY | SIMPLE | MODERN
e7d195523061f1c0c2b73831c94a3edc981f60e396d3e182073EE1468018468A7F192AE5E5CD515B6C3125F8AF6E4EE646174E8CF0B46FD19828DCE8CDA3B3A044A74F0E769C5FA8CB87AB6FC303C8BA3785FAC64AF54247D6964A8FBCED17CC661E9BBDBC040BE2E9BB5E7852A1CA2182FF1ADFE626A1F75E2AA4E3E887391BF8A0180D4EB5E92BD1FF04EF24E0AA94
学习目标
★ 了解数据分析的几种常用方法。
★ 体验对比分析和平均分析的—般分析过程。
★ 了解大数据的含义,认识大数据分析在信息社会的重要作用。
e7d195523061f1c0c2b73831c94a3edc981f60e396d3e182073EE1468018468A7F192AE5E5CD515B6C3125F8AF6E4EE646174E8CF0B46FD19828DCE8CDA3B3A044A74F0E769C5FA8CB87AB6FC303C8BA3785FAC64AF54247D6964A8FBCED17CC661E9BBDBC040BE2E9BB5E7852A1CA2182FF1ADFE626A1F75E2AA4E3E887391BF8A0180D4EB5E92BD1FF04EF24E0AA94
27路
49路
小海同学每天7: 00乘坐27路车去学校,17: 00左右放学回家。他觉得每天往返途中,公交车上并不拥挤。
而妈妈每天8: 00乘坐49路车出发,18: 00下班。她总是抱怨乘车者太多。
真相只有一个,到底是什么?
e7d195523061f1c0c2b73831c94a3edc981f60e396d3e182073EE1468018468A7F192AE5E5CD515B6C3125F8AF6E4EE646174E8CF0B46FD19828DCE8CDA3B3A044A74F0E769C5FA8CB87AB6FC303C8BA3785FAC64AF54247D6964A8FBCED17CC661E9BBDBC040BE2E9BB5E7852A1CA2182FF1ADFE626A1F75E2AA4E3E887391BF8A0180D4EB5E92BD1FF04EF24E0AA94
活动一 进行数据分析
一、师生讨论,提出假设
假设1:
可能49路车8:00与18:00左右客流量比27路7:00与17:00客流量大。
假设2:
可能8:00与18:00刚好是49路车的高峰期,而7:00与17:00不是27路车的高峰期。
假设3:
可能某一段时间内49路车的平均客流量要更大。
e7d195523061f1c0c2b73831c94a3edc981f60e396d3e182073EE1468018468A7F192AE5E5CD515B6C3125F8AF6E4EE646174E8CF0B46FD19828DCE8CDA3B3A044A74F0E769C5FA8CB87AB6FC303C8BA3785FAC64AF54247D6964A8FBCED17CC661E9BBDBC040BE2E9BB5E7852A1CA2182FF1ADFE626A1F75E2AA4E3E887391BF8A0180D4EB5E92BD1FF04EF24E0AA94
直接数据/
原始数据/
一手数据
间接数据/
二手数据
统计调查
或科学实验
通过查阅资料获得的数据,或他人对原始数据处理过的数据。
数据的来源与收集
数据的来源
旧知
全班同学的测试结果
从网上搜索到的各人格解析
e7d195523061f1c0c2b73831c94a3edc981f60e396d3e182073EE1468018468A7F192AE5E5CD515B6C3125F8AF6E4EE646174E8CF0B46FD19828DCE8CDA3B3A044A74F0E769C5FA8CB87AB6FC303C8BA3785FAC64AF54247D6964A8FBCED17CC661E9BBDBC040BE2E9BB5E7852A1CA2182FF1ADFE626A1F75E2AA4E3E887391BF8A0180D4EB5E92BD1FF04EF24E0AA94
调查法
访谈法
观察法
实验法
直接数据
数据的来源与收集
旧知
e7d195523061f1c0c2b73831c94a3edc981f60e396d3e182073EE1468018468A7F192AE5E5CD515B6C3125F8AF6E4EE646174E8CF0B46FD19828DCE8CDA3B3A044A74F0E769C5FA8CB87AB6FC303C8BA3785FAC64AF54247D6964A8FBCED17CC661E9BBDBC040BE2E9BB5E7852A1CA2182FF1ADFE626A1F75E2AA4E3E887391BF8A0180D4EB5E92BD1FF04EF24E0AA94
查阅文献资料
关注媒体资源
从相关数据公司购买
浏览权威网站
利用搜索引擎在网上进行检索
间接数据
数据的来源与收集
旧知
已经经过加工处理,使用起来更加方便
e7d195523061f1c0c2b73831c94a3edc981f60e396d3e182073EE1468018468A7F192AE5E5CD515B6C3125F8AF6E4EE646174E8CF0B46FD19828DCE8CDA3B3A044A74F0E769C5FA8CB87AB6FC303C8BA3785FAC64AF54247D6964A8FBCED17CC661E9BBDBC040BE2E9BB5E7852A1CA2182FF1ADFE626A1F75E2AA4E3E887391BF8A0180D4EB5E92BD1FF04EF24E0AA94
二、对比数据,分析方法
8点与18点的49路车比7点与17点的27路车客流量更大?
对比分析中的横向对比分析是指在类似的或同类的事物之间进行比较,从而揭示两类事物之间的关系。
假设1:
27
49
e7d195523061f1c0c2b73831c94a3edc981f60e396d3e182073EE1468018468A7F192AE5E5CD515B6C3125F8AF6E4EE646174E8CF0B46FD19828DCE8CDA3B3A044A74F0E769C5FA8CB87AB6FC303C8BA3785FAC64AF54247D6964A8FBCED17CC661E9BBDBC040BE2E9BB5E7852A1CA2182FF1ADFE626A1F75E2AA4E3E887391BF8A0180D4EB5E92BD1FF04EF24E0AA94
假设2:
如果你想知道49路车和27路车的高峰期呢?
对同一事物不同时间客流量进行对比分析,这种分析方式被称为纵向对比分析。
二、对比数据,分析方法
27
e7d195523061f1c0c2b73831c94a3edc981f60e396d3e182073EE1468018468A7F192AE5E5CD515B6C3125F8AF6E4EE646174E8CF0B46FD19828DCE8CDA3B3A044A74F0E769C5FA8CB87AB6FC303C8BA3785FAC64AF54247D6964A8FBCED17CC661E9BBDBC040BE2E9BB5E7852A1CA2182FF1ADFE626A1F75E2AA4E3E887391BF8A0180D4EB5E92BD1FF04EF24E0AA94
例如比较不同线路的平均客流量。
通过求得的平均数来代表车辆在一定时间内的一般客流量水平,这样比较平均数,就可以知道那条线路客流量更大,这种分析方式称为平均分析法。
假设3:
如何证明某段时间49路车的平均客流量大于27路?
27路与49路公交线路客流量表 时间段 27路 49路 时间段 27路 49路
6:00-7:00 45 61 15:00-16:00 58 98
7:00-8:00 120 170 16:00-17:00 70 102
8:00-9:00 160 211 17:00-18:00 120 125
9:00-10:00 143 149 18:00-19:00 121 123
10:00-11:00 53 122 19:00-20:00 65 57
11:00-12:00 72 99 20:00-21:00 50 30
12:00-13:00 59 65 21:00-22:00 30 25
13:00-14:00 58 100 22:00-23:00 16 13
14:00-15:00 56 96
二、数据计算,平均分析
e7d195523061f1c0c2b73831c94a3edc981f60e396d3e182073EE1468018468A7F192AE5E5CD515B6C3125F8AF6E4EE646174E8CF0B46FD19828DCE8CDA3B3A044A74F0E769C5FA8CB87AB6FC303C8BA3785FAC64AF54247D6964A8FBCED17CC661E9BBDBC040BE2E9BB5E7852A1CA2182FF1ADFE626A1F75E2AA4E3E887391BF8A0180D4EB5E92BD1FF04EF24E0AA94
数据分析主要用于现状分析、原因分析和预测分析。
进行数据分析时
1.首先要根据分析的目标提出假设
2.选择恰当的分析方法进行分析,验证假设是否正确
3.得出相应的结论。
数据分析
提出假设
进行分析
验证假设
得出结论
e7d195523061f1c0c2b73831c94a3edc981f60e396d3e182073EE1468018468A7F192AE5E5CD515B6C3125F8AF6E4EE646174E8CF0B46FD19828DCE8CDA3B3A044A74F0E769C5FA8CB87AB6FC303C8BA3785FAC64AF54247D6964A8FBCED17CC661E9BBDBC040BE2E9BB5E7852A1CA2182FF1ADFE626A1F75E2AA4E3E887391BF8A0180D4EB5E92BD1FF04EF24E0AA94
善于学习,更善于总结
你认为横向对比分析法与纵向对比分析法有什么区别?与平均分析法呢?
数据分析方法 应用实例 适用范围 作用
横行对比分析
纵向对比分析
平均分析
部分食物中营养营养成分对比表
一天中气温的变化情况
不同食物中蛋白质含量的对比;49路车与27路车客流量的对比
同类事物
比较事物间大小、数量关系
一天气温变化情况;49路车客流高峰期
单一事物
展现变化过程
同类事物
水果类食物中蛋白质含量的平均值;
国家人口的平均寿命
衡量平均水平
e7d195523061f1c0c2b73831c94a3edc981f60e396d3e182073EE1468018468A7F192AE5E5CD515B6C3125F8AF6E4EE646174E8CF0B46FD19828DCE8CDA3B3A044A74F0E769C5FA8CB87AB6FC303C8BA3785FAC64AF54247D6964A8FBCED17CC661E9BBDBC040BE2E9BB5E7852A1CA2182FF1ADFE626A1F75E2AA4E3E887391BF8A0180D4EB5E92BD1FF04EF24E0AA94
数据可视化表达
以图形、图像和动画等方式更加直观、生动地呈现数据及数据分析结果,揭示数据之间的关系趋势和规律等的表达方式。
基本图表类型:
柱状图
饼图
折线图
专业性工具:
WordArt
Citespace
微词云
e7d195523061f1c0c2b73831c94a3edc981f60e396d3e182073EE1468018468A7F192AE5E5CD515B6C3125F8AF6E4EE646174E8CF0B46FD19828DCE8CDA3B3A044A74F0E769C5FA8CB87AB6FC303C8BA3785FAC64AF54247D6964A8FBCED17CC661E9BBDBC040BE2E9BB5E7852A1CA2182FF1ADFE626A1F75E2AA4E3E887391BF8A0180D4EB5E92BD1FF04EF24E0AA94
数据分析报告组成
目的
背景
存在的问题
希望解决的问题
数据来源
思路

分析的过程
结论
建议
方法
模型
e7d195523061f1c0c2b73831c94a3edc981f60e396d3e182073EE1468018468A7F192AE5E5CD515B6C3125F8AF6E4EE646174E8CF0B46FD19828DCE8CDA3B3A044A74F0E769C5FA8CB87AB6FC303C8BA3785FAC64AF54247D6964A8FBCED17CC661E9BBDBC040BE2E9BB5E7852A1CA2182FF1ADFE626A1F75E2AA4E3E887391BF8A0180D4EB5E92BD1FF04EF24E0AA94
任务二 体验公交服务
假如来到一个陌生的地方,需要知道自己所处的具体位置,拿出手机,里面的地图软件可以很方便地帮助你定位、计算并推荐去目的地的路线
假设我现在学校,计划从华师附中出发前往友谊阳光城
e7d195523061f1c0c2b73831c94a3edc981f60e396d3e182073EE1468018468A7F192AE5E5CD515B6C3125F8AF6E4EE646174E8CF0B46FD19828DCE8CDA3B3A044A74F0E769C5FA8CB87AB6FC303C8BA3785FAC64AF54247D6964A8FBCED17CC661E9BBDBC040BE2E9BB5E7852A1CA2182FF1ADFE626A1F75E2AA4E3E887391BF8A0180D4EB5E92BD1FF04EF24E0AA94
e7d195523061f1c0c2b73831c94a3edc981f60e396d3e182073EE1468018468A7F192AE5E5CD515B6C3125F8AF6E4EE646174E8CF0B46FD19828DCE8CDA3B3A044A74F0E769C5FA8CB87AB6FC303C8BA3785FAC64AF54247D6964A8FBCED17CC661E9BBDBC040BE2E9BB5E7852A1CA2182FF1ADFE626A1F75E2AA4E3E887391BF8A0180D4EB5E92BD1FF04EF24E0AA94
大数据分析是指对规模巨大的数据进行分析。对数量巨大、来源分散、格式多样的数据进行采集、存储和分析关联,从中发现新知识、创造新价值、提升新能力的新一代信息技术和服务业态。
e7d195523061f1c0c2b73831c94a3edc981f60e396d3e182073EE1468018468A7F192AE5E5CD515B6C3125F8AF6E4EE646174E8CF0B46FD19828DCE8CDA3B3A044A74F0E769C5FA8CB87AB6FC303C8BA3785FAC64AF54247D6964A8FBCED17CC661E9BBDBC040BE2E9BB5E7852A1CA2182FF1ADFE626A1F75E2AA4E3E887391BF8A0180D4EB5E92BD1FF04EF24E0AA94
在公交站台等车,久等不来总令人焦急
实时公交信息查询软件则可以实时反馈公交车辆的运行信息,提升乘客的出行效率。
e7d195523061f1c0c2b73831c94a3edc981f60e396d3e182073EE1468018468A7F192AE5E5CD515B6C3125F8AF6E4EE646174E8CF0B46FD19828DCE8CDA3B3A044A74F0E769C5FA8CB87AB6FC303C8BA3785FAC64AF54247D6964A8FBCED17CC661E9BBDBC040BE2E9BB5E7852A1CA2182FF1ADFE626A1F75E2AA4E3E887391BF8A0180D4EB5E92BD1FF04EF24E0AA94
实时公交系统根据用户当前的位置,迅速定位最近的公交站点,查找系统中公交车辆的位置数据,选出经过该站点所有线路车辆的即将到站信息,使用户可以直观地在手机上查看车辆实时位置。
e7d195523061f1c0c2b73831c94a3edc981f60e396d3e182073EE1468018468A7F192AE5E5CD515B6C3125F8AF6E4EE646174E8CF0B46FD19828DCE8CDA3B3A044A74F0E769C5FA8CB87AB6FC303C8BA3785FAC64AF54247D6964A8FBCED17CC661E9BBDBC040BE2E9BB5E7852A1CA2182FF1ADFE626A1F75E2AA4E3E887391BF8A0180D4EB5E92BD1FF04EF24E0AA94
实时公交信息查询软件使用体验 序号 体验并思考问题 结果
1 查看该软件为用户提供了哪些实用功能? 路线、时间及距离查询
2 如果有条件,乘公交车出行时使用该软件,并回答以下问题: 1.它所提供的公交车运行信息是否及时准确? 2.它是否可以提供多种出行方案? 基本准确

可以提供多种出行方案
3 定位公交车位置信息需要哪些技术?它们各有什么优缺点? GPS/北斗定位技术、3G/4G通信技术、GIS地理信息系统技术
大数据分析带来价值的同时,也在隐私保护、安全问题等方面带来危机。因此,合理、健康地使用大数据,遵循“数据道德” 是我们的必备品质。
e7d195523061f1c0c2b73831c94a3edc981f60e396d3e182073EE1468018468A7F192AE5E5CD515B6C3125F8AF6E4EE646174E8CF0B46FD19828DCE8CDA3B3A044A74F0E769C5FA8CB87AB6FC303C8BA3785FAC64AF54247D6964A8FBCED17CC661E9BBDBC040BE2E9BB5E7852A1CA2182FF1ADFE626A1F75E2AA4E3E887391BF8A0180D4EB5E92BD1FF04EF24E0AA94
大数据分析的应用
大数据分析离我们生活并不遥远,生活中广泛应用着,比如在教育、医疗、保险、商业、金融等方面。
再比如衣食住行方面:
1、淘宝通过对海量数据的掌握和分析,为用户提供更加个性化和专业化的服务。
2、出行的实时交通
3、......
面对海量的数据,为了搜索、处理、分析、归纳和总结其深层次的规律,大数据分析应运而生。
e7d195523061f1c0c2b73831c94a3edc981f60e396d3e182073EE1468018468A7F192AE5E5CD515B6C3125F8AF6E4EE646174E8CF0B46FD19828DCE8CDA3B3A044A74F0E769C5FA8CB87AB6FC303C8BA3785FAC64AF54247D6964A8FBCED17CC661E9BBDBC040BE2E9BB5E7852A1CA2182FF1ADFE626A1F75E2AA4E3E887391BF8A0180D4EB5E92BD1FF04EF24E0AA94

存储是分布的呀!“分布式”的存储为以后“分布式处理”做准备,“分布”是高效处理的前提,否则大数据处理怎么这么快。
处理也是分布!在分析之前对数据进行规整化是处理阶段的重要工作。一切为了提高效率!
大数据分析的方法有很多,统计分析和数据挖掘也是大数据分析。
大数据采集
分布式文件存储
分布式数据库存储
分布式处理
分析
拓展知识
因为大数据的量大到不能再使用常规的方法进行存储和处理,所以大数据分析和普通的数据分析也有所区别。大数据分析的一般流程可以表示如图:
e7d195523061f1c0c2b73831c94a3edc981f60e396d3e182073EE1468018468A7F192AE5E5CD515B6C3125F8AF6E4EE646174E8CF0B46FD19828DCE8CDA3B3A044A74F0E769C5FA8CB87AB6FC303C8BA3785FAC64AF54247D6964A8FBCED17CC661E9BBDBC040BE2E9BB5E7852A1CA2182FF1ADFE626A1F75E2AA4E3E887391BF8A0180D4EB5E92BD1FF04EF24E0AA94
1.某公司根据对上一年各个季度原材料供应商A送货量及时率的分析及建模,预测本季度该供应商的订单履约率下降2%。该过程最有可能用到的数据分析方法有?( )
A.平均分析 B.纵向对比分析 C.横向对比分析 D.一般分析
2.某企业通过分析及统计不同的客户对于同一内容的刷新时间、处理时间及解决问题的时间等,推测一般用户的使用时间。该过程最有可能用到的数据分析方法有?( )
A.平均分析 B.纵向对比分析 C.横向对比分析 D.一般分析
巩固提升
B
AC
e7d195523061f1c0c2b73831c94a3edc981f60e396d3e182073EE1468018468A7F192AE5E5CD515B6C3125F8AF6E4EE646174E8CF0B46FD19828DCE8CDA3B3A044A74F0E769C5FA8CB87AB6FC303C8BA3785FAC64AF54247D6964A8FBCED17CC661E9BBDBC040BE2E9BB5E7852A1CA2182FF1ADFE626A1F75E2AA4E3E887391BF8A0180D4EB5E92BD1FF04EF24E0AA94
案例分析:根据大数据发现人们的出行规律
在美国旧金山举行的KDD2016学术会议上,罗格斯大学的熊辉等学者向大家报告了他们的研究论文。论文指出,北京在2014年的前9个月就有350名扒手在地铁交通系统上被抓, 490名扒手在公交车上被抓。因此,他们认为可以通过对北京智能公交一卡通数据进行分析研究,根据异常交通记录分析来抓小偷。如要实现这个功能,要调用哪些数据呢?同学们也可以上网搜索相关资料,了解大数据专家是如何分析的。
参考答案:
案例来源于熊辉等学者提交的论文。论文中阐述了他收集乘客的公交一卡通数据记录,分析了896条地铁经过的44524个公交车站和18条地铁经过的320个地铁站的数据。从出行轨迹提取特征。例如正常行人在从A地区到B地区会考虑最短时间、距离,或者最少换乘,但是类似“A-C-D-B”这种无目的的异常交通方式为异常行为。如果异常行为足够多,则他可能是一名扒手。具体的算法和模型,可见论文详细描述。(有兴趣的同学,再继续研究)
拓展练习
e7d195523061f1c0c2b73831c94a3edc981f60e396d3e182073EE1468018468A7F192AE5E5CD515B6C3125F8AF6E4EE646174E8CF0B46FD19828DCE8CDA3B3A044A74F0E769C5FA8CB87AB6FC303C8BA3785FAC64AF54247D6964A8FBCED17CC661E9BBDBC040BE2E9BB5E7852A1CA2182FF1ADFE626A1F75E2AA4E3E887391BF8A0180D4EB5E92BD1FF04EF24E0AA94
课堂小结
走近数据分析
体验公交出行
体验实时公交
数据分析的基本方法
数据可视化表达
数据分析报告
对比分析法
平均分析法
大数据
地图软件
含义
重要作用
THANK four watching

展开更多......

收起↑

资源预览