第二单元项目三 调查中学移动学习现状——经历数据处理一般过程课件(共71张PPT)-2023——2024学年高中信息技术沪科版(2019)必修1

资源下载
  1. 二一教育资源

第二单元项目三 调查中学移动学习现状——经历数据处理一般过程课件(共71张PPT)-2023——2024学年高中信息技术沪科版(2019)必修1

资源简介

(共71张PPT)
第二单元 数据处理与应用
——经历数据处理的一般过程
在这输入您的学校名字
2
0
2
3
EDUCATION
了解数据处理的概念及其过程
01
认识数据处理的应用价值
02
了解数据采集的概念
03
了解数据分析的概念及其方法
04
目 录
Contents
了解数据可视化的概念及其呈现方式
05
项目要求
围绕中学生移动学习现状,通过在线问卷调查采集数据,并借助软件工具完成数据分析和可视化,最后撰写一份调查报告在班级中交流。
复习导入
数据
信息
知识
智慧
处理
转化
内化
前瞻性看法
经过加工和处理的数据
经过人为解读和经验充实的信息
抽象的内容、独立时无含义
数据处理:是从大量的数据中抽取出有价值信息的过程,即数据转换成信息的过程。
通过对学生考试成绩的分析,找出薄弱知识环节,针对性地教学;
对历年高考录取分数、人数统计分析,预估今年录取分数,填报志愿;
网络购物平台根据用户点击商品的频次、满意度等数据,提供商品排行榜,为用户选择商品提供参考虑;
新知讲解
中文输入法根据用户的词频,调整字词顺序,提高用户的输入频率;
过关练习
以下选项中,属于数据处理的目的的是( )A.检测修正数据
B.整合数据资源C.统一数据格式
D.提取有用信息
新知讲解
数据处理的一般过程
明确目标
数据采集
数据加工
数据分析
数据可视化
报告撰写
新知讲解
01
明确目标是指明确数据收集的目的,确立收集思路。首先,要思考开展数据收集的原因,即要解决什么问题。然后,要梳理数据收集的思路,搭建收集框架,确定使用哪些收集方法和工具。
明确目标
明确目标
明确数据处理的目的,确立分析思路。
解决什么样的问题?
梳理分析思路
搭建分析框架
确定分析方法和工具
新知讲解
数据采集(第一课)
在这输入您的学校名字
2
0
2
3
新课导入
如何得到李小明五次考试的成绩?
新知讲解
02
数据采集是指人们根据需要获取数据,它是确保数据处理过程有效的基础。技术工具的发展使得数据采集方式日趋多样。
数据采集
新知讲解
数据的采集方法
A
数据采集
采集数据——方法、工具
采集方法 人工获取 自动采集 调查 访谈 观察 实验 文献调研 物联网感知 视频监控 网络平台
采集工具 问卷 表格 文献检索工具 传感器 摄像机 问卷调查
搜索引擎
采集软件
网络爬虫
人直接从社会现象,自然现象或文献中获得数据。
在信息技术的支持下,通过各种终端设备、网络数据库等获取数据。
物联网感知:是指对在物联网中使用电子标签或无线终端标识的智能化物体,通知感知它们的数据变化,采集相关
数据,并利用各种通信技术上传到网络信息中心存储。
视频采集:是指借助不同监控点的摄像机采集监控区域的数据。
网络平台采集:主要是指用户在访问网站或使用App时,网络服务器上安装的采集软件自动采集用户的各种行为数据。
数据的时效性、权威性、合法性
新知讲解
过关练习
.下列采集信息的方法中,不属于通过亲自探究事物本身获取信息的是( )。
A.观察
B.实验
C.调查
D.听讲座
新知讲解
网络采集——传感器采集
传感器是能检测、采集物理世界的各种信息,并将信息转换为电信号形式表示的数据采集设备。
课堂活动
寻找传感器
课堂活动
寻找传感器
新知讲解
手机中的传感器
1. 陀螺仪 5. 摄像头 9. GPS传感器
2.重力传感器 6. 电磁传感器 10. 温度传感器
3.加速度传感器 7. 距离传感器 11. 麦克风
4.指纹传感器 8. 光线传感器 12.气压传感器
问题探究
网络采集——传感器采集
传感器帮助手机实现了很多功能。
如果想了解北京今天的天气情况来确定出行,手机能帮到我们吗?我们该怎么去了解。。
新知讲解
网络采集——搜索引擎
采集已有网页数据,比如百度
新知讲解
数据采集
网络采集——爬虫
精确抓取网络数据
1、软件:集搜客、八爪鱼、后羿采集器
2、编写程序
注意:不能恶意爬取,不能侵犯个人隐私、不能将爬取信息用于不正当竞争;
不能侵犯商业秘密等
新知讲解
数据采集
网络采集——问卷
新知讲解
问卷是为了达到调研目的和采集必要数据而设计的一系列问题。问卷设计的好坏,直接关系到数据采集工作质量的高低。
数据采集
网络采集——问卷
需要人提供数据
过关练习
问卷调查法是常用的数据收集方法之一,它与以下哪种方法同属于直接数据收集( )
A.用百度在网上检索
B.查阅纸质文献
C.关注中央新闻
D.用传感器检测光线值
思考与讨论
在线调查平台在编辑问卷时,要求先明确每个问题的类型,如单选题、多选题、排序题等。这是为什么?
数据采集
总结提练
明确问题类型后,平台才能确定答题的方式,从而给出对应的答题样式设计。
在线问卷可以利用平台中的相关设置来控制数据采集的目标人群和问卷发放数量等
数据采集
作业布置
利用在线调查平台“设计”发布问卷,并向目标人群发放问卷。
数据采集
小结
数据采集的步骤:
数据采集
找什么——去哪儿找——怎么找
需求
确定来源
选择采集的方法
将李小明五次考试成绩采集到电脑,并以”李小明五次月考成绩表“为文件名保存到电脑桌面上。
数据分析
课堂探究一
数据加工、数据分析(第二课)
在这输入您的学校名字
2
0
2
3
新课导入
李小明同学选择什么组合更好些呢,为什么?
采集到的五次考试成绩有什么问题?
新课导入
李小明同学选择什么组合更好些呢,为什么?
采集到的五次考试成绩有什么问题?
新知讲解
03
指通过数据编码、数据清洗、数据重组等一系列过程,使采集到的数据符合数据分析的需求。
数据加工
指通过数据编码、数据清洗、数据重组等一系列过程,使采集到的数据符合数据分析的需求。
数据加工
新知讲解
指通过数据编码、数据清洗、数据重组等一系列过程,使采集到的数据符合数据分析的需求。
数据清洗(Data cleaning):对数据进行重新审查和校验的过程,目的在于删除重复信息、纠正存在的错误,并提供数据一致性。
数据加工
新知讲解
数据清洗方法:
去重
删除重复
补漏
避免缺失
勘误
标准化、异常值修正
探究活动
勘误
修正异常值
补漏
补上数据
去重
删除重复
指通过数据编码、数据清洗、数据重组等一系列过程,使采集到的数据符合数据分析的需求。
数据使用过程中,因为一些增、删、改等操作,使得数据的分布索引及相关数据会变得比较凌乱,从而影响数据的效率。 数据重组即是将数据的相关信息重新组织。
数据加工
新知讲解
数据加工
新知讲解
打开桌面上”李小明五次月考成绩表“完成”数据加工整理“表中的数据进行加工整理。
数据分析
课堂探究一
新知讲解
04
数据分析是指用适当的分析方法与工具,对采集到的数据进行分类整理,提取与发现其中有价值的信息,形成结论的过程。数据分析的目的是从描述研究对象的数据中,发现其内在特征和规律。
数据分析
新知讲解
数据分析
对比
预测
细分
数据分析
数据分析的方法
描述性分析方法
对比分析法
平均分析法
交叉分析法
将两个或两个以上的数据进行对比,分析它们的差异,可以分辨数据的性质、变化、发展等个性特征。
利用计算平均数的方法,可以反映总体在一定时间、地点下数据特征的一般水平。
这是一种立体分析法,它从横向和纵向两个方向来计算两个或多个有联系的变量在交叉点的统计值。
数据分析
新知讲解
数据分析的工具
数据分析
Excel电子表格
WPS表格
编写程序 ——pandas库
新知讲解
打开桌面上”李小明五次月考成绩表“完成”数据分析“表中的任务一、任务二
数据分析
课堂探究三
数据可视化(第三课)
在这输入您的学校名字
2
0
2
3
课堂导入
如何直观地将各科成绩展现出来呢?
数据可视化
新知讲解
05
数据可视化是指将数据分析的结果通过表格、图表、图形等形式显示出来,还可以通过这些形式对分析结果进行一些交互处理。利用人对形状、颜色等特性的感官敏感性,数据可视化能更清晰、有效地帮助人们发现数据间的关系、规律和趋势,传递数据背后的信息。
新知讲解
数据可视化
新知讲解
面积图
条形图(柱形图)
折线图
饼形图
散点图
雷达图
常见的
数据图表
数据可视化
新知讲解
面积图
条形图(柱形图)
折线图
饼形图
散点图
雷达图
常见的
数据图表
主要体现不同项目数据之间的比较。
数据可视化
新知讲解
面积图
条形图(柱形图)
折线图
饼形图
散点图
雷达图
常见的
数据图表
折线图主要反映事物随时间变化的情况和发展趋势。
数据可视化
新知讲解
面积图
条形图(柱形图)
折线图
饼形图
散点图
雷达图
常见的
数据图表
饼形图表示各部分在总体所占的百分。
数据可视化
新知讲解
面积图
条形图(柱形图)
折线图
饼形图
散点图
雷达图
常见的
数据图表
面积图一般用于展示或者比较随时间序列而变化的的定量
数据可视化
新知讲解
面积图
条形图(柱形图)
折线图
饼形图
散点图
雷达图
常见的
数据图表
散点图适用于观察两个数值型变量之间是否具有线性关系,散点图通常用于
比较跨类别的聚合数据。散点图通常用于显示和比较数值。
数据可视化
新知讲解
数据可视化
关于散点图,下列说法正确的是( )A.可呈现变量的频数分布B.可表示两种特征间的相关关系C.可描述变量的变化趋势D.可直观表述出各指标的位置
本题主要考查散点图的描述。频率分布直方图呈现变量的频数分布,折线图可描述变量的变化趋势,散点图可表示两种特征间的相关关系,故本题选B选项。
新知讲解
面积图
条形图(柱形图)
折线图
饼图形
散点图
雷达图
常见的
数据图表
雷达图主要应用于企业经营状况--收益性、生产性、流动性、
安全性和成长性的评价。
数据可视化
新知讲解
可视化图形
树图
动图、动画
地图
网络图
热力图
词云图
数据可视化
新知讲解
词云图
地图
“词云”就是通过形成“关键词云层”或“关键词渲染”,对网络文本中出现频率较高的“关键词”的视觉上的突出
数据可视化
新知讲解
数据可视化
词云图是一种数据可视化表达方式。关于下图所示词云图说法正确的是( )
A.词云图只能通过字体的大小表示关键词的重要程度
B.对文本分词后可直接创建词云图,无须特征提取
C.从词云图可以分析出词语“父亲”比“北京”的出现频率高
D.词云图必须显示该数据集包含的全部词语

【详解】本题考查的是词云图。词云图通过字体的大小和颜色来表示关键词的重要程度,故选项A说法错误;创建词云图需要特征提取,故选项B说法错误;从词云图可以分析出词语“父亲”比“北京”的出现频率高,选项C说法正确;词云图过滤掉大量的文本信息,使浏览网页者只要一眼扫过文本就可以领略文本的主旨,故选项D说法错误。
新知讲解
数据可视化
下图是对文本数据进行处理生成的“词云”图。图中的词语显示有大有小,显示较大的是因为这个词( )
A.比较重要 B.出现次数较多
C.比较关键 D.比较流行
【详解】本题主要考查数据可视化处理。图中的词语显示有大有小,显示较大的是因为这个词出现次数较多,故本题选B选项。
新知讲解
网络图
热力图
树图
数据可视化
新知讲解
常用的图表工具
数据可视化
.WPS表格或Excel等电子表格软件
.在互联网上有大量优秀的数据可视化工具,如RAW、Infogram、Tableau等。
.按自己需要缟程实现。
新知讲解
数据可视化
易词云 - 词云生成器 https://www.yciyun.com/
新知讲解
06
数据可视化是指将数据分析的结果通过表格、图表、图形等形式显示出来,还可以通过这些形式对分析结果进行一些交互处理。利用人对形状、颜色等特性的感官敏感性,数据可视化能更清晰、有效地帮助人们发现数据间的关系、规律和趋势,传递数据背后的信息。
报告撰写
课后探究
1、如何快速知道李小明同学那次考得最好?
2、按总分由高到低将李小明同学的五次成绩重新排列。
成果呈现
新知讲解
报告撰写
采集数据——数据的存储与保护
数据存在本地内部
数据存储
1
数据放在第三方公共或私有的“云端”存储
2
数据收集时进行数据精度处理
采集数据——数据的存储与保护
数据安全保护技术
数据保护
1
数据的隐私保护
2
拷贝/FTP
备 份
复制技术
镜像技术
技术手段
提高自身保护意识
对数据使用者进行道德和法律上的约束
数据共享时进行访问控制
数据发布时进行人工干扰
数据分析进行数据匿名处理

展开更多......

收起↑

资源预览