资源简介 (共71张PPT)第二单元 数据处理与应用——经历数据处理的一般过程在这输入您的学校名字2023EDUCATION了解数据处理的概念及其过程01认识数据处理的应用价值02了解数据采集的概念03了解数据分析的概念及其方法04目 录Contents了解数据可视化的概念及其呈现方式05项目要求围绕中学生移动学习现状,通过在线问卷调查采集数据,并借助软件工具完成数据分析和可视化,最后撰写一份调查报告在班级中交流。复习导入数据信息知识智慧处理转化内化前瞻性看法经过加工和处理的数据经过人为解读和经验充实的信息抽象的内容、独立时无含义数据处理:是从大量的数据中抽取出有价值信息的过程,即数据转换成信息的过程。通过对学生考试成绩的分析,找出薄弱知识环节,针对性地教学;对历年高考录取分数、人数统计分析,预估今年录取分数,填报志愿;网络购物平台根据用户点击商品的频次、满意度等数据,提供商品排行榜,为用户选择商品提供参考虑;新知讲解中文输入法根据用户的词频,调整字词顺序,提高用户的输入频率;过关练习以下选项中,属于数据处理的目的的是( )A.检测修正数据B.整合数据资源C.统一数据格式D.提取有用信息新知讲解数据处理的一般过程明确目标数据采集数据加工数据分析数据可视化报告撰写新知讲解01明确目标是指明确数据收集的目的,确立收集思路。首先,要思考开展数据收集的原因,即要解决什么问题。然后,要梳理数据收集的思路,搭建收集框架,确定使用哪些收集方法和工具。明确目标明确目标明确数据处理的目的,确立分析思路。解决什么样的问题?梳理分析思路搭建分析框架确定分析方法和工具新知讲解数据采集(第一课)在这输入您的学校名字2023新课导入如何得到李小明五次考试的成绩?新知讲解02数据采集是指人们根据需要获取数据,它是确保数据处理过程有效的基础。技术工具的发展使得数据采集方式日趋多样。数据采集新知讲解数据的采集方法A数据采集采集数据——方法、工具采集方法 人工获取 自动采集 调查 访谈 观察 实验 文献调研 物联网感知 视频监控 网络平台采集工具 问卷 表格 文献检索工具 传感器 摄像机 问卷调查搜索引擎采集软件网络爬虫人直接从社会现象,自然现象或文献中获得数据。在信息技术的支持下,通过各种终端设备、网络数据库等获取数据。物联网感知:是指对在物联网中使用电子标签或无线终端标识的智能化物体,通知感知它们的数据变化,采集相关数据,并利用各种通信技术上传到网络信息中心存储。视频采集:是指借助不同监控点的摄像机采集监控区域的数据。网络平台采集:主要是指用户在访问网站或使用App时,网络服务器上安装的采集软件自动采集用户的各种行为数据。数据的时效性、权威性、合法性新知讲解过关练习.下列采集信息的方法中,不属于通过亲自探究事物本身获取信息的是( )。A.观察B.实验C.调查D.听讲座新知讲解网络采集——传感器采集传感器是能检测、采集物理世界的各种信息,并将信息转换为电信号形式表示的数据采集设备。课堂活动寻找传感器课堂活动寻找传感器新知讲解手机中的传感器1. 陀螺仪 5. 摄像头 9. GPS传感器2.重力传感器 6. 电磁传感器 10. 温度传感器3.加速度传感器 7. 距离传感器 11. 麦克风4.指纹传感器 8. 光线传感器 12.气压传感器问题探究网络采集——传感器采集传感器帮助手机实现了很多功能。如果想了解北京今天的天气情况来确定出行,手机能帮到我们吗?我们该怎么去了解。。新知讲解网络采集——搜索引擎采集已有网页数据,比如百度新知讲解数据采集网络采集——爬虫精确抓取网络数据1、软件:集搜客、八爪鱼、后羿采集器2、编写程序注意:不能恶意爬取,不能侵犯个人隐私、不能将爬取信息用于不正当竞争;不能侵犯商业秘密等新知讲解数据采集网络采集——问卷新知讲解问卷是为了达到调研目的和采集必要数据而设计的一系列问题。问卷设计的好坏,直接关系到数据采集工作质量的高低。数据采集网络采集——问卷需要人提供数据过关练习问卷调查法是常用的数据收集方法之一,它与以下哪种方法同属于直接数据收集( )A.用百度在网上检索B.查阅纸质文献C.关注中央新闻D.用传感器检测光线值思考与讨论在线调查平台在编辑问卷时,要求先明确每个问题的类型,如单选题、多选题、排序题等。这是为什么?数据采集总结提练明确问题类型后,平台才能确定答题的方式,从而给出对应的答题样式设计。在线问卷可以利用平台中的相关设置来控制数据采集的目标人群和问卷发放数量等数据采集作业布置利用在线调查平台“设计”发布问卷,并向目标人群发放问卷。数据采集小结数据采集的步骤:数据采集找什么——去哪儿找——怎么找需求确定来源选择采集的方法将李小明五次考试成绩采集到电脑,并以”李小明五次月考成绩表“为文件名保存到电脑桌面上。数据分析课堂探究一数据加工、数据分析(第二课)在这输入您的学校名字2023新课导入李小明同学选择什么组合更好些呢,为什么?采集到的五次考试成绩有什么问题?新课导入李小明同学选择什么组合更好些呢,为什么?采集到的五次考试成绩有什么问题?新知讲解03指通过数据编码、数据清洗、数据重组等一系列过程,使采集到的数据符合数据分析的需求。数据加工指通过数据编码、数据清洗、数据重组等一系列过程,使采集到的数据符合数据分析的需求。数据加工新知讲解指通过数据编码、数据清洗、数据重组等一系列过程,使采集到的数据符合数据分析的需求。数据清洗(Data cleaning):对数据进行重新审查和校验的过程,目的在于删除重复信息、纠正存在的错误,并提供数据一致性。数据加工新知讲解数据清洗方法:去重删除重复补漏避免缺失勘误标准化、异常值修正探究活动勘误修正异常值补漏补上数据去重删除重复指通过数据编码、数据清洗、数据重组等一系列过程,使采集到的数据符合数据分析的需求。数据使用过程中,因为一些增、删、改等操作,使得数据的分布索引及相关数据会变得比较凌乱,从而影响数据的效率。 数据重组即是将数据的相关信息重新组织。数据加工新知讲解数据加工新知讲解打开桌面上”李小明五次月考成绩表“完成”数据加工整理“表中的数据进行加工整理。数据分析课堂探究一新知讲解04数据分析是指用适当的分析方法与工具,对采集到的数据进行分类整理,提取与发现其中有价值的信息,形成结论的过程。数据分析的目的是从描述研究对象的数据中,发现其内在特征和规律。数据分析新知讲解数据分析对比预测细分数据分析数据分析的方法描述性分析方法对比分析法平均分析法交叉分析法将两个或两个以上的数据进行对比,分析它们的差异,可以分辨数据的性质、变化、发展等个性特征。利用计算平均数的方法,可以反映总体在一定时间、地点下数据特征的一般水平。这是一种立体分析法,它从横向和纵向两个方向来计算两个或多个有联系的变量在交叉点的统计值。数据分析新知讲解数据分析的工具数据分析Excel电子表格WPS表格编写程序 ——pandas库新知讲解打开桌面上”李小明五次月考成绩表“完成”数据分析“表中的任务一、任务二数据分析课堂探究三数据可视化(第三课)在这输入您的学校名字2023课堂导入如何直观地将各科成绩展现出来呢?数据可视化新知讲解05数据可视化是指将数据分析的结果通过表格、图表、图形等形式显示出来,还可以通过这些形式对分析结果进行一些交互处理。利用人对形状、颜色等特性的感官敏感性,数据可视化能更清晰、有效地帮助人们发现数据间的关系、规律和趋势,传递数据背后的信息。新知讲解数据可视化新知讲解面积图条形图(柱形图)折线图饼形图散点图雷达图常见的数据图表数据可视化新知讲解面积图条形图(柱形图)折线图饼形图散点图雷达图常见的数据图表主要体现不同项目数据之间的比较。数据可视化新知讲解面积图条形图(柱形图)折线图饼形图散点图雷达图常见的数据图表折线图主要反映事物随时间变化的情况和发展趋势。数据可视化新知讲解面积图条形图(柱形图)折线图饼形图散点图雷达图常见的数据图表饼形图表示各部分在总体所占的百分。数据可视化新知讲解面积图条形图(柱形图)折线图饼形图散点图雷达图常见的数据图表面积图一般用于展示或者比较随时间序列而变化的的定量数据可视化新知讲解面积图条形图(柱形图)折线图饼形图散点图雷达图常见的数据图表散点图适用于观察两个数值型变量之间是否具有线性关系,散点图通常用于比较跨类别的聚合数据。散点图通常用于显示和比较数值。数据可视化新知讲解数据可视化关于散点图,下列说法正确的是( )A.可呈现变量的频数分布B.可表示两种特征间的相关关系C.可描述变量的变化趋势D.可直观表述出各指标的位置本题主要考查散点图的描述。频率分布直方图呈现变量的频数分布,折线图可描述变量的变化趋势,散点图可表示两种特征间的相关关系,故本题选B选项。新知讲解面积图条形图(柱形图)折线图饼图形散点图雷达图常见的数据图表雷达图主要应用于企业经营状况--收益性、生产性、流动性、安全性和成长性的评价。数据可视化新知讲解可视化图形树图动图、动画地图网络图热力图词云图数据可视化新知讲解词云图地图“词云”就是通过形成“关键词云层”或“关键词渲染”,对网络文本中出现频率较高的“关键词”的视觉上的突出数据可视化新知讲解数据可视化词云图是一种数据可视化表达方式。关于下图所示词云图说法正确的是( )A.词云图只能通过字体的大小表示关键词的重要程度B.对文本分词后可直接创建词云图,无须特征提取C.从词云图可以分析出词语“父亲”比“北京”的出现频率高D.词云图必须显示该数据集包含的全部词语。【详解】本题考查的是词云图。词云图通过字体的大小和颜色来表示关键词的重要程度,故选项A说法错误;创建词云图需要特征提取,故选项B说法错误;从词云图可以分析出词语“父亲”比“北京”的出现频率高,选项C说法正确;词云图过滤掉大量的文本信息,使浏览网页者只要一眼扫过文本就可以领略文本的主旨,故选项D说法错误。新知讲解数据可视化下图是对文本数据进行处理生成的“词云”图。图中的词语显示有大有小,显示较大的是因为这个词( )A.比较重要 B.出现次数较多C.比较关键 D.比较流行【详解】本题主要考查数据可视化处理。图中的词语显示有大有小,显示较大的是因为这个词出现次数较多,故本题选B选项。新知讲解网络图热力图树图数据可视化新知讲解常用的图表工具数据可视化.WPS表格或Excel等电子表格软件.在互联网上有大量优秀的数据可视化工具,如RAW、Infogram、Tableau等。.按自己需要缟程实现。新知讲解数据可视化易词云 - 词云生成器 https://www.yciyun.com/新知讲解06数据可视化是指将数据分析的结果通过表格、图表、图形等形式显示出来,还可以通过这些形式对分析结果进行一些交互处理。利用人对形状、颜色等特性的感官敏感性,数据可视化能更清晰、有效地帮助人们发现数据间的关系、规律和趋势,传递数据背后的信息。报告撰写课后探究1、如何快速知道李小明同学那次考得最好?2、按总分由高到低将李小明同学的五次成绩重新排列。成果呈现新知讲解报告撰写采集数据——数据的存储与保护数据存在本地内部数据存储1数据放在第三方公共或私有的“云端”存储2数据收集时进行数据精度处理采集数据——数据的存储与保护数据安全保护技术数据保护1数据的隐私保护2拷贝/FTP备 份复制技术镜像技术技术手段提高自身保护意识对数据使用者进行道德和法律上的约束数据共享时进行访问控制数据发布时进行人工干扰数据分析进行数据匿名处理 展开更多...... 收起↑ 资源预览