资源简介 教学设计课程基本信息学科 信息技术 年级 高一 学期 秋季课题 数据教学目标1.能根据实际需求,选择适当的方式采集数据。 2.了解不同数据类型。 3.能区别不同结构化程度的数据教学内容教学重点: 1.数据的采集方式。2.数据的类型和结构化程度。教学难点: 1.根据实际需求,选择适当的方式采集数据。2.能区别不同结构化程度的数据。教学过程导入: 五一假期快到了,小夏想和同伴一起去上海迪士尼游玩。于是他们制定了一个“上海迪士尼旅游攻略”。 数据的价值 情境1:首先,小夏通过“百度地图”,搜索了上海迪士尼的具体定位数据,大家知道地图上的数据是如何进行定位的呢? 地图上数据定位一般是通过卫星定位系统(比如GPS、北斗等)来进行定位的。这些卫星系统会向地面发射精准的信号,通过接收这些信号并对其进行计算,我们就可以确定某个地点的精 确位置,从而在地图上标注出来。 定位数据的价值:有了定位数据,我们可以到达地球的任何一个角落!它从根本上解决了人类在地球上的导航和定位数据,满足了海陆空等不同领域的定位需求。 情境2:小夏想了解五一假期的天气情况,来确定游玩所带的衣物等,于是她打开了“天气”A APP请问“天气”APP上给我们呈现了哪些数据? “天气”APP展现了近一周每小时的天气情况,包括温度、湿度、风级、紫外线强弱、能见度、气压等等多种环境数据,为农业、航空业、医疗卫生、公共生活等众多领域提供服务。 天气数据的价值:在日常生活中,我们的穿衣出行、假期安排、预防疾病等、农作物的种植培育、航班的飞行安排、社会经济的发展等等都与天气数据息息相关。 情境3:因为景区的物价较贵,所以小夏提前在“淘宝”上买了一些迪士尼主题的发箍,后来她每次打开淘宝,都会有和迪士尼有关的商品推荐,比如淘宝先后推荐了星黛露包包、迪士尼摄影师、米奇发箍、迪士尼免排队黄牛,还有一系列和迪士尼有关的猜你喜欢。 那么电商平台是如何根据数据进行智能推荐呢? 电商数据的价值:电商对买家数据进行统计分析,推断出其消费水平、需求和观念等,从而决定了商品选款和广告的精准投放,有利于形成稳定的客户群。 买家信息越精确,智能推荐越准确! 刚刚我们通过三个例子分析了定位数据、天气数据和电商数据,除此之外,日常社会中还会有农业数据、工业数据、医疗数据、交通数据、飞行数据、社交数据、股票数据、高考数据、娱乐数据等等,这些数据犹如“矿石”,蕴藏着无穷价值! 正如马云曾经说过:我们这个时代正在从IT走向DT IT指的是“信息技术”,DT指的是“数据技术”,数据技术将深入影响我们生活的方方面面 问题1:小夏通过某平台预定了迪士尼附近的酒店,那么平台管理员能不能把数据卖给其他平台,来实现数据的价值。请发表你的看法。 数据的获取 情境3:小夏为了拍照好看点,她决定通过运动来控制体重,她立了一个flag:每天通过手机计步达到10000步以上,体重瘦到100斤以下,请问手机计步和体重秤用到的核心硬件分别是什么? 手机计步的核心硬件是加速度传感器,体重秤的核心硬件是力传感器。传感器是获取数据的主要来源,它的工作原理是:它能感受力、光、声、温度等物理量,并能把它们按照一定的规律转换为便于传送和处理的另一个物理量(通常是电压、电流等电学量)那么,请问手机中有哪些传感器?我们通过一个视频来了解一下(观看视频《手机中的传感器》) 问题2:这是小夏第一次去上海,所以她对上海的路况并不熟悉,出门都要靠“百度地图”APP进行实施导航,请问,“百度地图”如何获取实时路况数据的? 如何全面又专业的回答这个问题呢?有同学就去百度检索了这个问题。 这就是我们获取数据的另一种来源,即从互联网上获取数据 人们通过一些网络爬虫类软件高效、快速地获取某个网站的数据,常见的爬虫类软件有: “八爪鱼”、“火车头”、“集搜客”等采集器 下面我们试着用“八爪鱼”采集迪士尼客流量的网址数据 第1步,我们将网址复制到采集框里,第2步,采集页面进行设置, 第3步:选择采集模式,我选了本地采集的普通模式 第4步:“八爪鱼”正在采集数据 第5步:将采集停止,导出数据 第6步:去除重复数据 第7步:选择数据的导出方式,我选了Excel 第8步:在Excel中我们就可以查看导出的结果了 一般情况下,爬虫软件收集到的数据会有很多数据问题:比如刚刚出现的重复数据,我们需要去除,常见的数据问题有:缺失数据、重复数据、噪声数据、格式异常和逻辑错误 我们需要针对每种问题做数据处理。小夏从网上找了一个上海迪士尼的游玩攻略的视频,请大家观看视频《上海迪士尼只玩一天的旅游攻略》 请问:视频中呈现了哪些数据类型? 1.1.3 数据的分类 1.数值型数据: 由数字、小数点、正负号等组成用于表示数量,可以直接用算术方法进行运算,是日常生活中经常使用的数据类型 2.文本型数据: 由字符组成,文本中使用的字符来自于字符集常见的字符集有ASCII码字符集、 GB2312汉字编码字符集、Unicode字符集等 3.音频数据: 即数字化之后的声音数据。常见的音频数据格式有WAV、MIDI、MP3、CDA等 4.图形图像数据: 图形是以几何线条、几何符号等形式表示物体轮廓,一般由计算机软件生成,多为矢量图。图像是由像素组成,在计算机中保存的是它的像素数据。常见的图形图像数据的文件格式有AI、JPEG、BMP、PNG等 5.视频数据: 是随时间变化的图像流,是一组连续的图像序列,常见的视频数据文件格式有AVI、MPEG等 6.POI数据: 每个POI数据包括名称、类别、经度和纬度四个方面的信息,蕴含位置信息,在电子地图和位置服务中应用广泛 下面请大家来连一连:请将下列数据与对应的数据类型连线 1.1.4 数据的结构化程度 在描述具体的事物时,单一类型的数据往往不能完整地反映事物的实际情况,需要采用多种类型数据的集合体。数据从结构化程度的角度可分为:结构化数据、非结构化数据 和 半结构化数据。 1.结构化数据 迪士尼各项目的开放时间如下表所示, 类似这种数据被称为结构化数据:也称行数据,是由二维表结构逻辑表达和实现的数据,严格遵循数据格式与长度规范,主要通过关系数据库进行存储和管理 2.非结构化数据: 文本、网页、图像、视频、音频等数据没有严格的逻辑结构,是非结构化数据 3.半结构化数据: 用XML(可扩展标记语言)来表示迪士尼人物 介于结构化数据和非结构化数据之间,具有一定的结构性,但结构变化较大,描述数据的属性可根据实际情况扩充,数量不定且可以重复。常见的格式有:XML和JSON 选一选: 下列关于数据的结构化程度说法说法正确的是 ( ) A. 迪士尼宣传语是非结构化数据 B. Excel中的二维表数据是非结构化数据 C. XML 格式的员工信息是结构化数据 D. 迪士尼夜景照片是结构化数据 课堂小结: 课后作业: 请参考今天介绍的“迪士尼旅游攻略”,设计一个你想去的景点的旅游攻略,可以结合多种类型的数据,越丰富越好备注:教学设计应至少含教学目标、教学内容、教学过程等三个部分,如有其它内容,可自行补充增加。 展开更多...... 收起↑ 资源预览