资源简介 (共22张PPT)第五章数据处理和可视化表达信息技术必修1《数据与计算》5.3数据的采集上机课要求上课前课代表同学提前与老师联系,确定上课事宜。上课不能携带水、零食等进入机房。进入机房按照编排机号入座,不得随意串座。学习目标1、能够体验多种数据分析技术;2、能够掌握选用恰当的工具处理数据;3、能够掌握总结和归纳数据分析的方法和步骤;思考问题生活中大数据时代的我们,前面我们学习了数据的采集与保护,那么我们获取的数据可以直接拿过来用吗?任务一:体验特征探索特征探索的定义以小组为单位,通过查找资料、学习和交流,填写下表。任务一:体验特征探索特征探索的定义以小组为单位,通过查找资料、学习和交流,填写下表。对数据进行预处理,发现和处理缺失值,异常数据、绘制直方图,观察数据分布的特征,求最大值、最小值、极差等描述性统计量。任务一:体验特征探索小程序体验:数据预处理.py修改“数据预处理.py”代码,对采集到的商品销售数据进行预处理,包括发现和处理缺失值、处理异常数据、求最大值、最小值、极差、组距、绘制直方图,观察数据的分布特征,以小组为单位,通过学习、交流,探究(课本112-113页内容)任务一:体验特征探索#异常值处理、画散点图(横轴:价格,纵轴:评论数)找到异常值data2=data.Tprice=data2.values[2]comt=data2.values[3]plt.xlabel('price')#显示X坐标标签plt.ylabel('paynum')#显示Y坐标标签pyl.plot(price,comt,"o")pyl.show()任务一:体验特征探索#求最值pricemax=da2[2].max()pricemin=da2[2].min()paynummax=da2[3].max()paynummin=da2[3].min()#极差pricerg=pricemax-priceminpaynumrg=paynummax-paynummin任务一:体验特征探索#极差pricerg=pricemax-priceminpaynumrg=paynummax-paynummin#组距pricedst=pricerg/13paynumdst=paynumrg/13任务一:体验特征探索#绘制价格直方图#npy.arrange(最小,最大,组距)pricesty=npy.arange(pricemin,pricemax+1,pricedst)plt.xlabel('price')#显示X坐标标签plt.ylabel('number')#显示Y坐标标签pyl.hist(da2[2],pricesty)pyl.show()任务二:体验关联分析要求:以小组为单位,通过网上查找资料、学习和交流。关联分析的定义分析发现存在于大量数据之间的关联性和相关性,从而描述一个事物的共同规律和模式。任务二:体验关联分析要求:以小组为单位,通过网上查找资料、学习和交流。小程序体验:运行关联分析.py”体验关联分析。修改关联分析.py”代码,对采集到的店铺销售订单数据进行关联分析,寻找商品之间的关联性,观察关联分析结果,以小组为单位,通过学习、交流,探究和实践,任务三:体验聚类分析以小组为单位,通过学习和交流,填写下表。importnumpyasnpimportmatplotlib.pyplotaspltfrompylabimportx=np.arange(-5.0,5.0,0.02)y=np.sin(x)plt.plot(x,y)plt.show()任务三:体验聚类分析以小组为单位,通过学习和交流,填写下表。聚类分析的定义是一种探索性的分析。不必事先给出一个分类标准,而是让其自动分类。任务三:体验聚类分析体验小程序:修改聚类分析.py”代码,对采集到的商品销售数据“data_sample.csv”进行聚类分析,观察数据分析结果,以小组为单位,通过学习、交流,探究和实践。fromsklearn.clusterimportKMeans#导入商品样本数据fname="data_sample.csv"dataf=pda.read_csv(fname,encoding="gbk")x=dataf.as_matrix()#聚类分析kms=KMeans(n_clusters=3)y=kms.fit_predict(x)print(y)任务四:数据分类以小组为单位,通过查找资料、学习和交流,填写下表。数据分类是数据分析中最基本的方法。先基于样本数据构建分类器。然后进行预测。任务四:数据分类以小组为单位,通过查找资料、学习和交流。运行数据分类.py”,体验数据分类。通过修改或优化数据分类py”代码,对特征值A为128.8,特征值B为158,特征值C为4.7的商品进行分类,观察该商品分类结果,以小组为单位,通过学习、交流,探究和实践,课堂练习1、数据分析最基本的方法()A.特征探索B.数据分类C.聚类分析D.关联分析B课堂练习2、下列有关数据分析说法错误的是()A.特征探索的主要任务是发现大量数据间的关联性。B.关联分析的主要任务是发现大量数据间的关联性c.聚类分析无需事先给出分类标准D.数据分类是数据分析处理中最基本的方法。A课堂总结下课!完成测试题,下节课前由小组长批阅,课代表汇总。作业布置5.3数据的分析1、选择题(每题1分)1、数据分析的基本方法包括()A特征探索、关联分析、聚类分析、数据分类B特征探索、聚类分析、数据分类C.特征探索、数据分类D.关联分析、聚类分析、数据分类2、数据特征探索的主要任务是()A.对数据进行预处理,发现和处理缺失值,异常数据、绘制直方图,观察数据分布的特征,求最大值、最小值、极差等描述性统计量。B.分析发现存在于大量数据之间的关联性和相关性,从而描述一个事物的共同规律和模式。C.是一种探索性的分析。不必事先给出一个分类标准,而是让其自动分类。D.是数据分析中最基本的方法。先基于样本数据构建分类器,然后进行预测。3、数据聚类分析的主要任务是()A.对数据进行预处理,发现和处理缺失值,异常数据、绘制直方图,观察数据分布的特征,求最大值、最小值、极差等描述性统计量。B.分析发现存在于大量数据之间的关联性和相关性,从而描述一个事物的共同规律和模式。C.是一种探索性的分析。不必事先给出一个分类标准,而是让其自动分类。D.是数据分析中最基本的方法。先基于样本数据构建分类器,然后进行预测。4、下列有关数据关联分析的说法正确的是()A.对数据进行预处理,发现和处理缺失值,异常数据、绘制直方图,观察数据分布的特征,求最大值、最小值、极差等描述性统计量。B.分析发现存在于大量数据之间的关联性和相关性,从而描述一个事物的共同规律和模式。C.是一种探索性的分析。不必事先给出一个分类标准,而是让其自动分类。D.是数据分析中最基本的方法。先基于样本数据构建分类器,然后进行预测。5、数据数据分类说法正确的是()A.对数据进行预处理,发现和处理缺失值,异常数据、绘制直方图,观察数据分布的特征,求最大值、最小值、极差等描述性统计量。B.分析发现存在于大量数据之间的关联性和相关性,从而描述一个事物的共同规律和模式。C.是一种探索性的分析。不必事先给出一个分类标准,而是让其自动分类。D.是数据分析中最基本的方法。先基于样本数据构建分类器,然后进行预测。6、贝叶斯分类技术属于()A特征探索B聚类分析C.数据分类D.关联分析2、论述题1、总结归纳数据分析的常用方法。2、结合现实生活中的体验,谈一下数据分析的意义。试题答案一、选择题123456AACBDD二、论述题1、A.特征探索:对数据进行预处理,发现和处理缺失值,异常数据、绘制直方图,观察数据分布的特征,求最大值、最小值、极差等描述性统计量。B.关联分析:分析发现存在于大量数据之间的关联性和相关性,从而描述一个事物的共同规律和模式。C.聚类分析:是一种探索性的分析。不必事先给出一个分类标准,而是让其自动分类。D.数据分类:是数据分析中最基本的方法。先基于样本数据构建分类器,然后进行预测。2、无标准答案第五章数据处理与可视化表达5.3数据的分析课题数据的分析课时1课时教学目标能够体验多种数据分析技术;能够掌握选用恰当的工具处理数据;能够掌握总结和归纳数据分析的方法和步骤;重点与难点重点:了解数据预处理及分析;体验多种数据分析技术。难点:体验多种数据分析技术。辅助手段多媒体,机房广播演示系统教法学法讲授法、任务驱动法,小组合作法,自主探究法。课前准备课代表同学负责班级分组(4-6人一组)。教学设计创设情境激趣导入首先通过多媒体呈现问题:同学们,通过前面两节课的学习,我们了解了数据,知道了数据的采集与保护,那么我们获取的数据可以直接拿过来用吗?激发大家的学习兴趣,进而引入本节课题-------数据的分析。任务驱动与知识讲授任务驱动与知识讲授自主探究任务一:体验特征探索以小组为单位,阅读课本104-106页,通过查找资料、学习和交流,填写下表。特征探索的定义对数据进行预处理,发现和处理缺失值,异常数据、绘制直方图,观察数据分布的特征,求最大值、最小值、极差等描述性统计量。小程序体验:数据预处理.py修改“数据预处理.py”代码,对采集到的商品销售数据进行预处理,包括发现和处理缺失值、处理异常数据、求最大值、最小值、极差、组距、绘制直方图,观察数据的分布特征,以小组为单位,通过学习、交流,探究(课本112-113页内容)#异常值处理、画散点图(横轴:价格,纵轴:评论数)找到异常值data2=data.Tprice=data2.values[2]comt=data2.values[3]plt.xlabel('price')#显示X坐标标签plt.ylabel('paynum')#显示Y坐标标签pyl.plot(price,comt,"o")pyl.show()#求最值pricemax=da2[2].max()pricemin=da2[2].min()paynummax=da2[3].max()paynummin=da2[3].min()#极差pricerg=pricemax-priceminpaynumrg=paynummax-paynummin#组距pricedst=pricerg/13paynumdst=paynumrg/13#绘制价格直方图#npy.arrange(最小,最大,组距)pricesty=npy.arange(pricemin,pricemax+1,pricedst)plt.xlabel('price')#显示X坐标标签plt.ylabel('number')#显示Y坐标标签pyl.hist(da2[2],pricesty)pyl.show()#绘制销量数直方图paynumsty=npy.arange(paynummin,paynummax+1,paynumdst)plt.xlabel('paynum')#显示X坐标标签plt.ylabel('number')#显示Y坐标标签pyl.hist(da2[3],paynumsty)pyl.show()任务二:体验关联分析关联分析的定义分析发现存在于大量数据之间的关联性和相关性,从而描述一个事物的共同规律和模式。小程序体验:运行关联分析.py”体验关联分析。修改关联分析.py”代码,对采集到的店铺销售订单数据进行关联分析,寻找商品之间的关联性,观察关联分析结果,以小组为单位,通过学习、交流,探究和实践,任务三:体验聚类分析以小组为单位,通过学习和交流,填写下表。聚类分析的定义是一种探索性的分析。不必事先给出一个分类标准,而是让其自动分类。体验小程序:修改聚类分析.py”代码,对采集到的商品销售数据“data_sample.csv”进行聚类分析,观察数据分析结果,以小组为单位,通过学习、交流,探究和实践。fromsklearn.clusterimportKMeans#导入商品样本数据fname="data_sample.csv"dataf=pda.read_csv(fname,encoding="gbk")x=dataf.as_matrix()#聚类分析kms=KMeans(n_clusters=3)y=kms.fit_predict(x)print(y)任务四:数据分类数据分类是数据分析中最基本的方法。先基于样本数据构建分类器。然后进行预测。运行数据分类.py”,体验数据分类。通过修改或优化数据分类py”代码,对特征值A为128.8,特征值B为158,特征值C为4.7的商品进行分类,观察该商品分类结果,以小组为单位,通过学习、交流,探究和实践,课堂练习1、数据分析最基本的方法(B)A特征探索B.数据分类C.聚类分析D.关联分析2、下列有关数据分析说法错误的是(A)A.特征探索的主要任务是发现大量数据间的关联性。B.关联分析的主要任务是发现大量数据间的关联性c.聚类分析无需事先给出分类标准D.数据分类是数据分析处理中最基本的方法。课堂总结由学生总结归纳本节课所学知识,教师进行点拨。板书设计5.3数据的分析一、特征探索二、关联分析三、聚类分析四、数据分类课后作业完成测试题,下节课前由小组长批阅,课代表汇总。 展开更多...... 收起↑ 资源列表 5.3数据的分析-粤教版(2019)高中信息技术必修一教案.doc 5.3数据的分析-粤教版(2019)高中信息技术必修一练习.doc 5.3数据的分析.pptx