5.3.1数据的分析 (特征探索)课件(共23张PPT)-高中信息技术粤教版(2019)必修1

资源下载
  1. 二一教育资源

5.3.1数据的分析 (特征探索)课件(共23张PPT)-高中信息技术粤教版(2019)必修1

资源简介

(共23张PPT)
数据的分析(特征探索)
知识回顾
数据采集
数据存储
数据分析
可视化表达
导入
某零食运营企业,需要调整运营策略。他们获取了近一段时间某零食购物网站的运营数据。
通过现有的数据,应该如何轻松并且准确得来探索他的特征,分析出对自己有价值的信息呢?
导入-数据展示
数据分析的概念
数据分析是通过运用数字化工具和技术,对大批量杂乱无章的数据进行探索和分析,从中发现数据内在的结构和规律,并构建数学模型,进行可视化表达。
了解事物的现状
剖析事物的发展趋势
通过验证,将模型转化为知识,以便更好地了解事物的现状、剖析事物的发展趋势,并预测事物的未来走向。
预测事物的未来走向
探究新知
1.特征探索
2.关联分析
3.聚类分析
4.建立模型
5.模型评价
1.特征探索
2.关联分析
3.聚类分析
4.建立模型
数据分析常用方法
探究新知
数据预处理
完成数据清洗
数据特征探索
求最大值、最小值、极差绘制散点图,直方图
极差:
极差是最大值和最小值之间的差异或范围;
量化了数据的变异程度;
提供数据在整个取值范围内的大小差别。
绘制散点图,直方图
使用最大值、最小值、极差等描述性统计量。
观察分析数据的分布特征
1
2
特征探索-主要任务
数据清洗:处理缺失值、异常值、重复值
求最大值、最小值、极差等描述性统计量
绘制散点图,直方图
观察分析数据的分布特征
1
2
3
4
数据库的建立
在进行数据分析前,通常需要建立一个数据库。通过建立数据库,存储大量数据,方便后续的数据分析和处理工作。
导入文件taob.sql中的数据,创建数据库csdn和数据表taob。
探究活动
逐个完成“程序5-5-1 数据预处理(教材范例).py”
1.数据清洗,发现缺失值,并打印缺失值的个数
2.异常处理,利用画散点图,发现异常值部分
3.设置筛选条件,重新绘制散点图
4.求最大值、最小值、极差等描述性统计量
5.绘制价格直方图
6.绘制评论数直方图
结论
从直方图中可以看出,哪些价格区间的商品评论数较低,可能表现不佳,用户体验和满意度较低,可以进行提高改进?
1.价格更高的商品,大家的评论的积极性会更强。
结论
从直方图中可以看出,哪些价格区间的商品评论数较低,可能表现不佳,用户体验和满意度较低,可以进行提高改进?2.消费者认为价格20—40元的商品价值较低,从而不愿意购买或分享购买体验。
从直方图中可以看出,哪些价格区间的商品评论数较低,可能表现不佳,用户体验和满意度较低,可以进行提高改进?3.同时价格20—40元的商品可能意味着有潜在的商机和市场空白。
结论
课堂总结
1.对于未知的数据,我们先进行特征探索,以便对数据有初步的认识。
2.数据分析下的特征探索的主要任务。
数据清洗:处理缺失值、异常值、重复值
求最大值、最小值、极差等描述性统计量
绘制散点图,直方图
观察分析数据的分布特征

展开更多......

收起↑

资源预览