资源简介 (共23张PPT)数据的分析(特征探索)知识回顾数据采集数据存储数据分析可视化表达导入某零食运营企业,需要调整运营策略。他们获取了近一段时间某零食购物网站的运营数据。通过现有的数据,应该如何轻松并且准确得来探索他的特征,分析出对自己有价值的信息呢?导入-数据展示数据分析的概念数据分析是通过运用数字化工具和技术,对大批量杂乱无章的数据进行探索和分析,从中发现数据内在的结构和规律,并构建数学模型,进行可视化表达。了解事物的现状剖析事物的发展趋势通过验证,将模型转化为知识,以便更好地了解事物的现状、剖析事物的发展趋势,并预测事物的未来走向。预测事物的未来走向探究新知1.特征探索2.关联分析3.聚类分析4.建立模型5.模型评价1.特征探索2.关联分析3.聚类分析4.建立模型数据分析常用方法探究新知数据预处理完成数据清洗数据特征探索求最大值、最小值、极差绘制散点图,直方图极差:极差是最大值和最小值之间的差异或范围;量化了数据的变异程度;提供数据在整个取值范围内的大小差别。绘制散点图,直方图使用最大值、最小值、极差等描述性统计量。观察分析数据的分布特征12特征探索-主要任务数据清洗:处理缺失值、异常值、重复值求最大值、最小值、极差等描述性统计量绘制散点图,直方图观察分析数据的分布特征1234数据库的建立在进行数据分析前,通常需要建立一个数据库。通过建立数据库,存储大量数据,方便后续的数据分析和处理工作。导入文件taob.sql中的数据,创建数据库csdn和数据表taob。探究活动逐个完成“程序5-5-1 数据预处理(教材范例).py”1.数据清洗,发现缺失值,并打印缺失值的个数2.异常处理,利用画散点图,发现异常值部分3.设置筛选条件,重新绘制散点图4.求最大值、最小值、极差等描述性统计量5.绘制价格直方图6.绘制评论数直方图结论从直方图中可以看出,哪些价格区间的商品评论数较低,可能表现不佳,用户体验和满意度较低,可以进行提高改进?1.价格更高的商品,大家的评论的积极性会更强。结论从直方图中可以看出,哪些价格区间的商品评论数较低,可能表现不佳,用户体验和满意度较低,可以进行提高改进?2.消费者认为价格20—40元的商品价值较低,从而不愿意购买或分享购买体验。从直方图中可以看出,哪些价格区间的商品评论数较低,可能表现不佳,用户体验和满意度较低,可以进行提高改进?3.同时价格20—40元的商品可能意味着有潜在的商机和市场空白。结论课堂总结1.对于未知的数据,我们先进行特征探索,以便对数据有初步的认识。2.数据分析下的特征探索的主要任务。数据清洗:处理缺失值、异常值、重复值求最大值、最小值、极差等描述性统计量绘制散点图,直方图观察分析数据的分布特征 展开更多...... 收起↑ 资源预览