资源简介 (共13张PPT)第五章 数据处理和可视化表达5.3 数据的分析5.3 数据的分析特征探索关联分析聚类分析数据分类数据分析就是在一大批杂乱无章的数据中;运用数字化工具和技术;探索数据内在的结构和规律,构建数学模型,并进行可视化表达(图表等),为诊断过去、预测未来发挥作用。什么是数据分析?对象:大数据特点:大量、多样、低价值密度、高速工具和技术(数据分析师常用):Excel整理数据、制作图表、爬虫、仪表盘SQL 数据库 数据查询、数据导出Tableau 高级数据图表和数据监控、Python 最火的数据分析工具、功能强大数据分析的四种常用方法特征探索:数据特征、预处理关联分析:数据关联性和相关性、规律和模式聚类分析:自动对数据分类数据分类:训练构建分类器(分类函数和分类模型)特征探索的主要任务是对数据进行预处理,发现和处理缺失值、异样数据,绘制直方图,观察分析数据的分布特征,求最大值、最小值、极差等描述性统计量。如何利用Python实现特征探索?请看视频。什么是特征探索?关联分析就是分析并发现存在于大量数据之间的关联性或相关性,从而描述一个事物中某些属性同时出现的规律和模式。如何利用Python实现关联分析?请看视频。什么是关联分析?一种探索性分析,能从样本数据出发,自动进行分类。K-平均算法是一种经典的自下而上的聚类分析方法。如何利用Python实现聚类分析?请看视频。什么是聚类分析?数据分类是数据分析最基本的方法。数据分类通常的做法是,基于样本数据先训练构建分类函数或分类模型(也称为分类器),该分类器具有将待分类数据项映射到某一特点类别的功能。如何利用Python实现数据分类?请看视频。什么是数据分类?复习回顾5.3 数据的分析特征探索关联分析聚类分析数据分类 展开更多...... 收起↑ 资源预览