资源简介 (共13张PPT)3.3.1 数据分析人民教育出版社 中国地图出版社回顾 数据处理一般过程数据采集数据分析数据呈现数据整理一、数据分析的作用采集了所需要的数据,并对数据进行了组织和整理后,为了获得有价值的信息,还需要对数据做进一步的分析。了解事物现状剖析事物发展历程预测事物未来走向二、数据分析的基本方法描述性数据分析:侧重于对数据的各种特征进行分析,对变量之间的关系进行估计和描述;探索性数据分析:探索性数据分析主要用于在数据之中发现新的特征;验证性数据分析:验证性数据分析侧重于验证已有假设的真伪。从统计应用上讲,数据分析可以分为:常用的数据分析方法有对比分析法、平均分析法和结构分析法等。1.对比分析法也叫比较分析法,是将两个或两个以上的数据进行比较,分析它们的差异,揭示出这些数据所反映的事物规律的方法,是一种常用的分析方法。二、数据分析的基本方法对比分析法通常用于从数量上展示和说明研究对象规模大小、水平高低、速度快慢及各种关系是否协调等。二、数据分析的基本方法2.平均分析法是运用计算平均数的方法来反映总体在一定时间、 地点等条件下某一数量特征的一般水平。平均指标中最常用的是算术平均数,如平均身高、平均工资和平均降水量等。平均分析法多用于比较同类现象在不同地区、不同行业、不同类型单位等之间的差异程度,分析现象之间的依存关系,进行数量上的推算;也可以对某一现象在不同时间的水平进行比较,以说明现象的发展规律及趋势。3. 结构分析法也称构成分析法,是将各个部分与总体进行对比,是分析事物内部的结构和部分与整体之间关系的方法。结构分析法的基本表现形式就是计算结构指标。二、数据分析的基本方法结构指标即各个部分相对于总体所占的百分比,因此总体中各结构指标的总和等于100%。三、体验数据分析1、用电子表格软件进行数据分析(普及)如:Excel或wps表格等软件2、用在线数据分析平台进行数据分析如:国家数据网(https://data.stats.)、好分数等网站3、用编程工具进行数据分析(课本例题)如:Python、VB、C等编程工具三、体验数据分析3、用Python进行数据分析(课本例题)使用第三方库pandas例题:求学生各科成绩总分,用python编程实现。三、体验数据分析3、用Python进行数据分析(课本例题)例题:求学生各科成绩总分,用python编程实现。import pandas as pd #导入pandas并设置pd别名df=pd.read_csv(“cj.csv”,encoding=“gbk”,header=0) #读取cj文件df[“总分”]=df.sum(axis=1) #增加“总分”列,并按一行求和print(df[[“姓名”,“总分”]]) #显示姓名与总分列df.to_csv(“cj_sum.csv”,encoding=“gbk”,float_format=“%.3f”) #保存为新文件增加列Sum求和,axis=1是按行统计学生练习四、pandas库中dataframe的方法DataFrame具有一组常用的汇总和统计方法,包括计数、求和、求平均值等相关计算。1.非空数据个数格式: pandas.DataFrame.count()用于返回DataFrame的个数。默认按列统计非空数据的个数,axis=1表示按行统计非空数据的个数。如: pandas.DataFrame.count(axis=1)2. 数据求和格式: pandas.DataFrame.sum()用于返回所有列的和。axis=1 表示对各行的数据计算和,如:pandas.DataFrame.sum(axis=1 ) 。3. 数据平均值格式: pandas.DataFrame.mean()用于返回所有列的平均值。axis=1 表示对各行的数据计算平均值。如: pandas.DataFrame.mean(axis=1 )import pandas as pdv = [[38.8, 38.2], [27.2, 25.7]]a = ["北京", "天津”]y = [ "2016","2015"]df = pd. DataFrame (v, a, y)print ("DataFrame中的数据为:","\n", df, "\n")df1 = df. sum()print("按列求和结果为: ","\n", df1)四、pandas库中dataframe的方法案例分析:默认按列求和按行求和df1=df.sum(axis=1)课堂总结 展开更多...... 收起↑ 资源预览