资源简介 (共36张PPT)编程处理数据编程处理数据用excel处理数据方便、对专业要求低,但适用于小数据样本,且适用较为单一的功能需求。编程处理数据Numpy模块:是科学运算的基础库,主要提供科学计算中常用的随机数、数组运算等基础模块Scipy模块:基于numpy构建的一个模块,增强了在高等数学、信号处理、图像处理、统计等方面的能力Pandas模块:基于numpy实现,主要用于数据的处理与分析,提供了大量处理数据的函数和方法,能方便操作大型数据集Matplotlib模块:绘图库,快速绘图和设置图标的坐标轴、坐标轴刻度、图例等维度一维结构二维结构二维表1 2 31 2 34 5 67 8 91 4 72 5 83 6 9由对等关系的有序或无序数据构成,采用线性方式组织。利用pandas模块处理数据Pandas 提供了Series和DataFrame两种数据结构,这两种数据结构可完成数据的整理、计算、统计、分析及简单可视化。Series(一维结构):1个索引列+1个数据列.索引值默认是从0起递增的整数。列表,字典等都可以用来创建Series数据结构,与列表不同的是,Series的索引可以指定,类型可以是字符串类型。Dataframe(二维结构):1个索引列+n个数据列. DataFrame是一种类似于关系表的表格型数据结构,DataFrame对象是一个二维表格, 其中每列中的元素类型必须一致,而不同的列可以拥有不同的元素类型。利用pandas模块处理数据Series Dataframe导入模块Import pandas as pd利用pandas模块处理数据Series1.创建1个Series对象语法:s=pd.Series(value,index)参数:value:表示数据,支持数值、列表、字典等;index:表示索引(行标签)Values:存放Series值的一个数组index数据类型利用pandas模块处理数据Series1.创建1个Series对象语法:s=pd.Series(values,index)参数:value:表示数据,支持数值、列表、字典等;index:表示索引(行标签)利用pandas模块处理数据Series2.如何查看Series对象中index、value属性值?利用pandas模块处理数据Series3.如何查看、修改Series对象中的某个值同学们!下课啦!利用pandas模块处理数据Dataframe1.创建1个Dataframe对象-以相等长度的列表组成的字典形式创建利用pandas模块处理数据Dataframe1.创建1个Dataframe对象-指定行索引利用pandas模块处理数据Dataframe1.创建1个Dataframe对象-从excel文件读入二维数据表创建语法:df=pd.read_excel(‘文件名.xlsx')Index:dataframe的行索引Values:存放值的二维数据Columns:存放各列的列标题import pandas as pddf=pd.read_excel('test.xlsx')print(df)利用pandas模块处理数据Dataframe2.查看DataFrame的索引利用pandas模块处理数据Dataframe3.查看DataFrame的列标题利用pandas模块处理数据Dataframe4.查看DataFrame的值利用pandas模块处理数据Dataframe5.将DataFrame的行、列转置利用pandas模块处理数据Dataframe6.查看DataFrame中某一列的数据-通过属性检索列利用pandas模块处理数据Dataframe6.查看DataFrame中某一列的数据-通过字典检索列利用pandas模块处理数据Dataframe6.修改DataFrame中某一列的数据通过字典修改:dDf['姓名']=['a','b','c','d','e','f']print(df)DataFrame常用函数 函数 说明count() 返回非空(NaN)数据项的数量;一般按列求;sum() mean() max() min() 求和、求平均、求最大、求最小;一般按列求;describe() 返回各列的基本描述统计值(计数、平均数、标注差、最大值、最小值及4分位差等)groupby() 按列或行分组统计;一般按列求;head() tail() 返回前n个、后n个数据记录;drop() 按行列删除数据,通过axis=0/1确定行列;append() 在末尾添加1行或多行数据;insert() 在指定位置插入1列;rename() 修改列标签或行索引;sort_values() 排序,通过axis=0/1确定行列;set_value() 根据行标签和列标签设置单个值plot() 绘图课堂练习1.有Python程序段如下:import pandas as pdser = pd.Series([1,3,5,7])print(ser.index)该程序段运行后输出结果为( )A利用pandas模块处理数据Series1.创建1个Series结构类型语法:s=pd.Series(data,index)参数:data:表示数据,支持数值、列表、字典等;index:表示索引(行标签)利用pandas模块处理数据Series利用pandas模块处理数据利用pandas模块处理数据Dataframe2.查看DataFrame的索引-通过属性检索,查看列数据第一步:抽象与建模1. 提炼核心要素并加以确定或假设(1)本问题的已知数据有什么?(2)本问题的求解问题是什么?粽子单价5元顾客的消费金额S元假定顾客购买粽子个数X赠送咸鸭蛋个数N第一步:抽象与建模2. 用数学符号描述解决问题的计算模型5*X X<105*X*0.95 10≤X<205*X*0.9 20≤X<405*X*0.85 X>40顾客消费金额:S=赠送咸鸭蛋个数:N= X 5 第二步:设计算法处理数据的一般过程输入数据处理数据输出处理结果第二步:设计算法1. 使用何种算法控制结构来处理数据?2. 如何细化算法?分支结构第二步:设计算法2. 细化算法输入买粽子的个数X根据粽子的个数X,求出赠送的咸鸭蛋个数N判断X是否大于等于10 ,是转到④,否则计算不打折S,转到⑥判断X是否大于等于20 ,是转到⑤,否则计算九五折计算S,转到⑥判断X是否大于等于40 ,是则八五折计算S,否则九折计算S,转到⑥输出变量N和S的值第三步:描述算法课堂作业闰年(Leap Year)是为了弥补因人为历法规定造成的年度天数与地球实际公转周期的时间差而设立的。补上时间差的年份为闰年。判定公历闰年应遵循的一般规律为:四年一闰,百年不闰,四百年再闰。请设计一个算法判断某一年是否是闰年?课堂作业课堂练习1.有Python程序段如下:import pandas as pdser = pd.Series([1,3,5,7])print(ser.index)该程序段运行后输出结果为( )A 展开更多...... 收起↑ 资源预览