资源简介 数据处理与应用大单元——编程处理数据pandas模块巩固练习班级 姓名1.某DataFrame对象df共包含6个数据列、30个数据行,其中第5列为“总分”列,下列语句中能读取df对象中“总分”列所有数据的代码是( D )A.df.[总分] B.df.columns[4] C.df. "总分" D.df.总分2.某DataFrame对象df共包含6个数据列、30个数据行,其中第5列为“总分”列,下列语句中能读取df对象中第3行到第5行(列标题所在行不算)的所有数据的代码是( C )A.df.[2:5] B.df[2:5] C.df[2:6] D.df[2,6]3.将DataFrame对象df第3行“品牌”列的值修改为“OPPO”,程序代码是( A )A.df.at[2,"品牌"]="OPPO" B.df.at[3,品牌]="OPPO"C.df.at[3,"品牌"]="OPPO" D.df.品牌="OPPO"4.某DataFrame对象df,包含“准考证号”、“姓名”、“学校”、“语文”、“数学”等数据列,下列语句中,可以以学校为单位,统计各校学生“数学”成绩平均值的代码是( A )A.df.groupby("学校").数学.mean()B.df.groupby("数学").学校.mean()C.df.groupby("数学").mean()D.df.groupby("学校")[数学].mean()5. excel文件"xscj1.csv"中数据包含"xm","xh","yw","sx"等字段,有若干个数据行,下列程序段执行后,对象 df_data中的数据将( A )import pandas as pddf_data=pd.read_csv("xscj1.csv")df_data.drop("yw",axis=1)df_data.drop(0)df_data.sort_values("sx",inplace=True)A.按"sx"升序排序 B.不再包含"yw"数据列C.删除了第一行记录 D增加了一个数据行6.用 Python创建了一个DataFrame对象df1:import pandas as pddata=[[88,89,96],[95,93,92],[90,87,95]]df1=pd.DataFrame(data,index=["小明", "小红","小兰"],columns=["语文","数学","英语"])下列操作及描述不正确的是( C )A.print(df1["英语"])输出英语列的数据B.print(df1.数学)输出数学列的数据C.print(df1.sort_values("语文",axis=1))输出语文列数据升序排序D.print(df1[df1.语文<90])输出的是小明同学的成绩7.某校高二年级技术考试的数据保存在文件“cj.xlsx”中(如图所示)。用python对其进行处理的代码如下:import pandas as pddf=pd.read_excel("cj.xlsx")df.append({"考号":"0425","学号":"31","姓名":"伊默","班级":"214","信息":44},ignore_index=True)df.drop(0,axis=0)del df["学号"]g=df.groupby("班级",as_index=False).mean()sv=g.sort_values("信息",ascending=True)print(sv.head(3)["信息"])执行该代码,下列说法正确的是( C )A.df对象新增了一条关于“伊默”的记录B.df对象删除了一条关于“倪家颀”的记录C.df对象减少了“学号”列数据D.输出“信息”平均分最高的三个班级8.有如下程序代码:import pandas as pddf1=pd.DataFrame([10],columns=["A"])df2=pd.DataFrame([20],columns=["A"])df3=pd.DataFrame(data=[30,40],columns=["B"])df1.append(df2)df=df1.append(df3,ignore_index=True)print(df)执行程序后,输出的结果为( A )9.有如下程序代码:import pandas as pddf1=pd.DataFrame([10],columns=['A'])df2=pd.DataFrame([20],columns=['A'])df3=pd.DataFrame(data=[30,40],columns=['B'])df1=df1.append(df2)df=df1.append(df3,ignore_index=True)print(df)执行程序后,输出的结果为( D )10.有如下程序代码:import pandas as pddata={'姓名':[ '李商隐','欧阳修','李白', '杜甫'],'借阅次数': [ 32,16,30,26]}df1=pd.DataFrame (data, columns=['姓名','借阅次数'])c = 0for i in range (len(df1 ['姓名'])):if df1.at[i,'姓名'][0]== '李':c+ = df1.at[i,'借阅次数']print(c)该程序运行后,输出的内容为( D )A.46 B. 48 C.58 D.6211.小李收集了某市各噶种7选3选课数据存储在“各学校7选3选课情况.xlsx”中,其数据格式如图所示,学科列下的“1”表示相应行的学生选了该学科,“0”表示未选。小李编写了如下程序,实现输出选考技术人数最多的3个学校的功能。import pandas as pddf=pd.read_excel("各学校7选3选课情况.xlsx")s=df.groupby("学校").技术. ①df=pd.DataFrame({"学校":s.index,"选技术人数":s.values})df.sort_values('选技术人数', ② ,inplace=True)print(df.③ )划线处的代码应填( D )A.①count() ②ascending=False ③tail(3)B.①sum() ②ascending=True ③head(3)C.①count() ②ascending=True ③tail(3)D.①sum() ②ascending=False ③head(3)12.App 活跃人数存储在″app.xlsx″文件中,如下图所示,现要编程进行统计结果,请回答下列问题:若要把″app.xlsx″第 1 张工作表中的信息导入到 book1 对象中,并进行统计,实现这个功能的 python代码如下,将程序划线处填入合适的代码。import pandas as pd(1)book1=__ pd.read_excel("app.xlsx")__ #读取 app.xlsx 文件数据,并存储在 book1 对象中(2)book1_sum=___book1.10月人数.sum()__ #计算 10月人数之和(3)book1_aver=_book1["11月人数"].mean() #计算 11月人数平均值(4)book1_g=__ book1.groupby(by="应用领域")___ #按应用领域分组统计(5)book1_sort=__book1.sort_values("11月人数",ascending=False)___ #按 11月人数值,降序排序print(″10月人数之和:″,book1_sum)print(″11月人数平均值:″,book1_aver)13.小李利用他所学习的知识帮助老师整理学习成绩单,如图所示,部分界面如图所示:(1)为统计每个学生的技术成绩排名,选中 F2 单元格输入公式,然后利用自动填充完成 F2:F392 的数据计算,发现结果有误,请修改 F2 单元格的计算公式 =RANK(E2,E$2:E$392) / =RANK(E2, $E$2: $E$392)(提示:RANK 函数用于计算某单元格中数据在某区域内的排名,如=RANK(G2,G2:G100),计算 G2 单元格中数据在 G2:G100 的排名)(2)根据”chengji.xlsx” 中的数据,利用python计算出如图 b 的结果,并建立如图 c 所示的图表。代码如下,请将空白处补充完整图 b 图 cimport pandas as pdimport matplotlib.pyplot as pltdf=pd.read_excel("chengji.xlsx")g=① df.groupby(_"班级",as_index=False) _ / df.groupby(by="班级",as_index=False)___print(round(g.mean(),1))a= g.mean().班级②b= g.mean().技术总分____plt.title("Average Score")plt.plot (a,b)plt.show()数据处理与应用大单元——编程处理数据pandas模块巩固练习班级 姓名1.某DataFrame对象df共包含6个数据列、30个数据行,其中第5列为“总分”列,下列语句中能读取df对象中“总分”列所有数据的代码是( )A.df.[总分] B.df.columns[4] C.df. "总分" D.df.总分2.某DataFrame对象df共包含6个数据列、30个数据行,其中第5列为“总分”列,下列语句中能读取df对象中第3行到第5行(列标题所在行不算)的所有数据的代码是( )A.df.[2:5] B.df[2:5] C.df[2:6] D.df[2,6]3.将DataFrame对象df第3行“品牌”列的值修改为“OPPO”,程序代码是( )A.df.at[2,"品牌"]="OPPO" B.df.at[3,品牌]="OPPO"C.df.at[3,"品牌"]="OPPO" D.df.品牌="OPPO"4.某DataFrame对象df,包含“准考证号”、“姓名”、“学校”、“语文”、“数学”等数据列,下列语句中,可以以学校为单位,统计各校学生“数学”成绩平均值的代码是( )A.df.groupby("学校").数学.mean()B.df.groupby("数学").学校.mean()C.df.groupby("数学").mean()D.df.groupby("学校")[数学].mean()5. excel文件"xscj1.csv"中数据包含"xm","xh","yw","sx"等字段,有若干个数据行,下列程序段执行后,对象 df_data 中的数据将( )import pandas as pddf_data=pd.read_csv("xscj1.csv")df_data.drop("yw",axis=1)df_data.drop(0)df_data.sort_values("sx",inplace=True)A.按"sx"升序排序 B.不再包含"yw"数据列C.删除了第一行记录 D增加了一个数据行6.用 Python创建了一个DataFrame对象df1:import pandas as pddata=[[88,89,96],[95,93,92],[90,87,95]]df1=pd.DataFrame(data,index=["小明", "小红","小兰"],columns=["语文","数学","英语"])下列操作及描述不正确的是( )A.print(df1["英语"])输出英语列的数据B.print(df1.数学)输出数学列的数据C.print(df1.sort_values("语文",axis=1))输出语文列数据升序排序D.print(df1[df1.语文<90])输出的是小明同学的成绩7.某校高二年级技术考试的数据保存在文件“cj.xlsx”中(如图所示)。用python对其进行处理的代码如下:import pandas as pddf=pd.read_excel("cj.xlsx")df.append({"考号":"0425","学号":"31","姓名":"伊默","班级":"214","信息":44},ignore_index=True)df.drop(0,axis=0)del df["学号"]g=df.groupby("班级",as_index=False).mean()sv=g.sort_values("信息",ascending=True)print(sv.head(3)["信息"])执行该代码,下列说法正确的是( )A.df对象新增了一条关于“伊默”的记录B.df对象删除了一条关于“倪家颀”的记录C.df对象减少了“学号”列数据D.输出“信息”平均分最高的三个班级8.有如下程序代码:import pandas as pddf1=pd.DataFrame([10],columns=["A"])df2=pd.DataFrame([20],columns=["A"])df3=pd.DataFrame(data=[30,40],columns=["B"])df1.append(df2)df=df1.append(df3,ignore_index=True)print(df)执行程序后,输出的结果为( )9.有如下程序代码:import pandas as pddf1=pd.DataFrame([10],columns=['A'])df2=pd.DataFrame([20],columns=['A'])df3=pd.DataFrame(data=[30,40],columns=['B'])df1=df1.append(df2)df=df1.append(df3,ignore_index=True)print(df)执行程序后,输出的结果为( )10.有如下程序代码:import pandas as pddata={'姓名':[ '李商隐','欧阳修','李白','杜甫'],'借阅次数': [ 32,16,30,26]}df1=pd.DataFrame (data, columns=['姓名','借阅次数'])c = 0for i in range (len(df1 ['姓名'])):if df1.at[i,'姓名'][0]=='李':c+= df1.at[i,'借阅次数']print(c)该程序运行后,输出的内容为( )A、46 B、48 C、58 D、6211.小李收集了某市各噶种7选3选课数据存储在“各学校7选3选课情况.xlsx”中,其数据格式如图所示,学科列下的“1”表示相应行的学生选了该学科,“0”表示未选。小李编写了如下程序,实现输出选考技术人数最多的3个学校的功能。import pandas as pddf=pd.read_excel("各学校7选3选课情况.xlsx")s=df.groupby("学校").技术. ①df=pd.DataFrame({"学校":s.index,"选技术人数":s.values})df.sort_values('选技术人数', ② ,inplace=True)print(df.③ )划线处的代码应填( )A.①count() ②ascending=False ③tail(3)B.①sum() ②ascending=True ③head(3)C.①count() ②ascending=True ③tail(3)D.①sum() ②ascending=False ③head(3)12.App 活跃人数存储在″app.xlsx″文件中,如下图所示,现要编程进行统计结果,请回答下列问题:若要把″app.xlsx″第 1 张工作表中的信息导入到 book1 对象中,并进行统计,实现这个功能的 python代码如下,将程序划线处填入合适的代码。import pandas as pd(1)book1=_______________ #读取 app.xlsx 文件数据,并存储在 book1 对象中(2)book1_sum=___________ #计算 10 月人数之和(3)book1_aver=___________ #计算 11 月人数平均值(4)book1_g=________________ #按应用领域分组统计(5)book1_sort=___________ __ #按 11 月人数值,降序排序print(″10 月人数之和:″,book1_sum)print(″11 月人数平均值:″,book1_aver)13.小李利用他所学习的知识帮助老师整理学习成绩单,如图所示,部分界面如图所示:(1)为统计每个学生的技术成绩排名,选中 F2 单元格输入公式,然后利用自动填充完成 F2:F392 的数据计算,发现结果有误,请修改 F2 单元格的计算公式(提示:RANK 函数用于计算某单元格中数据在某区域内的排名,如=RANK(G2,G2:G100),计算 G2 单元格中数据在 G2:G100 的排名)(2)根据”chengji.xlsx” 中的数据,利用python计算出如图 b 的结果,并建立如图 c 所示的图表。代码如下,请将空白处补充完整图 b 图 cimport pandas as pdimport matplotlib.pyplot as pltdf=pd.read_excel("chengji.xlsx")g=①_________ _print(round(g.mean(),1))a= g.mean().班级②_____ ___ __plt.title("Average Score")plt.plot (a,b)plt.show() 展开更多...... 收起↑ 资源列表 浙教版新教材(2019)《数据与计算》选考一轮复习 学考复习配套练习——编程处理数据pandas模块巩固练习.docx 浙教版新教材(2019)《数据与计算》选考一轮复习 学考复习配套练习——编程处理数据pandas模块巩固练习答案.docx