资源简介 (共29张PPT)第四章核心素养测评卷信息技术 必修1 数据与计算一、 选择题(每小题列出的四个选项中只有一个是符合题目要求的)1. 右表为我国2011—2020年GDP统计表。为了直观地显示GDP的变化趋势,可以使用 进行数据可视化。横线上应填( ) 我国2011—2020年GDP统计表年份 GDP(亿元)2011 487940.182012 538579.952013 592963.232014 641280.572015 685992.952016 740060.082017 820754.282018 900309.482019 9908652020 1015986A. 柱形图B. 折线图C. 饼图D. 雷达图B【解析】 本题主要考查数据的可视化表达。柱形图主要体现不同项目数据之间的比较。条形图主要体现不同项目数据之间的比较。折线图主要反映事物随时间变化的情况和发展趋势。饼图表示各部分在总体中所占的百分比。雷达图主要应用于企业经营状况——收益性、生产性、流动性、安全性和成长性的评价。为了直观地显示GDP的变化趋势,可以使用折线图进行数据可视化。2. 下列选项中,属于数据处理的目的的是( )A. 检测和修正数据 B. 整合数据资源C. 统一数据格式 D. 提取有用的信息【解析】 本题主要考查数据处理。数据处理的基本目的是从大量的、可能是杂乱无章的、难以理解的数据中抽取并推导出对于某些特定的人来说是有价值、有意义的数据。D3. 某电商平台通过分析客户的爱好和消费行为及其趋势,为客户提供了更为精准的服务。这属于大数据在 方面的应用。横线上应填( ) A. 智慧城市 B. 医疗健康C. 生活服务 D. 社区管理【解析】 本题主要考查大数据的应用。某电商平台通过分析客户的爱好和消费行为及趋势,为客户提供了更为精准的服务。这属于大数据在生活服务方面的应用。C4. 如图所示为水资源数据词云图,这种呈现数据的形式称为( )A. 虚拟化形式 B. 可视化形式C. 网状化形式 D. 多样化形式【解析】 本题主要考查数据可视化表达。词云图是数据可视化的一种常见形式,适用于文本数据的处理和分析。B5. 学校依据《国家学生体质健康标准》编制调查问卷,利用现有网络调查平台收集数据,并对数据做出分析,得出结论。下列说法中,错.误.的是( )A. 网络调查平台已经提供了分析功能,用户无须再对数据进行分析B. 《国家学生体质健康标准》是经过调查研究、实践检验总结出来的知识C. 通过调查问卷收集的是数据,可以用图表对其进行可视化表达D. 可以借助多种数字化学习工具完成该项目,如网上问卷调查、电子资料、思维导图、搜索引擎等【解析】 本题主要考查数据处理。网络调查平台提供的分析功能可能无法满足用户特定的需求,这时用户需再对数据进行分析,A错误。A6. 近期学校进行了一次技术学考模拟考试,学生的成绩数据保存在文件“jscj.xlsx”中,如图所示为其中部分数据。编写Python程序,统计本次考试各班级的优秀(A等级)人数。import pandas as pd #导入pandas模块import matplotlib.pyplot as plt #导入matplotlib的pyplot子库df=pd.read_excel("jscj.xlsx") #读取文件中的数据plt.bar(g.index,g.等级)plt.show()方框中的代码由下列语句中的部分语句组成:①df=df[df.等级=="A"]②df=df["等级"=="A"]③g=df.groupby("班级", as_index=True).sum()④g=df.groupby("班级", as_index=True).count()要实现上述功能,方框中的代码应为( )A.①④ B.①③ C.②④ D.②③【解析】 本题考查数据的处理与应用。筛选的语法为df[条件],筛选出等级为A的学生,语句为①。按班级分组,班级当作索引,统计各班级的优秀人数,用count( )来表示,A正确。A7. 下列描述的场景与处理方法,使用不.恰.当.的是( )A. 分析前一年的高铁客流数据以优化高铁运营,采用批处理计算B. 某电商平台通过实时分析用户行为实现商品的精准推荐,采用流计算C. 图计算为某平台超大规模社交网络图数据的各类计算提供支撑D. 分析近五年的技术选考试卷和梳理高频考点,采用流计算【解析】 本题主要考查对不同数据的不同处理方法。一般静态数据用批处理计算,流数据用流计算,图数据用图计算等。近五年的技术选考试卷和梳理的高频考点应该属于静态数据,应采用批处理计算。D8. 某大型购物网站收集了用户浏览网站的数据,用于广告个性化实时推荐,下列处理方式中,合理的是( )A. 应当使用统计分析软件进行数据分析B. 应当选用针对流数据的实时计算C. 应当选用针对图结构数据的图计算D. 应当选用针对静态数据的批处理计算【解析】 本题主要考查大数据分析。流数据是一组顺序、大量、快速、连续到达的数据序列,一般情况下,流数据可被视为一个随时间延续而无限增长的动态数据集合。用于广告个性化实时推荐,应当选用针对流数据的实时计算。B9. 下列关于大数据处理的说法,错.误.的是 ( )A. 处理大数据一般采用分治思想B. 数据采集只能收集结构化数据C. 图计算主要针对图数据D. 并行处理能缩短复杂问题的处理时间【解析】 本题主要考查大数据处理。处理大数据一般采用分治思想;大数据采集的是规模巨大的数据,不局限于结构化数据;图计算主要针对图数据;并行处理能缩短复杂问题的处理时间,B错误。B10. 下列论据中,能够支持“大数据无所不能”观点的是( )A. 互联网金融打破了传统的观念和行为B. 大数据存在泡沫C. 大数据具有非常高的成本D. 大数据可能带来个人隐私泄露与信息安全问题【解析】 本题主要考查大数据。互联网金融打破了传统的观念和行为,使得“大数据无所不能”。在“大数据”的浪潮中,基于社交网络大数据的应用,将会为企业带来更多的收益,推动大数据分析在各行各业中的应用和推广,将会为企业和社会带来“大价值”,A正确。A11. 某DataFrame 对象df,包含“商品编码”“销售价格”“销售日期”等数据列。下列语句中,能将df对象中的数据以“商品编码”为关键字进行降序排列的是( )A. df.sort_index(axis=1, ascending=True)B. df.sort_values("商品编码",ascending=False)C. df.sort_values("商品编码",ascending=True,inplace=True)D. df.sort_values("商品编码",ascending=False,inplace=True)【解析】 分析题目,发现解决问题的关键在于将df对象中的数据按“商品编码”从大到小的顺序排列,df对象中的数据采用DataFrame结构组织,因此可以使用sort_values()函数按“商品编码"降序排列df对象中的数据。参数acnding=False为降序,inplace=True排序结果替换df中数据,D正确。D二、 非选择题12. 星空老师想知道中国成语中包含“星空”(包括单个字)的成语有多少,从网络上下载了“成语大全.txt”,部分界面如图1及图2所示,请回答下列问题:图1图2(1)当前文本数据由图1到图2做了__________(填字母)的操作。 A. 数据整理 B. 数据挖掘(2)成语的统计代码如下,请在横线上填入合适的代码:①__________,②____________, ③_____________。 import pandas as pd # 导入pandas模块,并设置别名pdcy=open(" ① ", "r",encoding="utf-8") # 打开文件 cytxt=cy.read().split("\n") # 读取文件内容xm=["星","空","星空"]jg=[]count=0for i in cytxt: for j in range(len(xm))∶ if ② ∶ jg.append(i) count=count+1print("包含星空(包括一个字)共有∶"+ ③ ) print("这些成语为∶",jg)A成语.txtxm[j] in istr(count)【解析】 本题考查文本处理知识。(1)从图1到图2将一些不需要的数据进行整理,称为数据整理。(2)因为数据整理后的文件为“成语.txt”,故①为成语.txt ;判断xm的各个元素在不在成语中,故②为 xm[j] in i ;输出成语的总个数,前面有+号,故③为str(count)。13. 某学院举行运动会,比赛设跳高、100米等项目,每个项目分男子组和女子组。现要进行报名数据处理和比赛成绩分析。请回答下列问题:(1)运动会报名规则如下:对于每个项目的男子组和女子组,每个专业最多各报5人(如软件工程专业在男子跳高项目中最多报5人)。软件工程专业的报名数据保存在DataFrame对象df中,如图1所示。若要编写Python程序来检查该专业男子跳高项目报名是否符合规则,下列方法中,正确的是__________(单选,填字母)。 A. 从df中筛选出性别为“男”的数据dfs,再从dfs中筛选出项目为“跳高”的数据,判断筛选出的数据行是否超过5行B. 对df中数据按性别排序并保存到dfs中,再从dfs中筛选出项目为“跳高”的数据,判断筛选出的数据行是否超过5行C. 从df中筛选出项目为“跳高”的数据dfs,判断dfs中是否有连续5行以上的男生数据A图1(2)如图2所示为运动员比赛成绩的部分数据。根据已有名次计算得,第1名至第8名分别计9分、7分、6分、5分、4分、3分、2分、1分,第8名之后计0分。实现上述功能的部分Python程序如下,请在横线上填入合适的代码:_____________________________________________________。 import pandas as pdimport matplotlib.pyplot as plt#读取如第13题图2所示的数据,保存到DataFrame对象df1中,代码略f = [9, 7, 6, 5, 4, 3, 2, 1]for i in range(0,len(dfl))∶ rank = df1.at[i,"名次"] #通过行、列标签取单个值 score = 0 if rank <= 8: df1.at[i,"得分"] = score图2score = f[rank-1] 或 score =f[int(rank)-1](3)根据上述df1中的得分数据,统计各专业总分,绘制如图3所示的柱形图,实现该功能的部分Python程序如下:df2 = dfl.groupby(" ",as_index=False).sum() #分组求和 #设置绘图参数,代码略plt.bar(x,y) #绘制柱形图①请在横线上填入合适的代码:__________。 ②程序的方框中应填入的正确代码为__________(单选,填字母)。 A. x=df1["专业"]y=df1["总分"]B. x=df2["专业"]y=df2["得分"]C. df1["专业"]="专业"df1["总分"]="总分"D. df2["专业"]="专业"df2["得分"]="得分"图3专业B【解析】 本题考查利用pandas模块进行数据处理,利用处理后的数据绘制柱状图。(1)二次筛选后检查数据,A正确;男生、女生数据没有分开,B错误;男生数据不一定是连续的,C错误。(2)根据名次,从列表f中取出对应的得分,考虑到Python列表下标是从0开始的,此处代码:score = f[rank - 1] 或 score = f[int(rank) - 1]。(3)①按题目要求以及第13题图3,这里要按"专业"进行分组;②依据绘制图形的语句:plt.bar(x,y),方框处代码要对x,y进行赋值操作。根据分组后的数据,正确的赋值语句是B。14. 学校气象站的小江同学收集了本地2024年全年的天气数据,数据按日期顺序存储在“tqsj.xlsx”文件中,部分数据如图1所示。图1为分析全年各月份天气情况,编写Python程序,请回答下列问题:(1)计算2024年每天的温差(最高气温-最低气温),找出最大温差,如有相同温差,输出所有符合要求的日期,输出结果如图2所示。程序代码如下,请在横线上填入相应的代码:①_______________________________________,②_________________________________________________________。 import pandas as pddf=pd.read_excel("tqsj.xlsx")df["温差"]= ① df_wch=df.sort_values("温差",ascending=False,ignore_index=True)max=df_wch.at[0,"温差"]rq=[]for i in df_wch.index: if df_wch.at[i,"温差"]==max: rq.append( ② ) print("最大温差:",max,"℃")print("日期:",rq)图2df["最高气温℃"]-df["最低气温℃"]df_wch.at[i,"日期"] 或df_wch["日期"][i](2)统计各月平均温差并绘制线形图,部分Python程序如下,请在横线上填入相应的代码:③_____________________,④_________________。 avewch =[0]*12mdays =[31,29,31,30,31,30,31,31,30,31,30,31] #2024年每月天数begin=0for m in range(12): total=0 for d in range(begin, ③ ): total+=df.at[d,"温差"] avewch[m]= ④ begin+=mdays[m]x=[i+1 for i in range(12)]y=avewchplt.plot(x,y,label="平均温差")begin+mdays[m]total/mdays[m]【解析】 本题主要考查pandas模块分析数据及数据可视化。(1) ①计算最大温差,温差=最高气温 -最低气温,即d["最高气温℃"]-df["最低气温℃"] 。②查找温差等于最大温差max的数据,并将对应日期添加到列表rq中,df_wch.at[i,"日期"]或df_wch["日期"] [i] 。(2) ③每月数据结束位置与该月天数相关,第m月份起始数据位置为begin,则结束数据对应位置为起始位置加上m月的天数,即为begin+mdays[m]。 ④m月平均温差为总计温差total除以当月天数,确定答案为total/mdays[m]。15. 某超市5个月的流水账单使用CSV文件进行存储,约有65500行数据,部分数据如图1所示。图1小王同学准备使用Python语言的pandas模块处理这些数据,统计出总销量排名前十的商品,并使用如图2所示的柱形图来呈现这些数据。程序代码如下:import pandas as pdimport matplotlib.pyplot as pltplt.rc("font",**{"family":"SimHei"}) #调用中文字体库以在图表内显示中文字符df = pd.read_csv("超市销售数据.csv")df1 = ① #根据商品名称分组,并对每组数据求和 df1 = df1.销售数量 #选取销售数量一列数据df1 = ② #排序,并取销量最高的10个值 x = df1.indexy = df1.values ③ #根据数据源x和y创建柱形图 plt.title("最畅销的十大商品",fontsize=30) #给图表添加标题plt.xticks(rotation=30,fontsize=30)plt.yticks(fontsize=30)plt.xlabel("商品名称",fontsize=30) ④ #给y轴数据添加标签 plt.show()图2请在横线上填入合适的代码:①____________________________________________________________,②_________________________________________,③______________,④____________________________。 【解析】 ①先使用groupby函数根据“商品名称”或“商品货号”进行分组,再使用sum函数对每组数据求和,应填df.groupby('商品名称').sum() 或 df.groupby('商品货号').sum(); ②使用sort_values函数对数据进行降序排列,必须注意此时的df1已经是选中了“销售数量”这一列,其类型不再是DataFrame,而是Series,其值不存在列名。故sort_values函数中不可以写列名,直接为空缺即可,并使用head或tial函数取最大的十个,应填df1.sort_values(ascending=False).head(10),其中ascending参数空缺时默认为升序;③使用bar函数创建柱形图,其括号内填写x轴和y轴的数据源,应填plt.bar(x,y);④观察题中给出的图表,其y轴有标签“数量”二字,故应当使用ylabel参数进行相应设置,应填plt.ylabel('数量',fontsize=30),其中fontsize参数(设置字体大小)填与不填均得分。df.groupby('商品名称').sum() 或 df.groupby('商品货号').sum()df1.sort_values(ascending=False).head(10)plt.bar(x,y)plt.ylabel('数量',fontsize=30)第四章核心素养测评卷一、 选择题(每小题列出的四个选项中只有一个是符合题目要求的)1. 下表为我国2011—2020年GDP统计表。为了直观地显示GDP的变化趋势,可以使用 进行数据可视化。横线上应填( B )我国2011—2020年GDP统计表年份 GDP(亿元)2011 487940.182012 538579.952013 592963.232014 641280.572015 685992.952016 740060.082017 820754.282018 900309.482019 9908652020 1015986A. 柱形图 B. 折线图C. 饼图 D. 雷达图【解析】 本题主要考查数据的可视化表达。柱形图主要体现不同项目数据之间的比较。条形图主要体现不同项目数据之间的比较。折线图主要反映事物随时间变化的情况和发展趋势。饼图表示各部分在总体中所占的百分比。雷达图主要应用于企业经营状况——收益性、生产性、流动性、安全性和成长性的评价。为了直观地显示GDP的变化趋势,可以使用折线图进行数据可视化。2. 下列选项中,属于数据处理的目的的是( D )A. 检测和修正数据B. 整合数据资源C. 统一数据格式D. 提取有用的信息【解析】 本题主要考查数据处理。数据处理的基本目的是从大量的、可能是杂乱无章的、难以理解的数据中抽取并推导出对于某些特定的人来说是有价值、有意义的数据。3. 某电商平台通过分析客户的爱好和消费行为及其趋势,为客户提供了更为精准的服务。这属于大数据在 方面的应用。横线上应填( C )A. 智慧城市B. 医疗健康C. 生活服务D. 社区管理【解析】 本题主要考查大数据的应用。某电商平台通过分析客户的爱好和消费行为及趋势,为客户提供了更为精准的服务。这属于大数据在生活服务方面的应用。4. 如图所示为水资源数据词云图,这种呈现数据的形式称为( B )第4题图A. 虚拟化形式 B. 可视化形式C. 网状化形式 D. 多样化形式【解析】 本题主要考查数据可视化表达。词云图是数据可视化的一种常见形式,适用于文本数据的处理和分析。5. 学校依据《国家学生体质健康标准》编制调查问卷,利用现有网络调查平台收集数据,并对数据做出分析,得出结论。下列说法中,错误的是( A )A. 网络调查平台已经提供了分析功能,用户无须再对数据进行分析B. 《国家学生体质健康标准》是经过调查研究、实践检验总结出来的知识C. 通过调查问卷收集的是数据,可以用图表对其进行可视化表达D. 可以借助多种数字化学习工具完成该项目,如网上问卷调查、电子资料、思维导图、搜索引擎等【解析】 本题主要考查数据处理。网络调查平台提供的分析功能可能无法满足用户特定的需求,这时用户需再对数据进行分析,A错误。6. 近期学校进行了一次技术学考模拟考试,学生的成绩数据保存在文件“jscj.xlsx”中,如图所示为其中部分数据。编写Python程序,统计本次考试各班级的优秀(A等级)人数。第6题图import pandas as pd #导入pandas模块import matplotlib.pyplot as plt #导入matplotlib的pyplot子库df=pd.read_excel("jscj.xlsx") #读取文件中的数据plt.bar(g.index,g.等级)plt.show()方框中的代码由下列语句中的部分语句组成:①df=df[df.等级=="A"]②df=df["等级"=="A"]③g=df.groupby("班级", as_index=True).sum()④g=df.groupby("班级", as_index=True).count()要实现上述功能,方框中的代码应为( A )A. ①④ B. ①③C. ②④ D. ②③【解析】 本题考查数据的处理与应用。筛选的语法为df[条件],筛选出等级为A的学生,语句为①。按班级分组,班级当作索引,统计各班级的优秀人数,用count()来表示,A正确。7. 下列描述的场景与处理方法,使用不恰当的是( D )A. 分析前一年的高铁客流数据以优化高铁运营,采用批处理计算B. 某电商平台通过实时分析用户行为实现商品的精准推荐,采用流计算C. 图计算为某平台超大规模社交网络图数据的各类计算提供支撑D. 分析近五年的技术选考试卷和梳理高频考点,采用流计算【解析】 本题主要考查对不同数据的不同处理方法。一般静态数据用批处理计算,流数据用流计算,图数据用图计算等。近五年的技术选考试卷和梳理的高频考点应该属于静态数据,应采用批处理计算。8. 某大型购物网站收集了用户浏览网站的数据,用于广告个性化实时推荐,下列处理方式中,合理的是( B )A. 应当使用统计分析软件进行数据分析B. 应当选用针对流数据的实时计算C. 应当选用针对图结构数据的图计算D. 应当选用针对静态数据的批处理计算【解析】 本题主要考查大数据分析。流数据是一组顺序、大量、快速、连续到达的数据序列,一般情况下,流数据可被视为一个随时间延续而无限增长的动态数据集合。用于广告个性化实时推荐,应当选用针对流数据的实时计算。9. 下列关于大数据处理的说法,错误的是 ( B )A. 处理大数据一般采用分治思想B. 数据采集只能收集结构化数据C. 图计算主要针对图数据D. 并行处理能缩短复杂问题的处理时间【解析】 本题主要考查大数据处理。处理大数据一般采用分治思想;大数据采集的是规模巨大的数据,不局限于结构化数据;图计算主要针对图数据;并行处理能缩短复杂问题的处理时间,B错误。10. 下列论据中,能够支持“大数据无所不能”观点的是( A )A. 互联网金融打破了传统的观念和行为B. 大数据存在泡沫C. 大数据具有非常高的成本D. 大数据可能带来个人隐私泄露与信息安全问题【解析】 本题主要考查大数据。互联网金融打破了传统的观念和行为,使得“大数据无所不能”。在“大数据”的浪潮中,基于社交网络大数据的应用,将会为企业带来更多的收益,推动大数据分析在各行各业中的应用和推广,将会为企业和社会带来“大价值”,A正确。11. 某DataFrame 对象df,包含“商品编码”“销售价格”“销售日期”等数据列。下列语句中,能将df对象中的数据以“商品编码”为关键字进行降序排列的是( D )A. df.sort_index(axis=1,ascending=True)B. df.sort_values("商品编码",ascending=False)C. df.sort_values("商品编码",ascending=True,inplace=True)D. df.sort_values("商品编码",ascending=False,inplace=True)【解析】 分析题目,发现解决问题的关键在于将df对象中的数据按“商品编码”从大到小的顺序排列,df对象中的数据采用DataFrame结构组织,因此可以使用sort_values()函数按“商品编码"降序排列df对象中的数据。参数acnding=False为降序,inplace=True排序结果替换df中数据,D正确。[答题区]序号 1 2 3 4 5 6 7 8 9 10 11答案 B D C B A A D B B A D二、 非选择题12. 星空老师想知道中国成语中包含“星空”(包括单个字)的成语有多少,从网络上下载了“成语大全.txt”,部分界面如图1及图2所示,请回答下列问题:第12题图1第12题图2(1)当前文本数据由图1到图2做了 A (填字母)的操作。A. 数据整理B. 数据挖掘(2)成语的统计代码如下,请在横线上填入合适的代码:① 成语.txt ,② xm[j] in i ,③ str(count) 。import pandas as pd # 导入pandas模块,并设置别名pdcy=open(" ① ", "r",encoding="utf-8") # 打开文件cytxt=cy.read().split("\n") # 读取文件内容xm=["星","空","星空"]jg=[]count=0for i in cytxt: for j in range(len(xm))∶ if ② ∶ jg.append(i) count=count+1print("包含星空(包括一个字)共有∶"+ ③ )print("这些成语为∶",jg)【解析】 本题考查文本处理知识。(1)从图1到图2将一些不需要的数据进行整理,称为数据整理。(2)因为数据整理后的文件为“成语.txt”,故①为成语.txt ;判断xm的各个元素在不在成语中,故②为 xm[j] in i ;输出成语的总个数,前面有+号,故③为str(count)。13. 某学院举行运动会,比赛设跳高、100米等项目,每个项目分男子组和女子组。现要进行报名数据处理和比赛成绩分析。请回答下列问题:第13题图1第13题图2(1)运动会报名规则如下:对于每个项目的男子组和女子组,每个专业最多各报5人(如软件工程专业在男子跳高项目中最多报5人)。软件工程专业的报名数据保存在DataFrame对象df中,如图1所示。若要编写Python程序来检查该专业男子跳高项目报名是否符合规则,下列方法中,正确的是 A (单选,填字母)。A. 从df中筛选出性别为“男”的数据dfs,再从dfs中筛选出项目为“跳高”的数据,判断筛选出的数据行是否超过5行B. 对df中数据按性别排序并保存到dfs中,再从dfs中筛选出项目为“跳高”的数据,判断筛选出的数据行是否超过5行C. 从df中筛选出项目为“跳高”的数据dfs,判断dfs中是否有连续5行以上的男生数据(2)如图2所示为运动员比赛成绩的部分数据。根据已有名次计算得,第1名至第8名分别计9分、7分、6分、5分、4分、3分、2分、1分,第8名之后计0分。实现上述功能的部分Python程序如下,请在横线上填入合适的代码: score = f[rank-1] 或 score = f[int(rank)-1] 。import pandas as pdimport matplotlib.pyplot as plt#读取如第13题图2所示的数据,保存到DataFrame对象df1中,代码略f = [9, 7, 6, 5, 4, 3, 2, 1]for i in range(0,len(dfl))∶ rank = df1.at[i,"名次"] #通过行、列标签取单个值 score = 0 if rank <= 8: df1.at[i,"得分"] = score(3)根据上述df1中的得分数据,统计各专业总分,绘制如图3所示的柱形图,实现该功能的部分Python程序如下:第13题图3df2 = dfl.groupby(" ",as_index=False).sum() #分组求和#设置绘图参数,代码略plt.bar(x,y) #绘制柱形图①请在横线上填入合适的代码: 专业 。②程序的方框中应填入的正确代码为 B (单选,填字母)。A. x=df1["专业"]y=df1["总分"]B. x=df2["专业"]y=df2["得分"]C. df1["专业"]="专业"df1["总分"]="总分"D. df2["专业"]="专业"df2["得分"]="得分"【解析】 本题考查利用pandas模块进行数据处理,利用处理后的数据绘制柱状图。(1)二次筛选后检查数据,A正确;男生、女生数据没有分开,B错误;男生数据不一定是连续的,C错误。(2)根据名次,从列表f中取出对应的得分,考虑到Python列表下标是从0开始的,此处代码:score = f[rank - 1] 或 score = f[int(rank) - 1]。(3)①按题目要求以及第13题图3,这里要按"专业"进行分组;②依据绘制图形的语句:plt.bar(x,y),方框处代码要对x,y进行赋值操作。根据分组后的数据,正确的赋值语句是B。14. 学校气象站的小江同学收集了本地2024年全年的天气数据,数据按日期顺序存储在“tqsj.xlsx”文件中,部分数据如图1所示。第14题图1第14题图2为分析全年各月份天气情况,编写Python程序,请回答下列问题:(1)计算2024年每天的温差(最高气温-最低气温),找出最大温差,如有相同温差,输出所有符合要求的日期,输出结果如图2所示。程序代码如下,请在横线上填入相应的代码:① df["最高气温℃"]-df["最低气温℃"] ,② df_wch.at[i,"日期"] 或df_wch["日期"][i] 。import pandas as pddf=pd.read_excel("tqsj.xlsx")df["温差"]= ① df_wch=df.sort_values("温差",ascending=False,ignore_index=True)max=df_wch.at[0,"温差"]rq=[]for i in df_wch.index: if df_wch.at[i,"温差"]==max: rq.append( ② )print("最大温差:",max,"℃")print("日期:",rq)(2)统计各月平均温差并绘制线形图,部分Python程序如下,请在横线上填入相应的代码:③ begin+mdays[m] ,④ total/mdays[m] 。avewch =[0]*12mdays =[31,29,31,30,31,30,31,31,30,31,30,31] #2024年每月天数begin=0for m in range(12): total=0 for d in range(begin, ③ ): total+=df.at[d,"温差"] avewch[m]= ④ begin+=mdays[m]x=[i+1 for i in range(12)]y=avewchplt.plot(x,y,label="平均温差")【解析】 本题主要考查pandas模块分析数据及数据可视化。(1) ①计算最大温差,温差=最高气温 -最低气温,即d["最高气温℃"]-df["最低气温℃"] 。②查找温差等于最大温差max的数据,并将对应日期添加到列表rq中,df_wch.at[i,"日期"]或df_wch["日期"][i] 。(2) ③每月数据结束位置与该月天数相关,第m月份起始数据位置为begin,则结束数据对应位置为起始位置加上m月的天数,即为begin+mdays[m]。 ④m月平均温差为总计温差total除以当月天数,确定答案为total/mdays[m]。15. 某超市5个月的流水账单使用CSV文件进行存储,约有65500行数据,部分数据如图1所示。第15题图1第15题图2小王同学准备使用Python语言的pandas模块处理这些数据,统计出总销量排名前十的商品,并使用如图2所示的柱形图来呈现这些数据。程序代码如下:import pandas as pdimport matplotlib.pyplot as pltplt.rc("font",**{"family":"SimHei"}) #调用中文字体库以在图表内显示中文字符df = pd.read_csv("超市销售数据.csv")df1 = ① #根据商品名称分组,并对每组数据求和df1 = df1.销售数量 #选取销售数量一列数据df1 = ② #排序,并取销量最高的10个值x = df1.indexy = df1.values ③ #根据数据源x和y创建柱形图plt.title("最畅销的十大商品",fontsize=30) #给图表添加标题plt.xticks(rotation=30,fontsize=30)plt.yticks(fontsize=30)plt.xlabel("商品名称",fontsize=30) ④ #给y轴数据添加标签plt.show()请在横线上填入合适的代码:① df.groupby('商品名称').sum() 或 df.groupby('商品货号').sum() ,② df1.sort_values(ascending=False).head(10) ,③ plt.bar(x,y) ,④ plt.ylabel('数量',fontsize=30) 。【解析】 ①先使用groupby函数根据“商品名称”或“商品货号”进行分组,再使用sum函数对每组数据求和,应填df.groupby('商品名称').sum() 或 df.groupby('商品货号').sum();②使用sort_values函数对数据进行降序排列,必须注意此时的df1已经是选中了“销售数量”这一列,其类型不再是DataFrame,而是Series,其值不存在列名。故sort_values函数中不可以写列名,直接为空缺即可,并使用head或tial函数取最大的十个,应填df1.sort_values(ascending=False).head(10),其中ascending参数空缺时默认为升序;③使用bar函数创建柱形图,其括号内填写x轴和y轴的数据源,应填plt.bar(x,y);④观察题中给出的图表,其y轴有标签“数量”二字,故应当使用ylabel参数进行相应设置,应填plt.ylabel('数量',fontsize=30),其中fontsize参数(设置字体大小)填与不填均得分。 展开更多...... 收起↑ 资源列表 第四章 核心素养测评卷.docx 第四章核心素养测评卷.pptx