第四章核心素养测评卷（含答案） 2025-2026学年高中信息技术必修1 数据与计算

资源简介

(共29张PPT)
第四章核心素养测评卷
信息技术必修1 数据与计算
一、选择题(每小题列出的四个选项中只有一个是符合题目要求的)
1. 右表为我国2011—2020年GDP统计表。为了直观地显示GDP的变化趋势,可以使用
　　　进行数据可视化。横线上应填(　　)
我国2011—2020年GDP统计表
年份 GDP(亿元)
2011 487940.18
2012 538579.95
2013 592963.23
2014 641280.57
2015 685992.95
2016 740060.08
2017 820754.28
2018 900309.48
2019 990865
2020 1015986
A. 柱形图
B. 折线图
C. 饼图
D. 雷达图
B
【解析】本题主要考查数据的可视化表达。柱形图主要体现不同项目数据之间的比较。条形图主要体现不同项目数据之间的比较。折线图主要反映事物随时间变化的情况和发展趋势。饼图表示各部分在总体中所占的百分比。雷达图主要应用于企业经营状况——收益性、生产性、流动性、安全性和成长性的评价。为了直观地显示GDP的变化趋势,可以使用折线图进行数据可视化。
2. 下列选项中,属于数据处理的目的的是(　　)
A. 检测和修正数据 B. 整合数据资源
C. 统一数据格式 D. 提取有用的信息
【解析】本题主要考查数据处理。数据处理的基本目的是从大量的、可能是杂乱无章的、难以理解的数据中抽取并推导出对于某些特定的人来说是有价值、有意义的数据。
D
3. 某电商平台通过分析客户的爱好和消费行为及其趋势,为客户提供了更为精准的服务。这属于大数据在　　　　方面的应用。横线上应填(　　)
A. 智慧城市 B. 医疗健康
C. 生活服务 D. 社区管理
【解析】本题主要考查大数据的应用。某电商平台通过分析客户的爱好和消费行为及趋势,为客户提供了更为精准的服务。这属于大数据在生活服务方面的应用。
C
4. 如图所示为水资源数据词云图,这种呈现数据的形式称为(　　)
A. 虚拟化形式 B. 可视化形式
C. 网状化形式 D. 多样化形式
【解析】本题主要考查数据可视化表达。词云图是数据可视化的一种常见形式,适用于文本数据的处理和分析。
B
5. 学校依据《国家学生体质健康标准》编制调查问卷,利用现有网络调查平台收集数据,并对数据做出分析,得出结论。下列说法中,错.误.的是(　　)
A. 网络调查平台已经提供了分析功能,用户无须再对数据进行分析
B. 《国家学生体质健康标准》是经过调查研究、实践检验总结出来的知识
C. 通过调查问卷收集的是数据,可以用图表对其进行可视化表达
D. 可以借助多种数字化学习工具完成该项目,如网上问卷调查、电子资料、思维导图、搜索引擎等
【解析】本题主要考查数据处理。网络调查平台提供的分析功能可能无法满足用户特定的需求,这时用户需再对数据进行分析,A错误。
A
6. 近期学校进行了一次技术学考模拟考试,学生的成绩数据保存在文件“jscj.xlsx”中,如图所示为其中部分数据。编写Python程序,统计本次考试各班级的优秀(A等级)人数。
import pandas as pd　　　　　　 #导入pandas模块
import matplotlib.pyplot as plt　 #导入matplotlib的pyplot子库
df=pd.read_excel("jscj.xlsx")　 #读取文件中的数据
plt.bar(g.index,g.等级)
plt.show()
方框中的代码由下列语句中的部分语句组成:
①df=df[df.等级=="A"]
②df=df["等级"=="A"]
③g=df.groupby("班级", as_index=True).sum()
④g=df.groupby("班级", as_index=True).count()
要实现上述功能,方框中的代码应为(　　)
A.①④ B.①③ C.②④ D.②③
【解析】本题考查数据的处理与应用。筛选的语法为df[条件],筛选出等级为A的学生,语句为①。按班级分组,班级当作索引,统计各班级的优秀人数,用count( )来表示,A正确。
A
7. 下列描述的场景与处理方法,使用不.恰.当.的是(　　)
A. 分析前一年的高铁客流数据以优化高铁运营,采用批处理计算
B. 某电商平台通过实时分析用户行为实现商品的精准推荐,采用流计算
C. 图计算为某平台超大规模社交网络图数据的各类计算提供支撑
D. 分析近五年的技术选考试卷和梳理高频考点,采用流计算
【解析】本题主要考查对不同数据的不同处理方法。一般静态数据用批处理计算,流数据用流计算,图数据用图计算等。近五年的技术选考试卷和梳理的高频考点应该属于静态数据,应采用批处理计算。
D
8. 某大型购物网站收集了用户浏览网站的数据，用于广告个性化实时推荐,下列处理方式中,合理的是(　　)
A. 应当使用统计分析软件进行数据分析
B. 应当选用针对流数据的实时计算
C. 应当选用针对图结构数据的图计算
D. 应当选用针对静态数据的批处理计算
【解析】本题主要考查大数据分析。流数据是一组顺序、大量、快速、连续到达的数据序列,一般情况下,流数据可被视为一个随时间延续而无限增长的动态数据集合。用于广告个性化实时推荐,应当选用针对流数据的实时计算。
B
9. 下列关于大数据处理的说法,错.误.的是 (　　)
A. 处理大数据一般采用分治思想
B. 数据采集只能收集结构化数据
C. 图计算主要针对图数据
D. 并行处理能缩短复杂问题的处理时间
【解析】本题主要考查大数据处理。处理大数据一般采用分治思想;大数据采集的是规模巨大的数据,不局限于结构化数据;图计算主要针对图数据;并行处理能缩短复杂问题的处理时间,B错误。
B
10. 下列论据中,能够支持“大数据无所不能”观点的是(　　)
A. 互联网金融打破了传统的观念和行为
B. 大数据存在泡沫
C. 大数据具有非常高的成本
D. 大数据可能带来个人隐私泄露与信息安全问题
【解析】本题主要考查大数据。互联网金融打破了传统的观念和行为,使得“大数据无所不能”。在“大数据”的浪潮中,基于社交网络大数据的应用,将会为企业带来更多的收益,推动大数据分析在各行各业中的应用和推广,将会为企业和社会带来“大价值”,A正确。
A
11. 某DataFrame 对象df,包含“商品编码”“销售价格”“销售日期”等数据列。下列语句中,能将df对象中的数据以“商品编码”为关键字进行降序排列的是(　　)
A. df.sort_index(axis＝1, ascending＝True)
B. df.sort_values("商品编码",ascending＝False)
C. df.sort_values("商品编码",ascending＝True,inplace＝True)
D. df.sort_values("商品编码",ascending＝False,inplace＝True)
【解析】分析题目,发现解决问题的关键在于将df对象中的数据按“商品编码”从大到小的顺序排列,df对象中的数据采用DataFrame结构组织,因此可以使用sort_values()函数按“商品编码"降序排列df对象中的数据。参数acnding＝False为降序,inplace＝True排序结果替换df中数据,D正确。
D
二、非选择题
12. 星空老师想知道中国成语中包含“星空”(包括单个字)的成语有多少,从网络上下载了“成语大全.txt”,部分界面如图1及图2所示,请回答下列问题:
图1
图2
(1)当前文本数据由图1到图2做了__________(填字母)的操作。
A. 数据整理 B. 数据挖掘
(2)成语的统计代码如下,请在横线上填入合适的代码:①__________,②____________,
③_____________。
import pandas as pd # 导入pandas模块,并设置别名pd
cy=open("　　①　　", "r",encoding="utf-8")　　# 打开文件
cytxt=cy.read().split("\n")　　　　　　　　　　# 读取文件内容
xm=["星","空","星空"]
jg=[]
count=0
for i in cytxt:
　　for j in range(len(xm))∶
　　　　if　　②　　∶
　　　　　　jg.append(i)
　　　　　　count=count+1
print("包含星空(包括一个字)共有∶"+　　③　　)
print("这些成语为∶",jg)
A
成语.txt
xm[j] in i
str(count)
【解析】本题考查文本处理知识。(1)从图1到图2将一些不需要的数据进行整理,称为数据整理。(2)因为数据整理后的文件为“成语.txt”,故①为成语.txt ;判断xm的各个元素在不在成语中,故②为 xm[j] in i ;输出成语的总个数,前面有＋号,故③为str(count)。
13. 某学院举行运动会,比赛设跳高、100米等项目,每个项目分男子组和女子组。现要进行报名数据处理和比赛成绩分析。请回答下列问题:
(1)运动会报名规则如下:对于每个项目的男子组和女子组,每个专业最多各报5人(如软件工程专业在男子跳高项目中最多报5人)。软件工程专业的报名数据保存在DataFrame对象df中,如图1所示。若要编写Python程序来检查该专业男子跳高项目报名是否符合规则,下列方法中,正确的是__________(单选,填字母)。
A. 从df中筛选出性别为“男”的数据dfs,
再从dfs中筛选出项目为“跳高”的数据,
判断筛选出的数据行是否超过5行
B. 对df中数据按性别排序并保存到dfs中,
再从dfs中筛选出项目为“跳高”的数据,
判断筛选出的数据行是否超过5行
C. 从df中筛选出项目为“跳高”的数据dfs,
判断dfs中是否有连续5行以上的男生数据
A
图1
(2)如图2所示为运动员比赛成绩的部分数据。根据已有名次计算得,第1名至第8名分别计9分、7分、6分、5分、4分、3分、2分、1分,第8名之后计0分。实现上述功能的部分
Python程序如下,请在横线上填入合适的代码:____________________________________
_________________。
import pandas as pd
import matplotlib.pyplot as plt
#读取如第13题图2所示的数据,保存到DataFrame对象df1中,代码略
f = [9, 7, 6, 5, 4, 3, 2, 1]
for i in range(0,len(dfl))∶
　　rank = df1.at[i,"名次"]　　#通过行、列标签取单个值
　　score = 0
　　if rank <= 8:
　　　　　　　　　
　　df1.at[i,"得分"] = score
图2
score ＝ f[rank－1] 或 score ＝
f[int(rank)－1]
(3)根据上述df1中的得分数据,统计各专业总分,绘制如图3所示的柱形图,实现该功能的部分Python程序如下:
df2 = dfl.groupby("　　　　　　",as_index=False).sum()　　#分组求和
#设置绘图参数,代码略
plt.bar(x,y)　　　　　　#绘制柱形图
①请在横线上填入合适的代码:__________。
②程序的方框中应填入的正确代码为__________(单选,填字母)。
A. x=df1["专业"]
y=df1["总分"]
B. x=df2["专业"]
y=df2["得分"]
C. df1["专业"]="专业"
df1["总分"]="总分"
D. df2["专业"]="专业"
df2["得分"]="得分"
图3
专业
B
【解析】本题考查利用pandas模块进行数据处理,利用处理后的数据绘制柱状图。
(1)二次筛选后检查数据,A正确;男生、女生数据没有分开,B错误;男生数据不一定是连续的,C错误。
(2)根据名次,从列表f中取出对应的得分,考虑到Python列表下标是从0开始的,此处代码:score ＝ f[rank － 1] 或 score ＝ f[int(rank) － 1]。
(3)①按题目要求以及第13题图3,这里要按"专业"进行分组;②依据绘制图形的语句:plt.bar(x,y),方框处代码要对x,y进行赋值操作。根据分组后的数据,正确的赋值语句是B。
14. 学校气象站的小江同学收集了本地2024年全年的天气数据,数据按日期顺序存储在“tqsj.xlsx”文件中,部分数据如图1所示。
图1
为分析全年各月份天气情况,编写Python程序,请回答下列问题:
(1)计算2024年每天的温差(最高气温－最低气温),找出最大温差,如有相同温差,输出所有符合要求的日期,输出结果如图2所示。程序代码如下,请在横线上填入相应的代码:
①_______________________________________,②________________________________
_________________________。
import pandas as pd
df=pd.read_excel("tqsj.xlsx")
df["温差"]=　　①　　
df_wch=df.sort_values("温差",ascending=False,ignore_index=True)
max=df_wch.at[0,"温差"]
rq=[]
for i in df_wch.index:
　　if df_wch.at[i,"温差"]==max:
　　　　rq.append(　　②　　)
print("最大温差:",max,"℃")
print("日期:",rq)
图2
df["最高气温℃"]－df["最低气温℃"]
df_wch.at[i,"日期"] 或
df_wch["日期"][i]
(2)统计各月平均温差并绘制线形图,部分Python程序如下,请在横线上填入相应的代码:
③_____________________,④_________________。
avewch =[0]*12
mdays =[31,29,31,30,31,30,31,31,30,31,30,31] #2024年每月天数
begin=0
for m in range(12):
　　total=0
　　for d in range(begin,　　③　　):
　　　　total+=df.at[d,"温差"]
　　avewch[m]=　　④　　
　　begin+=mdays[m]
x=[i+1 for i in range(12)]
y=avewch
plt.plot(x,y,label="平均温差")
begin＋mdays[m]
total/mdays[m]
【解析】本题主要考查pandas模块分析数据及数据可视化。(1) ①计算最大温差,温差＝最高气温－最低气温,即d["最高气温℃"]－df["最低气温℃"] 。②查找温差等于最大温差max的数据,并将对应日期添加到列表rq中,df_wch.at[i,"日期"]或df_wch["日期"] [i] 。(2) ③每月数据结束位置与该月天数相关,第m月份起始数据位置为begin,则结束数据对应位置为起始位置加上m月的天数,即为begin＋mdays[m]。 ④m月平均温差为总计温差total除以当月天数,确定答案为total/mdays[m]。
15. 某超市5个月的流水账单使用CSV文件进行存储,约有65500行数据,部分数据如图1所示。
图1
小王同学准备使用Python语言的pandas模块处理这些数据,统计出总销量排名前十的商品,并使用如图2所示的柱形图来呈现这些数据。
程序代码如下:
import pandas as pd
import matplotlib.pyplot as plt
plt.rc("font",**{"family":"SimHei"}) #调用中文字体库以在图表内显示中文字符
df = pd.read_csv("超市销售数据.csv")
df1 = 　　　　①　　　　　　 #根据商品名称分组,并对每组数据求和
df1 = df1.销售数量　　#选取销售数量一列数据
df1 = 　　　　②　　　　　　#排序,并取销量最高的10个值
x = df1.index
y = df1.values
　　　　③　　　　　　#根据数据源x和y创建柱形图
plt.title("最畅销的十大商品",fontsize=30) #给图表添加标题
plt.xticks(rotation=30,fontsize=30)
plt.yticks(fontsize=30)
plt.xlabel("商品名称",fontsize=30)
　　　　④　　　　　　#给y轴数据添加标签
plt.show()
图2
请在横线上填入合适的代码:①_________________________________________________
___________,②_________________________________________,③______________,
④____________________________。　
【解析】 ①先使用groupby函数根据“商品名称”或“商品货号”进行分组,再使用sum函数对每组数据求和,应填df.groupby('商品名称').sum() 或 df.groupby('商品货号').sum(); ②使用sort_values函数对数据进行降序排列,必须注意此时的df1已经是选中了“销售数量”这一列,其类型不再是DataFrame,而是Series,其值不存在列名。故sort_values函数中不可以写列名,直接为空缺即可,并使用head或tial函数取最大的十个,应填df1.sort_values(ascending＝False).head(10),其中ascending参数空缺时默认为升序;③使用bar函数创建柱形图,其括号内填写x轴和y轴的数据源,应填plt.bar(x,y);④观察题中给出的图表,其y轴有标签“数量”二字,故应当使用ylabel参数进行相应设置,应填plt.ylabel('数量',fontsize＝30),其中fontsize参数(设置字体大小)填与不填均得分。
df.groupby('商品名称').sum() 或 df.groupby('商品货
号').sum()
df1.sort_values(ascending＝False).head(10)
plt.bar(x,y)
plt.ylabel('数量',fontsize＝30)第四章核心素养测评卷
一、选择题(每小题列出的四个选项中只有一个是符合题目要求的)
1. 下表为我国2011—2020年GDP统计表。为了直观地显示GDP的变化趋势,可以使用　　　进行数据可视化。横线上应填(　B　)
我国2011—2020年GDP统计表
年份 GDP(亿元)
2011 487940.18
2012 538579.95
2013 592963.23
2014 641280.57
2015 685992.95
2016 740060.08
2017 820754.28
2018 900309.48
2019 990865
2020 1015986
A. 柱形图 B. 折线图
C. 饼图 D. 雷达图
【解析】本题主要考查数据的可视化表达。柱形图主要体现不同项目数据之间的比较。条形图主要体现不同项目数据之间的比较。折线图主要反映事物随时间变化的情况和发展趋势。饼图表示各部分在总体中所占的百分比。雷达图主要应用于企业经营状况——收益性、生产性、流动性、安全性和成长性的评价。为了直观地显示GDP的变化趋势,可以使用折线图进行数据可视化。
2. 下列选项中,属于数据处理的目的的是(　D　)
A. 检测和修正数据
B. 整合数据资源
C. 统一数据格式
D. 提取有用的信息
【解析】本题主要考查数据处理。数据处理的基本目的是从大量的、可能是杂乱无章的、难以理解的数据中抽取并推导出对于某些特定的人来说是有价值、有意义的数据。
3. 某电商平台通过分析客户的爱好和消费行为及其趋势,为客户提供了更为精准的服务。这属于大数据在　　　　方面的应用。横线上应填(　C　)
A. 智慧城市
B. 医疗健康
C. 生活服务
D. 社区管理
【解析】本题主要考查大数据的应用。某电商平台通过分析客户的爱好和消费行为及趋势,为客户提供了更为精准的服务。这属于大数据在生活服务方面的
应用。
4. 如图所示为水资源数据词云图,这种呈现数据的形式称为(　B　)
第4题图
A. 虚拟化形式 B. 可视化形式
C. 网状化形式 D. 多样化形式
【解析】本题主要考查数据可视化表达。词云图是数据可视化的一种常见形式,适用于文本数据的处理和分析。
5. 学校依据《国家学生体质健康标准》编制调查问卷,利用现有网络调查平台收集数据,并对数据做出分析,得出结论。下列说法中,错误的是(　A　)
A. 网络调查平台已经提供了分析功能,用户无须再对数据进行分析
B. 《国家学生体质健康标准》是经过调查研究、实践检验总结出来的知识
C. 通过调查问卷收集的是数据,可以用图表对其进行可视化表达
D. 可以借助多种数字化学习工具完成该项目,如网上问卷调查、电子资料、思维导图、搜索引擎等
【解析】本题主要考查数据处理。网络调查平台提供的分析功能可能无法满足用户特定的需求,这时用户需再对数据进行分析,A错误。
6. 近期学校进行了一次技术学考模拟考试,学生的成绩数据保存在文件“jscj.xlsx”中,如图所示为其中部分数据。编写Python程序,统计本次考试各班级的优秀(A等级)人数。
第6题图
import pandas as pd　　　　　　#导入pandas模块
import matplotlib.pyplot as plt　#导入matplotlib的pyplot子库
df=pd.read_excel("jscj.xlsx")　#读取文件中的数据
plt.bar(g.index,g.等级)
plt.show()
方框中的代码由下列语句中的部分语句组成:
①df=df[df.等级=="A"]
②df=df["等级"=="A"]
③g=df.groupby("班级", as_index=True).sum()
④g=df.groupby("班级", as_index=True).count()
要实现上述功能,方框中的代码应为(　A　)
A. ①④ B. ①③
C. ②④ D. ②③
【解析】本题考查数据的处理与应用。筛选的语法为df[条件],筛选出等级为A的学生,语句为①。按班级分组,班级当作索引,统计各班级的优秀人数,用count()来表示,A正确。
7. 下列描述的场景与处理方法,使用不恰当的是(　D　)
A. 分析前一年的高铁客流数据以优化高铁运营,采用批处理计算
B. 某电商平台通过实时分析用户行为实现商品的精准推荐,采用流计算
C. 图计算为某平台超大规模社交网络图数据的各类计算提供支撑
D. 分析近五年的技术选考试卷和梳理高频考点,采用流计算
【解析】本题主要考查对不同数据的不同处理方法。一般静态数据用批处理计算,流数据用流计算,图数据用图计算等。近五年的技术选考试卷和梳理的高频考点应该属于静态数据,应采用批处理计算。
8. 某大型购物网站收集了用户浏览网站的数据，用于广告个性化实时推荐,下列处理方式中,合理的是(　B　)
A. 应当使用统计分析软件进行数据分析
B. 应当选用针对流数据的实时计算
C. 应当选用针对图结构数据的图计算
D. 应当选用针对静态数据的批处理计算
【解析】本题主要考查大数据分析。流数据是一组顺序、大量、快速、连续到达的数据序列,一般情况下,流数据可被视为一个随时间延续而无限增长的动态数据集合。用于广告个性化实时推荐,应当选用针对流数据的实时计算。
9. 下列关于大数据处理的说法,错误的是 (　B　)
A. 处理大数据一般采用分治思想
B. 数据采集只能收集结构化数据
C. 图计算主要针对图数据
D. 并行处理能缩短复杂问题的处理时间
【解析】本题主要考查大数据处理。处理大数据一般采用分治思想;大数据采集的是规模巨大的数据,不局限于结构化数据;图计算主要针对图数据;并行处理能缩短复杂问题的处理时间,B错误。
10. 下列论据中,能够支持“大数据无所不能”观点的是(　A　)
A. 互联网金融打破了传统的观念和行为
B. 大数据存在泡沫
C. 大数据具有非常高的成本
D. 大数据可能带来个人隐私泄露与信息安全问题
【解析】本题主要考查大数据。互联网金融打破了传统的观念和行为,使得“大数据无所不能”。在“大数据”的浪潮中,基于社交网络大数据的应用,将会为企业带来更多的收益,推动大数据分析在各行各业中的应用和推广,将会为企业和社会带来“大价值”,A正确。
11. 某DataFrame 对象df,包含“商品编码”“销售价格”“销售日期”等数据列。下列语句中,能将df对象中的数据以“商品编码”为关键字进行降序排列的是(　D　)
A. df.sort_index(axis＝1,ascending＝True)
B. df.sort_values("商品编码",ascending＝False)
C. df.sort_values("商品编码",ascending＝True,inplace＝True)
D. df.sort_values("商品编码",ascending＝False,inplace＝True)
【解析】分析题目,发现解决问题的关键在于将df对象中的数据按“商品编码”从大到小的顺序排列,df对象中的数据采用DataFrame结构组织,因此可以使用sort_values()函数按“商品编码"降序排列df对象中的数据。参数acnding＝False为降序,inplace＝True排序结果替换df中数据,D正确。
[答题区]
序号 1 2 3 4 5 6 7 8 9 10 11
答案 B D C B A A D B B A D
二、非选择题
12. 星空老师想知道中国成语中包含“星空”(包括单个字)的成语有多少,从网络上下载了“成语大全.txt”,部分界面如图1及图2所示,请回答下列问题:
第12题图1
第12题图2
(1)当前文本数据由图1到图2做了　A　(填字母)的操作。
A. 数据整理
B. 数据挖掘
(2)成语的统计代码如下,请在横线上填入合适的代码:①　成语.txt　,②　xm[j] in i　,③　str(count)　。
import pandas as pd # 导入pandas模块,并设置别名pd
cy=open("　　①　　", "r",encoding="utf-8")　　# 打开文件
cytxt=cy.read().split("\n")　　　　　　　　　　# 读取文件内容
xm=["星","空","星空"]
jg=[]
count=0
for i in cytxt:
　　for j in range(len(xm))∶
　　　　if　　②　　∶
　　　　　　jg.append(i)
　　　　　　count=count+1
print("包含星空(包括一个字)共有∶"+　　③　　)
print("这些成语为∶",jg)
【解析】本题考查文本处理知识。(1)从图1到图2将一些不需要的数据进行整理,称为数据整理。(2)因为数据整理后的文件为“成语.txt”,故①为成语.txt ;判断xm的各个元素在不在成语中,故②为 xm[j] in i ;输出成语的总个数,前面有＋号,故③为str(count)。
13. 某学院举行运动会,比赛设跳高、100米等项目,每个项目分男子组和女子组。现要进行报名数据处理和比赛成绩分析。请回答下列问题:
第13题图1
第13题图2
(1)运动会报名规则如下:对于每个项目的男子组和女子组,每个专业最多各报5人(如软件工程专业在男子跳高项目中最多报5人)。软件工程专业的报名数据保存在DataFrame对象df中,如图1所示。若要编写Python程序来检查该专业男子跳高项目报名是否符合规则,下列方法中,正确的是　A　(单选,填字母)。
A. 从df中筛选出性别为“男”的数据dfs,再从dfs中筛选出项目为“跳高”的数据,判断筛选出的数据行是否超过5行
B. 对df中数据按性别排序并保存到dfs中,再从dfs中筛选出项目为“跳高”的数据,判断筛选出的数据行是否超过5行
C. 从df中筛选出项目为“跳高”的数据dfs,判断dfs中是否有连续5行以上的男生数据
(2)如图2所示为运动员比赛成绩的部分数据。根据已有名次计算得,第1名至第8名分别计9分、7分、6分、5分、4分、3分、2分、1分,第8名之后计0分。实现上述功能的部分Python程序如下,请在横线上填入合适的代码:
　score ＝ f[rank－1] 或 score ＝ f[int(rank)－1]　。
import pandas as pd
import matplotlib.pyplot as plt
#读取如第13题图2所示的数据,保存到DataFrame对象df1中,代码略
f = [9, 7, 6, 5, 4, 3, 2, 1]
for i in range(0,len(dfl))∶
　　rank = df1.at[i,"名次"]　　#通过行、列标签取单个值
　　score = 0
　　if rank <= 8:
　　　　　　　　　
　　df1.at[i,"得分"] = score
(3)根据上述df1中的得分数据,统计各专业总分,绘制如图3所示的柱形图,实现该功能的部分Python程序如下:
第13题图3
df2 = dfl.groupby("　　　　　　",as_index=False).sum()　　#分组求和
#设置绘图参数,代码略
plt.bar(x,y)　　　　　　#绘制柱形图
①请在横线上填入合适的代码:　专业　。
②程序的方框中应填入的正确代码为　B　(单选,填字母)。
A. x=df1["专业"]
y=df1["总分"]
B. x=df2["专业"]
y=df2["得分"]
C. df1["专业"]="专业"
df1["总分"]="总分"
D. df2["专业"]="专业"
df2["得分"]="得分"
【解析】本题考查利用pandas模块进行数据处理,利用处理后的数据绘制柱
状图。
(1)二次筛选后检查数据,A正确;男生、女生数据没有分开,B错误;男生数据不一定是连续的,C错误。
(2)根据名次,从列表f中取出对应的得分,考虑到Python列表下标是从0开始的,此处代码:score ＝ f[rank － 1] 或 score ＝ f[int(rank) － 1]。
(3)①按题目要求以及第13题图3,这里要按"专业"进行分组;②依据绘制图形的语句:plt.bar(x,y),方框处代码要对x,y进行赋值操作。根据分组后的数据,正确的赋值语句是B。
14. 学校气象站的小江同学收集了本地2024年全年的天气数据,数据按日期顺序存储在“tqsj.xlsx”文件中,部分数据如图1所示。
第14题图1
第14题图2
为分析全年各月份天气情况,编写Python程序,请回答下列问题:
(1)计算2024年每天的温差(最高气温－最低气温),找出最大温差,如有相同温差,输出所有符合要求的日期,输出结果如图2所示。程序代码如下,请在横线上填入相应的代码:①　df["最高气温℃"]－df["最低气温℃"]　,
②　df_wch.at[i,"日期"] 或df_wch["日期"][i]　。
import pandas as pd
df=pd.read_excel("tqsj.xlsx")
df["温差"]=　　①　　
df_wch=df.sort_values("温差",ascending=False,ignore_index=True)
max=df_wch.at[0,"温差"]
rq=[]
for i in df_wch.index:
　　if df_wch.at[i,"温差"]==max:
　　　　rq.append(　　②　　)
print("最大温差:",max,"℃")
print("日期:",rq)
(2)统计各月平均温差并绘制线形图,部分Python程序如下,请在横线上填入相应的代码:③　begin＋mdays[m]　,④　total/mdays[m]　。
avewch =[0]*12
mdays =[31,29,31,30,31,30,31,31,30,31,30,31] #2024年每月天数
begin=0
for m in range(12):
　　total=0
　　for d in range(begin,　　③　　):
　　　　total+=df.at[d,"温差"]
　　avewch[m]=　　④　　
　　begin+=mdays[m]
x=[i+1 for i in range(12)]
y=avewch
plt.plot(x,y,label="平均温差")
【解析】本题主要考查pandas模块分析数据及数据可视化。(1) ①计算最大温差,温差＝最高气温－最低气温,即d["最高气温℃"]－df["最低气温℃"] 。②查找温差等于最大温差max的数据,并将对应日期添加到列表rq中,df_wch.at[i,"日期"]或df_wch["日期"][i] 。(2) ③每月数据结束位置与该月天数相关,第m月份起始数据位置为begin,则结束数据对应位置为起始位置加上m月的天数,即为begin＋mdays[m]。 ④m月平均温差为总计温差total除以当月天数,确定答案为total/mdays[m]。
15. 某超市5个月的流水账单使用CSV文件进行存储,约有65500行数据,部分数据如图1所示。
第15题图1
第15题图2
小王同学准备使用Python语言的pandas模块处理这些数据,统计出总销量排名前十的商品,并使用如图2所示的柱形图来呈现这些数据。
程序代码如下:
import pandas as pd
import matplotlib.pyplot as plt
plt.rc("font",**{"family":"SimHei"}) #调用中文字体库以在图表内显示中文字符
df = pd.read_csv("超市销售数据.csv")
df1 = 　　　　①　　　　　　 #根据商品名称分组,并对每组数据求和
df1 = df1.销售数量　　#选取销售数量一列数据
df1 = 　　　　②　　　　　　#排序,并取销量最高的10个值
x = df1.index
y = df1.values
　　　　③　　　　　　#根据数据源x和y创建柱形图
plt.title("最畅销的十大商品",fontsize=30) #给图表添加标题
plt.xticks(rotation=30,fontsize=30)
plt.yticks(fontsize=30)
plt.xlabel("商品名称",fontsize=30)
　　　　④　　　　　　#给y轴数据添加标签
plt.show()
请在横线上填入合适的代码:①　df.groupby('商品名称').sum() 或 df.groupby('商品货号').sum()　,②　df1.sort_values(ascending＝False).head(10)　,③　plt.bar(x,y)　,④　plt.ylabel('数量',fontsize＝30)　。
【解析】 ①先使用groupby函数根据“商品名称”或“商品货号”进行分组,再使用sum函数对每组数据求和,应填df.groupby('商品名称').sum() 或 df.groupby('商品货号').sum();②使用sort_values函数对数据进行降序排列,必须注意此时的df1已经是选中了“销售数量”这一列,其类型不再是DataFrame,而是Series,其值不存在列名。故sort_values函数中不可以写列名,直接为空缺即可,并使用head或tial函数取最大的十个,应填df1.sort_values(ascending＝False).head(10),其中ascending参数空缺时默认为升序;③使用bar函数创建柱形图,其括号内填写x轴和y轴的数据源,应填plt.bar(x,y);④观察题中给出的图表,其y轴有标签“数量”二字,故应当使用ylabel参数进行相应设置,应填plt.ylabel('数量',fontsize＝30),其中fontsize参数(设置字体大小)填与不填均
得分。

展开更多......

收起↑

请用微信扫码

第四章核心素养测评卷（含答案） 2025-2026学年高中信息技术 必修1 数据与计算

第四章核心素养测评卷（含答案） 2025-2026学年高中信息技术 必修1 数据与计算

第四章核心素养测评卷（含答案） 2025-2026学年高中信息技术必修1 数据与计算

第四章核心素养测评卷（含答案） 2025-2026学年高中信息技术必修1 数据与计算