必修1专题六、专题七检测卷（含解析）2026年浙江省高考选考信息技术总复习

资源简介

专题六、专题七　检测卷
一、选择题(本大题共12小题,每小题2分,共24分。每小题列出的四个备选项中只有一个是符合题目要求的,不选、多选、错选均不得分)
1.有Python程序段如下:
import pandas as pd
s=pd.Series(["205","李光明","男","17"],index=["班级","姓名","性别","年龄"])
s[0]= "201"
print(s)
该程序段运行后输出的结果是(　　)
A.班级姓名性别年龄 B.201 "李光明""男" 17
C.班级　　 201 姓名　　李光明性别　　 "男" 年龄　　 17　 D.0　　 201 1　　李光明 2　　 "男" 3　　 17　
2.某DataFrame对象df,其columns属性值为["姓名","科目","成绩"]。下列语句中能将df对象中的数据按照“成绩”从大到小排序的是(　　)
A.df.sort_values("成绩",axis=0,ascending=True)
B.df.sort_values("成绩",axis=1,ascending=False)
C.df.sort_values("成绩",ascending=False)
D.df=df.sort_values("成绩",ascending=False)
3.某DataFrame对象df2包含“准考证号”、“班级”、“姓名”、“语文”、“数学”、“英语”等数据列,下列语句中,能实现输出以班级为单位的各班“语文”列平均值的是(　　)
A.print(df2.groupby("班级",as_index=False).mean( ))
B.print(df2.groupby("语文",as_index=False).mean( ))
C.print(df2.groupby("班级",as_index=False).排名.mean( ))
D.print(df2.sort_index("语文",as_index=False).describe( ))
4.下列Python程序段的功能是生成并显示一张由Python随机数生成的正态分布图,如图所示。
import numpy as np
import matplotlib.pyplot as plt
plt.figure(figsize=(9,6))
n=5000
x=np.random.randn(1,n)　#返回n个随机数,具有标准正态分布
y=np.random.randn(1,n)
t=np.arctan2(x,y)　#函数arctan2(x,y)返回给定的坐标值的反正切值
　　①　
　　②　
则程序划线①②处应填入的语句是(　　)
A.①plt.plot(x,y,alpha=0.5)　②plt.show()
B.①plt.show()　②plt.scatter(x,y,alpha=0.5)
C.①plt.scatter(x,y,alpha=0.5)　②plt.show()
D.①plt.scatter(x,y,alpha=0.5)　②np.show()
5.有Python程序段如下:
import pandas as pd
s1=pd.Series(range(1,6,2),index=["x1","x2","x3"])
s2=pd.Series(range(2,7,2),index=["x1","x2","x3"])
df1=pd.DataFrame([s1,s2],index=["p01","p02"])
print(df1)
该程序段运行后输出的结果为(　　)
A B C D
　 p01 p02 0　1　2 1　3　4 2　5　6 　　 x1　x2　x3 p01　1　3　5 p02　2　4　6 　　0　1　2 p01　1　3　5 p02　2　4　6 　　p01 p02 x1　1　2 x2　3　4 x3　5　6
6.Excel文件cj.xlsx中的数据包含“准考证号”“姓名”“学号”“班级”等字段,以及若干个数据行。则下列程序段执行后对象df中的数据将(　　)
import pandas as pd
df=pd.read_excel("cj.xls")
df.drop("学号",axis=1)
df.insert(3,'团员','是')
df.sort_values("班级")
A.与Excel文件中的数据保持一致 B.减少“学号”数据列
C.按照“班级”升序排序 D.增加了“团员”列,该列的数据为“是”
7.下列关于数据可视化的描述中,错误的是(　　)
A.标签云是基于语句的文本内容可视化
B.数据可视化是将数据以图形图像等形式表示
C.数据可视化可以直观地呈现数据中蕴含的信息
D.数据可视化增强了数据的解释力与吸引力
8.下列数据分析中可能涉及文本情感分析的是(　　)
A.对城市地理位置的分析 B.对影评内容的分析
C.对道路设施的分析 D.对大学男女比例的分析
9.下列有关图表类型的说法,错误的是(　　)
A.有关时间趋势的可视化可以采用折线图
B.有关比例的可视化可以采用饼图、环形图
C.要探究一件事情变化时另一件事情是否会发生某种变化,可采用散点图
D.要探寻包含多种变量的对象与同类之间的差异和联系,可采用雷达图
10.data.scv文件中数据包含“序号”“类别”“商品名称”“单价”“数量”等字段,有若干个数据行,下列程序段执行后,对象goods中的数据将(　　)
　import pandas as pd
goods_data=pd.read_scv('data.csv')
goods_data.drop("序号",axis=1)
goods.drop(2,axis=0)
goods_data["金额"]= goods_data.["单价"]* goods_data.["数量"]
avg= goods_data["单价"].mean()
A.减少“序号”数据列
B.减少索引值为2的数据行
C.增加一个“金额”数据列,其值为对应商品的单价与数量的乘积
D.增加一个数据行,其中“单价”值为所有商品的平均单价
11.某DataFrame对象df共包含6个数据列、30个数据行,其中第2列为“姓名”列,下列语句中能读取df对象中“姓名”列所有数据的是(　　)
A.df."姓名" B.df.columns[1]
C.df[姓名] D.df["姓名"]
12.人工智能的神经网络研究属于(　　)
A.符号主义 B.联结主义 C.行为主义 D.试错主义
二、非选择题(本大题共3小题,其中第13小题8分,第14小题8分,第15小题10分,共26分)
13.将影院放映厅环境监测系统中2月份的数据导出到文件data.xlsx中,部分数据如图a所示。现要从高到低输出各放映厅空气质量优的天数(如图b所示),再用空气质量优的天数最多的放映厅的PM2.5数据绘制线形图(如图c所示)。
实现上述功能的部分Python 程序如下:
import pandas as pd
import matplotlib.pyplot as plt
df=pd.read_excel("data.xlsx")
df1=①　　　　　　　　(2分)
df2=②　　　　　　　　(2分)
df2=③　　　　　　　　(2分)
#依次输出df2中各放映厅编号及其空气质量优的天数,如图b所示,代码略
#将df2中首行的放映厅编号存入room_id,代码略
df3=④　　　　　　(2分)
plt.plot(df3["日"],df3["PM2.5"]) #绘制线形图
#设置绘图参数,并显示如图c所示的线形图,代码略
①②③④处可选代码有:
A.df.groupby("放映厅",as_index=False).空气质量.count()
B.df1.groupby("放映厅",as_index=False).空气质量.count()
C.df[df["放映厅"]==room_id]
D.df1[df1["放映厅"]==room_id]
E.df[df["空气质量"]=="优"]
F.df1.sort_values("空气质量",ascending=False)
G.df2.sort_values("空气质量",ascending=False)
14.小明从网上收集了关于杭州的资料,并以utf8格式保存在文件“tx.txt”中。小明利用pyhton对文件中的文本进行处理,以“fish.png”图片作为生成标签云的形状,最后生成如图所示的标签云。
实现如图所示的标签云的代码如下,请在程序划线处填入合适的代码。
import jieba
import wordcloud as wc
import numpy as np
from PIL import Image
#图片作为生成标签云形状
pic=np.array(Image.open(　　①　　))
w=wc.WordCloud(background_color="white", font_path='msyh.ttf', mask=pic)text=
open(' data/tx.txt',encoding='utf8').read()
　　②　　#利用jieba的lcut方法进行分词
counts={}
#统计词频并过滤单个字
for word in wordlist:　　 #遍历分词列表wordlist
　if len(word)!=1:
　　　if word in counts:
　　　　counts[word]+=1
　else:
　　　　　③　
　　④　　　#根据字典counts生成标签云
w.to_file('tx.png')
程序划线①处应填入的代码为:　　　　　　　　　　　　　　　;(2分)
程序划线②处应填入的代码为:　　　　　　　　　　　　　　　;(2分)
程序划线③处应填入的代码为:　　　　　　　　　　　　　　　;(2分)
程序划线④处应填入的代码为:　　　　　　　　　　　　　　　。(2分)
15.小明收集了部分城市某日24小时空气质量数据,保存在“data.csv”文件中,数据格式如图a所示。请回答下列问题:
(1)定义函数read_data,功能是读入某天的数据文件,筛选出“type”列中为“AQI”的记录并返回。
def read_data(filename):
df=pd.read_csv(filename)
df1=　　　　　　　　　
return df1
则程序划线处应填入的代码为　　　　(多选,填字母)。(2分)
A.df[df.type=="AQI"] B.df[df[type]=="AQI"]
C.df[df."type"]=="AQI"] D.df[df["type"]=="AQI"]
(2)统计每个城市该天AQI指数为优的时长(小时),并绘制如图b所示的柱形图。代码如下,请在划线处填入合适的代码。(说明:按照环境空气质量标准,空气污染指数AQI≤50为优)
df2=read_data("data.csv")
citylist=df2.columns[3:]　#取出标题行
　　　　　①　　　　
nums=[0]*n
k=0
for city in citylist:
　　　　　②　　　　
for i in df2.index:
if df2.at[i,city]<=50:
　 cnt+=1
　　　　　③　　　　
k=k+1
plt.figure(figsize=(8,4)) #创建一个新的图表对象
plt.title('某日24小时中各城市空气质量为优的时间情况')
x=　　　　④　　　
y=nums
plt.bar(x,y)
plt.show()
划线①处应填入的代码为:　 ;(2分)
划线②处应填入的代码为:　 ;(2分)
划线③处应填入的代码为:　 ;(2分)
划线④处应填入的代码为:　。(2分)
专题六、专题七　检测卷
一、选择题
1.C　解析:s为Series对象,通过s[0]= "201"修改s对象中索引值为1的数据,即将"205"修改为"201",并给数据指定索引为"班级","姓名","性别","年龄",因此答案为C。
2.D　
3.B　解析:题目要求以班级为单位,因此首先要使用groupby函数按班级进行分组,然后使用mean()函数求平均值,因此答案为B。
4.C　解析:观察图可知,生成的是一张散点图,因此使用scatter函数,最后将图像显示要使用语句plt.show(),因此答案为C。
5.B　解析:本题的功能是将两个Series对象合并成一个DataFrame对象,合并后的列标题分别为x1、x2、x3,索引值为p01、p02,df1对象的数据由s1和s2对象中的数据行组成,因此答案为B。
6.D　解析:drop函数、sort_values函数均不改变原有df对象中的数据,一般通过返回另一个DataFrame对象来存放改变后的数据,df.insert(3,'团员','是')的功能是在第3列插入“团员”列,列数据为“是”,因此答案为D。
7.A　8.B　9.D　
10.C　解析:本题主要考查的是Pandas数据处理。语句“goods_data.drop("序号",axis=1)”的功能是删除“序号”列,语句“goods.drop(2,axis=0)”删除索引为2的行,但drop()函数不会改变原对象中的数据,因此A,B选项均错误;语句“avg= goods_data["单价"].mean()”求出单价的平均值,并存放在变量avg中,并没有在对象中增加数据,因此D选项错误;C选项正确,故答案为C。
11.D　解析:本题主要考查的是DataFrame对象。读取df对象中“姓名”列所有数据的命令为df.姓名或df["姓名"],因此答案为D。
12.B　解析:联结主义的指导性启示和主要灵感来自大脑或神经系统,它把认知看成是网络的整体活动。网络是个动态的系统,它由类似于神经元的基本单元和结点构成,每个单元都有不同的活性。随着时间的衰减,外部输入和其他单元的活性传递都会使一个单元的静息活性发生动态的改变。联结主义赋予网络以核心性的地位,采纳分布表征和并行加工理论,强调的是网络的并行分布加工,注重的是网络加工的数学基础。因此,人工智能的神经网络研究属于联结主义,答案为B。
二、非选择题
13.①E　②B　③G　④C
解析:要从高到低输出各放映厅空气质量优的天数,再用空气质量优的天数最多的放映厅的PM2.5数据绘制线形图。
因此先筛选空气质量优的记录,即E;再对空气质量优的按照放映厅分类汇总统计天数,即B;最后按照天数降序排序,即G;df2中首行放映厅编号是空气质量优的天数最多的放映厅,但是筛选的时候一定要注意数据来源,一定是最初的数据源,因此语句为df[df[“放映厅”]==room_id],即C。
14.①'fish.png'　②wordlist=jieba.lcut(text)　③counts[word]=1　④w.fit_words(counts)
解析:本题使用图片作为标签云的形状,根据题目描述可知,程序①处代码为'fish.png';程序②处代码的功能是利用jieba的lcut方法进行分词,根据代码for word in wordlist··可知,存放分词的列表为wordlist,因此,程序②处代码为wordlist=jieba.lcut(text);若分词已存在字典counts中,则进行计数,否则在字典中添加元素,即键为word,值为1,因此③处代码为counts[word]=1;程序④处代码的功能是根据词频统计结果生成标签云图像,因此④处代码为w.fit_words(counts)。
15.(1)AD
(2)①n=len(citylist)　②cnt=0　③nums[k]=cnt　④citylist
解析:(1)要筛选出“type”列中为“AQI”的记录,可用字典法或属性来检索,因此正确答案为AD。
(2)根据语句y=nums可知,列表nums存储的是各城市AQI指数为优的时长,而nums的初值为[0]*n,由此可知n表示城市的数量,因此①处代码为n=len(citylist)。根据语句“if df2.at[i,city]<=50:cnt+=1”可知,语句的功能是统计当前城市AQI指数为优的时长(小时),存储在变量cnt中,因此在对每个城市统计前应将cnt初始化为0,因此②处代码为cnt=0。统计完成当前城市AQI指数为优的时长后,存储在列表nums中,因此③处代码为nums[k]=cnt。根据图b可知,x坐标数据为城市名称,因此④处代码为citylist。

展开更多......

收起↑

请用微信扫码

必修1专题六、专题七检测卷（含解析）2026年浙江省高考选考信息技术总复习

必修1专题六、专题七检测卷（含解析）2026年浙江省高考选考信息技术总复习