2025届信息技术一轮复习单元检测：第三单元　数据处理与安全（含解析）

资源简介

第三单元　数据处理与安全
信息技术(50分)
一、选择题(本大题共10小题，每小题2分，共20分。每小题列出的四个备选项中只有一个是符合题目要求的，不选、多选、错选均不得分)
1.下列关于人工智能的说法，正确的是(　　)
A.行为主义是基于规则学习的人工智能，包含知识库和推理引擎两个部分
B.深度学习使计算机能从数据本身进行知识学习
C.在混合增强智能中，机器智能是主导因素
D.人工智能可以改善人类生活，促进经济发展，不会给人类带来威胁
2.下列关于人工智能的说法，正确的是(　　)
A.强化学习不需要从过去的经验中学习
B.深度学习是行为主义的典型代表
C.“沃森”从益智游戏领域到医疗领域属于跨领域人工智能
D.人工智能改善人们生活，不会带来任何社会问题
3.下列关于人工智能的说法，不正确的是(　　)
A.行为主义从“交互－反馈”角度来刻画智能行为
B.在符号主义人工智能中，智能行为就是对符号的推理和运算
C.机器客服与人类客服一起合作回答客户问题属于跨领域人工智能
D.深度学习是一种对原始数据所蕴含的特征模式进行学习的算法模型
4.下列选项中，体现了人工智能技术的有(　　)
①部分软件在连接Wi Fi后自动下载更新　②停车场出入口自动识别车牌放行　③涵盖了客服和金融百科问答功能的智能助理　④自动识别语音并将其转换为文字　⑤开发3D技术的电脑游戏
A.②③⑤ B.①④⑤
C.②③④ D.①③④
5.下列关于人工智能的说法，不正确的是(　　)
A.符号主义人工智能包含知识库和推理引擎两个部分
B.深度学习是一种对原始数据所蕴含的特征模式进行学习的算法模型
C.混合增强智能是多种智能体的混合形式，其中人类智能是智能回路的总开关
D.行为主义通过模仿人类大脑中神经元之间的复杂交互来进行认知推理
6.分类问题是人工智能领域的经典问题，如气象学家通过测定气温、湿度等指标，预测风、晴、雨、雪等天气情况。解决分类问题的方法有很多，其中神经网络是一种应用广泛的人工智能方法。根据以上信息，运用神经网络解决分类问题属于人工智能的(　　)
A.符号主义 B.联结主义
C.专家系统 D.强化学习
7.下列关于人工智能的说法正确的是(　　)
A.视频聊天是常见的人工智能技术应用
B.符号主义是问题引导下的试错学习的典型代表
C.深度学习是对原始数据所蕴含的特征模式进行学习的算法模型
D.人工智能技术将人类从繁重的工作中解脱出来，对社会没有负面影响
8.下列做法不利于该信息系统安全的是(　　)
A.将系统生成的3D动画在互联网上发布
B.对系统中的视频裁判开放所有权限以便他们能观察到所有数据
C.给每一位视频操作室人员分配一个绑定的“人脸识别”账号
D.系统后台管理员注销某位“提前透露世界杯比赛结果”的内部操作人员账号
9.小明搭建“室内环境监测系统”，实现如下功能：当室内亮度达到系统设定的阈值时，系统使用执行器放下窗帘，当窗台湿度达到系统设定的阈值时，系统使用执行器关闭窗户，并且系统将采集到的数据通过室内Wi Fi保存到服务器的数据库中。关于该系统的信息安全及数据传输，不正确的是(　　)
A.系统客户端获取数据库数据需通过TCP/IP协议
B.系统进行病毒防护需坚持预防为主，查杀为辅的原则
C.该系统所有的用户通过身份认证后即可访问数据库中所有系统资源
D.安装防火墙可有效防止外部网络的攻击
10.为了数据安全，如果采用异或加密。用二进制编码为″00101100″的密钥K对明文进行简单异或加密，得到密文C的二进制编码是″01010101″，那么明文对应的二进制编码是(　　)
A.00101001 B.01111001
C.01000100 D.00111000
二、非选择题(本大题共5小题，每小题6分，共30分)
11.小蓝利用Excel收集了2022年卡塔尔世界杯小组赛各支球队相关数据，并保存为“世界杯.xlsx”文件，如图a所示。然后他利用Pandas模块进行数据处理，分析小组赛中各支球队的表现。
(提示：世界杯小组赛共分成8个小组，每个小组4支球队，组内各队之间进行一场比赛，每支球队共比赛3场。)
(1)小蓝在处理数据前，首先进行了数据整理，则下列步骤正确的是________(多选，填字母)。
A.E4单元格中的数据存在逻辑错误，需要改成3
B.第7行和第8行两行数据重复，直接删除其中一行即可
C.英格兰队的所在行存在数据缺失，故无法确定具体数值
D.阿根廷所在小组的组别格式不一致，应当将其改成C
(注：全部选对的得2分，选对但不全的得1分，不选或错选的得0分)
(2)小蓝利用Pandas模块处理图a中的表格数据，其中部分Python程序代码如下。在处理数据的过程中，小蓝提出了以下三项要求。请根据他的要求在划线处填入合适的代码。
①首先计算各球队的小组赛积分。积分计算规则为：胜一场得3分，平局得1分，负一场得0分。
②然后对各球队进行小组排名。小组排名规则为：按积分降序排序。
③最后统计各小组的平均进球数，并绘制成如图b所示的图表。
import pandas as pd
import matplotlib.pyplot as plt
plt.rcParams['font.sans－serif']＝['SimSun']　#图表显示中文
df＝pd.read_excel('世界杯.xlsx')
df['积分']＝①________
dfrank＝df.sort_values(②________，ascending＝False)
print(dfrank)
df2＝df.groupby(″组别″).mean()
plt.bar(③________，label＝″平均进球″)
plt.legend()
plt.show()
(3)小蓝要从df中筛选出积分至少为4分且进球多于失球的球队，下列操作可行的是________。(注：全部选对的得2分，选对但不全的得1分，不选或错选的得0分)(多选，填字母)
A.df.净胜球>0 and df.积分>＝4　　　　　　　　　　
B.df[df['净胜球']>0][df['积分']>＝4]
C.df[(df.净胜球>0)&(df.积分>＝4)]
D.df[df['净胜球']>0]&df[df['积分']>＝4]
12.某学院投票评选学生会优秀干事，候选人共10人，选出3人，每张选票最多可勾选5人，超过5人则选票无效。经一轮投票后，若得票数前三的候选人超过3人，则需对得票数前三的候选人进行下一轮投票，直至投出结果。
小洪用Python编写投票系统，第一轮投票数据经处理后，保存在″vote2023.xlsx″文件中，部分数据如图a所示，请回答下列问题。
(1)定义check函数，功能为：读取Excel文件返回有效票数据。函数代码如下：
def check(datafile)：
df＝pd.read_excel(datafile)
df[″票数″]＝df.sum(axis＝1)－df[″序号″]　#统计每张选票的票选数
df1＝df[____________]
return df1
划线处应填入的代码为________(单选，填字母)。
A.df.票数<＝5 B.df[票数]<5
C.df.票数＝＝5 D.df[″票数″]>5
(2)统计票数前三的候选人，若有并列也统计在内，并绘制的柱形图如图b所示。部分Python程序如下，请在划线处填入合适的代码。
df＝check(″vote2023.xlsx″)
df2＝df.drop([″序号″，″票数″]，axis＝1)　#删除序号列、票数列
s＝[]；st＝[]
for i in df2.columns：
s.append([i，int(df2[i].sum())])　#统计每人选票数，格式如['李彤'，377]
for i in range(len(s))：
num＝1
for j in range(len(s))：
if ①________：
num＋＝1
if ②________：
st.append(s[i])　#存储前三名数据
for i in range(len(st))：
plt.bar(st[i][0]，③________)　#绘制柱形图
#设置图表的标题及图例数据并显示图表，代码略
(3)若对图b中5人采用投票系统进行第二轮投票，最多可投3人，5人的票数结果分别为600，211，211，589，589，则投票结果的图表中显示的候选人有________个。
13.某地高中的技术选考数据，保存在“jsxk.xls”文件中，如图a所示。
请回答下列问题：
(1)统计各学校技术选考人数占本校总人数的比例，找出占比最高的前5所学校并绘制柱形图，如图b所示。部分Python程序如下，请在划线处填写合适的代码。
import pandas as pd
import matplotlib.pyplot as plt
#图表支持中文字体显示，代码略
df＝pd.read_excel(″jsxk.xls″，dtype＝{'学校代码'：'string'})　#学校代码列为字符串
df1＝df.groupby(″①________″，as_index＝False).count()　#按学校统计人数
df1＝df1.rename(columns＝{'姓名'：'学生总数'})
#重命名列
df1['技术比例']＝round(②________/df1['学生总数']*100，2)
df1＝df1.sort_values('技术比例'，ascending＝False).head(5)
plt.title('技术选考比例前5的学校')
plt.bar(③________)
plt.show()
(2)在本问题的解决中，为了探究函数groupby()，某同学编写了自定义函数zdygroupby()，其功能为统计各校技术选考总人数，并以字典的形式返回。函数代码如下，请在划线处填写合适的代码。(注：代码中lst为二维列表，列表中每个元素包含3个数据项，格式如[['201901'，'顾筱扬'，NaN]，['201901'，'俞凯睿'，1.0]，['201901'，'陈丹祺'，1.0]……])
def zdygroupby(lst)：
dic＝{}
for row in lst：
if row[2]＝＝1：
　　　　if ①________：
　　　　　　dic[row[0]]＝1
　　　　 else：
　　　　　　dic[row[0]]＋＝1
②________　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　
14.一球迷收集了近3个赛季的CBA比赛数据，每个赛季的数据分别保存在独立文件中，如图a所示，文件中数据记录格式如图b所示，以球员“布莱克尼”的“二分”数据“7.9～16.3”为例，7.9表示二分球平均命中数量，16.3表示二分球平均投篮次数。
该球迷想根据历史赛季数据预测各球队下个赛季的首发阵容，编写了如下Python程序，请回答下列问题。
(1)定义readData函数，功能为：读取某赛季的excel文件，返回每个队员的得分(得分＝二分球命中数量*2＋三分球命中数量*3＋罚球命中数量)。函数代码如下，划线处应填入的代码为________(单选，填字母)。
A.df[″得分″][i]＋＝n*cols[col]
B.df[″得分″][i]＝n*cols[co1]
C.df[″得分″]＋＝n*cols[col]
D.df[″得分″]＝df.二分*2＋df.三分*3＋df.罚球
import pandas as pd
def readData(file)：
df＝pd.read_excel(file)　#读取文件file中的数据
cols＝{″二分″：2，″三分″：3，″罚球″：1}
for i in range(len(df))：　#计算每个队员的得分
　　　　for col in cols：
　　　　 p＝df[col][i].find(″－″)　#在字符串中找到“－”的位置
　　　　n＝float(df[col][i][：p])
　　　　________________
return df
(2)定义select函数，功能为：筛选各球队得分最高的5名球员作为首发阵容，并把球员名字及得分存入列表members后返回。其中n号球队各球员名字存入members[2*n]中，得分存入members[2*n＋1]中，请在划线处填写合适的代码。
def select(teams)：
#teams是字典变量，如：{″浙江″：0，″上海″：1}，字典的值代表球队编号
seasons＝[″20－21″，″21－22″，″22－23″]
members＝[0]*len(teams)*2
df＝readData(seasons[0]＋″.x1sx″)
for season in ①________：
file＝season＋″.xlsx″
df1＝readData(file)
df＝pd.concat([df，df1])　#合并两个DataFrame对象数据
for team in teams：
df1＝②________
df1＝df1.groupby(″球员″，as_index＝False).mean()　#计算各球员平均得分
df1＝df1.sort_values(″得分″，ascending＝False).head(5)　#按得分降序排序并选取前5名
③________
members[2*n]＝df1[″球员″].values
members[2*n＋1]＝df1[″得分″].values
return members
(3)定义showChart函数，功能为：查询某球队的首发阵容，绘制柱形图，图表如图c所示，程序如下，请在划线处填写合适的代码。
import matplotlib.pyplot as plt
def showChart(tean，menbers)：
n＝teams[team]
plt.bar(________，________)
plt.title(team＋″队首发阵容″)
plt.show()
(4)主程序代码如下。
teams＝{″浙江″：0，″上海″：1，″山东″：2，″广东″：3，″北京″：4}
members＝select(teams)
while True：
team＝input(″输入球队：″)
if team＝＝″″： break
showChart(team，members)
15.小王通过扫描仪获取到技术周考的学生信息技术单选题答题信息，记录了学生每个小题的答题选项，如图a所示。
为了统计分析出每一小题的答题情况，小王编写了Python程序，请回答下列问题：
(1)分析学生每个小题的A，B，C，D选项的占比，代码如下：
import pandas as pd
import matplotlib.pyplot as plt
plt.rcParams[(″font.sans－serif″)]＝[″KaiTi″]
df＝pd.read_excel(″ITdata.xlsx″)
stunum＝len(df)
for i in range(1，13)：
print(″第″＋str(i)＋″小题″)
for k in ″ABCD″：
t＝________
print(k＋″：″，round(len(t)/stunum*100，2)，″%″)
该程序段运行结果的部分界面如图b所示。划线处填入的代码为________(单选，填字母)。
A.df[″单选″＋str(i)]＝＝k
B.df[df[″单选″＋str(i)]＝＝k]
C.df[[″单选″＋str(i)]＝＝k]
D.df[df[″单选″＋str(i)]]＝＝k
(2)计算出全班学生的各小题得分并统计各小题平均分，绘制出线形图(如图c所示)，部分Python程序如下，请在划线处填入合适的代码。
sans＝″CBCABCABDABD″　#本次单选题的标准答案
qnum＝list(df.columns)
for i in df.index：
for j in range(2，14)：
if df.at[i，qnum[j]]＝＝①________：
　　　　 r＝2　#回答正确得2分
else：
　　　　 r＝0　#回答不正确得0分
df.at[i，qnum[j]]＝r
aver＝[]
for j in qnum[2：]：　#统计各单选题的平均分
aver.append(②________)
plt.③________(qnum[2：]，aver，label＝″平均分″)
plt.legend()
plt.show()
(3)由图b可知，12道选择题中难度最低的是“单选”________。
第三单元　数据处理与安全
1.B　[A选项符号主义包含知识库和推理引擎两个部分。]
2.C　[A选项强化学习在学习过去知识的过程中不断提升。]
3.C　[C选项机器客服与人类客服一起合作回答客户问题属于混合人工智能。]
4.C　[①⑤是软件功能，②是图像识别，③和④是语音合成与语音识别。]
5.D　[D选项联结主义通过模仿人类大脑中神经元之间的复杂交互来进行认知推理。]
6.B　[基于数据的是联结主义。]
7.C　[A选项视频聊天是软件功能。B选项是行为主义是问题引导下的试错学习的典型代表。]
8.B　[本题考查信息系统安全。B选项要设置合适的权限，才有利于信息系统的安全。]
9.C　[本题考查信息系统安全。C选项每个用户应该有自己的权限，访问相应的资源。]
10.B　[异或指相同为0，不同为1。]
11.(1)AD　(2)①df.胜*3＋df.平　②'积分'或by＝'积分'③df2.index，df2.进球　(3)BC
解析　本题考查Pandas及数据处理相关知识。(1)略。(2)由积分规则可知①空填：df.胜*3＋df。②空按积分降序排序。③图表数据源来自df2，由于df按组别进行分组求平均时，默认分组字段为索引，因此图表的x轴数据来自df2.index，y轴为df2.进球。(3)dataframe中进行多条件筛选时，条件之间可以用“&”连接，表示且的关系；B选项先用df[df['净胜球']>0]操作筛选出所有进球多于失球的队伍，得到一个DataFrame对象，再把这个对象看作整体，使用[df['积分']>＝4]操作，就能够得到同时满足这两个条件的队伍。
12.(1)A　(2)①s[j][1]>s[i][1]　②num<＝3　③st[i][1]　(3)3
解析　本题考查Pandas数据统计。(1)每张选票最多可勾选5人，且符合字典票标记或属性标记。(2)①统计名次，num初值为1，找出大于该生的选票数就是该生的名次。②存储前三名数据，num表示名次。③制作图表的数据源。从制作的图表来看，横坐标为前三的学生姓名，纵坐标为他们的得票数。(3)找出前三名的人数不超过3人。
13.(1)①学校代码　②df1['技术']　③df1['学校代码']，df1['技术比例']　(2)①row[0] not in dic　②return dic
解析　本题考查Pandas模块数据处理。(1)①按学校统计人数，分组的字段名为学校代码。②姓名列的值为每个学校的总人数，技术列的值为每个学校选技术的人数，③横坐标为df1['学校代码']，纵坐标为df1['技术比例']。(2)①如果key(学校代码)不在字典中，执行相应键值对添加的语句。②相应数据以字典的形式返回。
14.(1)A　(2)①seasons[1：]　②df[df.球队＝＝team]　
③n＝teams[team]　(3)members[n*2]，members[2*n＋1]
解析　本题考查Pandas数据处理和可视化。(1)遍历每位队员的二分、三分和罚球的平均命中数量，根据公式求队员的3种投篮得分之和。col是字典中的键(二分、三分和罚球)，cols[col]是投篮得分，df[col]表示二分等某列值数据，p是第i位球员命中数量和投篮次数分隔位置，因此n*cols[col]的乘积之和是该球员总得分。(2)①seasons列表中存储了3场比赛的文件名，将这3个文件合并为一个文件。语句df＝readData(seasons[0]＋″.x1sx″)已经读取第1个文件，需对剩余的文件进行合并。②筛选各球队得分最高的5名球员作为首发阵容。teams是字典变量，键是球队名称，对每个球队进行遍历，筛选出该队全部队员，找出在3场比赛中得分最高的5名球员。③取出球队编号，将每个球队的球员姓名和得分存储到members对应的数组元素中。teams字典值为球队的编号，members中元素个数为len(teams)*2，n号球队各球员名字存入members[2*n]中，得分存入members[2*n＋1]中。(3)略。
15.(1)B　(2)①sans[j－2]　②df[j].mean()　③plot　(3)10
解析　(1)变量i的值从1至12，表达式″单选″＋str(i)表示字段名，依次筛选出学生每个小题的A，B，C，D的数量。(2)①遍历df的每一行，qnum是字段名列表，变量j从2开始，因此答案在sans字符串j－2对应的位置。②变量j是每个字段名，因此只要统计该列的平均值即可。③略。(3)略。

展开更多......

收起↑

请用微信扫码

2025届信息技术一轮复习单元检测：第三单元 数据处理与安全（含解析）

2025届信息技术一轮复习单元检测：第三单元 数据处理与安全（含解析）

2025届信息技术一轮复习单元检测：第三单元　数据处理与安全（含解析）

2025届信息技术一轮复习单元检测：第三单元　数据处理与安全（含解析）