第五单元 数据分析与人工智能 单元测试(含答案)2022-2023学年教科版(2019)高中信息技术1

资源下载
  1. 二一教育资源

第五单元 数据分析与人工智能 单元测试(含答案)2022-2023学年教科版(2019)高中信息技术1

资源简介

第五单元 数据分析与人工智能 单元测试
一、选择题
1.下列选项中,不属于数据分析的作用的是( )
A.了解事物的现状 B.剖析事物的发展历程
C.预测事物的未来方向 D.获取事物的数据信息
2.下面是几个信息技术应用的描述①入户门锁提供指纹识别功能②将图像中的汉字识别出来③计算机以字形码显示汉字④进入办公楼时需要通过人脸识别开启门禁。下面关于体现了人工智能技术应用的项目组合中,正确的是( )
A.①②③④ B.①②③ C.①②④ D.②③④
3.字节跳动公司下的抖音APP、今日头条APP利用强大的算法对用户观看内容、时长、操作行为等大数据进行处理,及时洞察用户需求提供精准服务以保持用户黏性,对用户行为数据处理的过程属于( )
A.数据分析 B.数据可视化表达 C.数据采集 D.数据存储
4.阅读下列材料,回答问题:
某餐厅点餐系统的部分功能是:顾客扫描二维码进入菜单界面,选择菜品后提交订单信息到系统服务器,服务器根据提交的订单信息进行智能统筹处理,并将备菜流程实时提供给厨房,厨房对流程进行语音确认,便于顾客知道能否对订单进行修改;顾客餐后可以通过在线支付或者现金支付方式进行结算,系统对订单信息进行统计分析,自动生成餐厅年月日的报表。
下列关于该系统功能和应用的说法不正确的是( )
A.对外部环境的依赖是该系统最大的局限性
B.该系统的使用可以提升餐厅的管理效率
C.该系统只具有数据输入和处理功能,不具有输出等功能
D.服务器基于数据分析的智能统筹处理,为厨房的备菜流程提供了科学的决策
5.关于对比分析法中错误的是( )
A.是将两个或两个以上的数据进行比较,分析差异,揭示出这些数据所反映的事物规律的方法
B.通常用于从数量上展示和说明研究对象规模大小、水平高低、速度快慢及各种关系是否协调等
C.是将各个部分与整体进行对比,是分析事物内部的结构和部分与整体之间关系的方法
D.分为横向和纵向对比两大类
6.对两个或多个数据进行比较,常用对比分析法,通过分析其间的差异,揭示变化情况和规律。以下关于对比分析法的叙述中,不正确的是( )
A.只有对同—时间的数据才能对比 B.对比的对象要有可比性
C.对比数据的计算单位必须一致 D.对比的指标必须统一
7.下列关于数据处理描述错误的是( )
A.根据需求分析的目标不同,数据处理的流程也不同
B.数据必须经过某种方式处理后,才具体实际意义
C.数据整理是对数据进行校验和标准化的过程
D.数据分析可以让我们了解事物的现状、剖析其发展历程和预测未来走向
8.某同学将上学期期末考试成绩和这学期期末考试成绩进行各学科的比较分析得出语文学科和英语学科有进步,数学和物理等学科有所退步的结论,这样的分析方法属于( )
A.纵向对比分析法 B.横向对比分析法 C.平均分析法 D.结构分析法
9.如图,对平均工资进行分析,以反映2020年广西城镇单位从业人员平均工资水平。这种数据分析方法是( )
A.平均分析法 B.对比分析法 C.交叉分析法 D.结构分析法
10.图表中数据存在的问题是( )
A.数据重复 B.数据缺失
C.数据逻辑错误 D.数据格式不一致
11.南水北调是一项跨世纪的重大工程。实施前,有关部门进行了广泛深入的研究,做了大量的数据处理工作。要想了解我国部分地区水库蓄水情况,需要经历的数据处理过程主要有以下若干环节,具体实施时这些环节的正确排序是( )
① 利用柱形图直观地呈现分析结果
② 分析黄河流域和长江流域近年来降水量、水位情况等数据
③ 通过国家统计和水利等部门的官方网站获取关于水库蓄水的权威数据
④ 对水文资料数据进行整理、纠错,并将有效数据设置为两位小数的数据格式
A.①②③④ B.③④①② C.③④②① D.④③②①
12.我国政府部门开发的精准扶贫大数据云平台能够汇集各地相关数据,通过对数据的提取分析获得了贫困人口的致贫原因等有价值的信息,为扶贫工作提供了真实可靠、及时全面的决策数据。这种从规模巨大的、不完全的数据中,分析并提取有潜在价值信息的技术称为( )
A.大数据存储与管理技术 B.大数据分析与挖掘技术
C.大数据可视化与应用技术 D.大数据预处理技术
13.运用计算平均值的方法反映总体在一定时间、地点条件下某一数量特征的一般水平,这种数据分析方法称为( )
A.计算分析 B.总体分析 C.平均分析 D.数量分析
二、简答题
14.自新型冠状病毒变为乙类乙管以来,全国文化和旅游行业在强劲复苏的基础上,乘势而上,跑出发展“加速度”。全国各地持续出台利好政策,积极推动文化和旅游加速复苏和深度融合发展。随着旅游业的复苏,全国铁路、航空运输客运量如表所示。其中,人公里是运输计算客运量的单位,表示运送旅客人数与运送距离的乘积。(数据来源于国家数据统计局 http://www.stats./)
(亿人公里) 2022年10月 2022年11月 2022年12月 2023年1月 2023年2月
铁路旅客周转量 436.36 277.25 400.31 1031.29 1107.39
民航旅客周转量 240.9 200.66 307.85 641.19 697.16
(1)你认为表格中的数据可靠吗?为什么?
(2)为呈现数据分析的结果,某同学编写了如下所示代码。请问此程序绘制出了什么类型的图表?此类图表的优势是什么?
import matplotlib.pyplot as plt x=["22-10","22-11","22-12","23-1","23-2"] y=[240.9,200.66,307.85,641.19,697.16] plt.plot(x,y) plt.show()
(3)常用的数据分析方法有对比分析法、平均分析法和结构分析法。问题(2)中同学的分析使用了何种数据分析方法并阐述选择该分析方法理由。
三、操作题
15.张三同学收集了一个地区8月各类共享单车的骑行数据记录,每天的用户数据存储于“sharedbikes.xlsx”文件中,不考虑跨天数据。数据格式如图a所示,请回答下列问题:

图a
(1)cal函数功能为:读取骑行时间的小时和分钟部分,转换为分钟格式并返回,如“2022/8/206:57”获取“6:57”转换为417(6*60+57=417),代码如下。请在划线处填入合适的代码。
defcal(s):
n=len(s)
for i in range(n)
ifs[i]=="":#如果为空格字符
p=i
ifs[i]==":":
q=i
t= +int(s[q+1:])
returnt
(2)统计本月各类型单车的每天平均骑行时长,并绘制柱形图,代码如下,绘制的图表如图b所示,请在划线处填入合适的代码。

图b
Importpandasaspd
Importmatplotlib.pyplotasplt
df=pd.read_excel("sharedbikes.Xlsx")
bike=["哈罗单车","摩拜单车""美团单车","青桔单车"]
sm=[0]*4
avg=[0]*4
days=31
foriin ①:
t=cal(df.At[i,"结束时间"])—cal(df.At[i,"开始时间"])
for j in range(4)
ifdf.at[i,"App类型"]==bike[j]:

break
for i in range(4):
avg[i]=sm[i]/days
plt.figure(figsize=(12,4))
x=bike
y= ③
plt.bar(x,y)
plt.show()
(3)统计本月各类型单车的骑行次数,下列加框处代码有错,可以改正为 (选填字母)
A.max()/B.min()/C.mean()/D.count())/
n=dr.groupby("App类型",asindex=True),用户编号.
16.某校高三年级开展体质健康测试,数据存储在Excel文件中,部分数据如图a所示。
图a
请回答下列问题:
(1)定义finenum函数,功能为:读取各班级的总分等级,返回等级为“优秀”的个数。函数代码如下,划线处应填入的代码为 (单选,填字母)。
A.df.总分等级="优秀"
B.df[df.总分等级=="优秀"]
C.df[df[总分等级]="优秀"]
D.pd[pd.总分等级=="优秀"]
import pandas as pd
def finenum(df):
df1=
return dfl.groupby("班级编号").count()
(2)将数据整理后存储在“health.xls”文件中,编写Python程序,统计各班体测优秀率,并绘制图表,如图b所示。
图b
部分Python程序如下,请在划线处填入合适的代码。
import matplotlib.pyplot as plt
df=pd.read _excel("health.xls")
data=finenum(df)
y=[0]*16
classnum=[33,37,35,34,37,47,44,35,32,33,45,41,46,38,43,45]#各班级人数
i=0
while ① :
y[i]=②
i=i+1
x= ③
plt.plot(x,y,color="c")
#设置绘图参数,显示如图b所示线形图,代码略
(3)若该校要表彰体测优秀率最高的班级为“体能之班”,由图b可知,需要表彰的班级是 班。
17.某城市引入内涝预警系统,实时监测河道水位和地道桥的积水情况,并根据设定的阈值自动触发调节系统和报警装置,该系统的结构示意图如图a所示。Web服务器端程序采用Flask Web框架开发。请回答下列问题:
图a
(1)图a中①②处表示的硬件设备名称分别是 (单选,填字母)。
A.传感器、传感器 B.执行器、传感器 C.传感器、执行器
(2)在设计“城市内涝预警系统”的过程中,需要进行输入设计、输出设计和人机界面设计等,这一过程属于 单选,填字母)。
A.需求分析 B.可行性分析 C.概要设计 D.详细设计
(3)该系统网络应用软件的实现架构是 (选填,填字母:A.B/S架构/B.C/S架构)。
(4)若某监测点的积水高度超过50厘米时,系统将发布一级内涝预警。负责人想了解昨天各监测点的平均积水高度,以及各监测点发布一级内涝预警的次数。于是管理员将昨天的监测数据导出为文件“监测点积水数据.xlsx”,数据格式如图b所示,并制作图表(如图c所示),部分程序代码如下,请在划线处填入合适的代码。
图b图c
df=pd. read_excel("监测点积水数据xlsx")
waterline_ avg=df. #计算各监测点的平均积水高度
print (waterline_ avg)
x=df. colunns[1:] #取出列标题
y=[]
for i in x:
df1=df[ ]
counts=len (df1)
y. append (counts) #添加到列表
plt. bar(x, y, labe1="一级预警次数") #绘制柱形图
#设置图形参数并显示图形,代码略
18.游老师统计了 2013 年至 2021 年每年专科、本科、硕士和博士的毕业人数 (单位:万人) ,数 据保存在“Graduate.csv”中,如图a所示。
图a
(1) 统计每年的毕业总人数并绘制柱状图,请在划线处填写合适的代码。
import pandas as pd
import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif']=['simhei']
df=pd.read_csv("Graduate.csv")
df.共计= ①
x=df["年份"]
y= ②
plt.bar(x,y)
#设置绘图参数,绘制线型图,代码略
(2) 游老师编写如下代码用来统计毕业人数增长率最高的年份,增长率相同的年份同时输出。 请在划线处填写合适的代码。输出结果如图 b 所示
图b
注:2014 年增长率= (2014 年毕业人数-2013 年毕业人数) /2013 年毕业人数
data=df["共计"].values.tolist() #将每年毕业总人数数据转换成列表
year=["2014 年","2015 年","2016 年","2017 年","2018 年","2019 年","2020 年","2021 年"]
rate=[];imax=[0]
for i in range( 1,len(data)):
rate.append(round( ① ,4))
for i in range(len(rate)):
print(year[i],"增长率为:",rate[i])
for i in range( 1,len(rate)):
if ② :
imax=[i]
elif rate[imax[0]]==rate[i]:
imax.append(i)
print("毕业人数增长率最高的年份是:",end="")
for i in range(len(imax)):
print( ③ )
四、填空题
19.动态热力图一般用于数据关系分析中 的可视化呈现。
20.通过报告不仅是把数据分析的起因、过程、结果及建议完整的展现出来,更为决策者提供科学、严谨的决策依据。 ( )
21.大数据是以 大、 多、 快、 高为主要特征的数据集合,它正快速发展为对数量巨大、来源分散、格式多样的数据进行 、 和 ,从中发现新知识,创造新价值、提升新能力的新一代信息技术和服务业态。
22.数据分析报告是项目 的展示,也是数据分析结论的有效承载形式。在数据分析报告中,首先需要明确数据分析的 ,阐述目前 及通过分析希望解决的问题;其次需要描述数据来源和数据分析的 、 和 ;最后需要重点呈现数据分析的 、 和 。
23.以图形、图像和动画等方式更加直观生动地呈现数据及数据分析结果,揭示数据之间的关系、趋势和规律等的表达方式称为 表达。
五、判断题
24.数据分析一般包括特征探索、关联分析、聚类与分类、建立模型和模型评价等。( )
25.数据分析方法只有对比分析法和平均分析法两种。( )
26.张三想要调查“中学生课外阅读倾向”,可以采用腾讯在线文档对数据进行统计与分析。( )
27.数据分析的目的是提取有用信息,并形成结论或观点,从而指导决策。( )
28.可以用于分析数据趋势的可视化呈现类型包括折线图、分组柱形图、堆叠柱形图和柱线混合图等。( )
参考答案:
1.D
2.C
3.A
4.C
5.C
6.A
7.A
8.A
9.A
10.A
11.C
12.B
13.C
14.(1)我认为表格中的数据比较可靠,因为数据来源于官网。
(2)此程序绘制出了折线图,此类图表的优势是易看出变化趋势。
(3)对比分析法,选择这种分析方法理由阐述清即可。
15.int(s[p+1:q])*60 df.index或range(len(df)) sm[j]+=t avg D
16.B i<16 data.总分[i+1]/classnum[i]或data["总分"][i+1]/classnum[i]或其它等价答案 [1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16] 5
17.B D A mean( ) df[i]>50
18.df["专科"]+df["本科"]+df["硕士"]+df["博士"] 或 df.专科+df.本科+df.硕士+df.博士 df["共计"] 或 df.共计 (data[i]-data[i-1])/data[i-1] rate[imax[0]]19.空间关系
20.对
21.容量 类型 存取速度 应用价值 采集 存储 关联分析
22. 研究结果 目的和背景 存在的问题 思路 方法 模型 过程 结论 建议
23.数据可视化
24.正确
25.错误
26.正确
27.正确
28.正确

展开更多......

收起↑

资源预览