资源简介 综合测试卷-2023—2024学年浙教版(2019)高中信息技术选修3一、选择题1.需求分析中,开发人员要从用户那里解决最重要的问题是( )A.让软件做什么 B.软件能存储多少信息C.软件的工作效率如何 D.让软件具有何种结构2.网格员准备做一份关于社区老龄化的数据分析报告。下列说法正确的是( )。A.该报告要有社区老龄化数据分析的结论与建议B.老龄化数据分析的目的与背景在报告中可以忽略C.报告中数据来源、质量可以不用说明D.报告中关于数据分析的思路与方法可以略写或不写3.针对某路公交车高峰拥挤时段情况数据分析时,下列选项中相对合适的分析方法是( )。A.纵向平均分析 B.纵向对比分析 C.横向对比分析 D.横向平均分析4.不能用于分析逻辑关系的是( )A.散点图 B.雷达图 C.折线图 D.词云图5.用某个条件对数据清单进行“自动筛选”后,不符合条件的数据将被( )A.隐藏 B.彻底删除 C.单独显示 D.撤销6.为了更好地了解某地的水质情况,科研人员采集了该地各监测点当天的水质数据。数据中包含了各监测点的水质类别、水温(℃)、pH、溶解氧(mg/L)、高锰酸盐指数(mg/L)。通过数字化学习,小申了解到水质类别从高到低分为1-5类,级别最高(质量最好)为1,级别最低(质量最差)为5。采集的水质数据如表所示,小申使用Python的数据分析核心库pandas提供的方法进行数据整理。经检查确认,对于同一监测点出现多条记录的情况,视为重复记录,只需保留其中的第一条。若读取的数据存放在变量df中,以下方法中能够正确去重的是( )监测点名称 水质类别 水温 pH 溶解氧 高锰酸盐指数监测点 1 4 24.8 7.25 4.77 5.16监测点 2 3 23.6 7.56 5.62 3.54监测点 3 5 24 6.99 2.45 4.75…… …… …… …… …… ……监测点 9 4 25 7.33 4.16 5.84监测点 2 3 23.6 7.56 5.62 3.54监测点 10 3 24.1 7.27 5.18 4.35监测点 11 1 23.3 7.74 7.76 1.86A.df.dropna(axis=1,how='any',inplace=True)B.df.dropna(axis=0,how='any',inplace=False)C.df.drop_duplicates(subset=['监测点名称'],keep='first',inplace=True)D.df.drop_duplicates(subset=['监测点名称'],keep='last',inplace=False)7.下列选项中,不能实现网络备份课件文件的是( )A.从电子邮箱中下载备份课件 B.从 Kugou中下载备份课件C.从手机微信中下载备份课件 D.从百度云盘上下载备份课件8.下列选项中,不属于数据可视化应用的是( )A.掌上公交 B.抖音 C.百度地图 D.滴滴打车9.数据可以用表格,也可以用图表呈现。下列说法中正确的是( )A.图表来源于表格,所以用表格更好B.图表一旦生成,便不会随表格数据的变化而变化C.可以通过修改图表来改变表格数据内容D.图形化表示更形象直观10.小明对卡塔尔世界杯十分感兴趣,于是收集相关资料制作了一张有关卡塔尔世界杯的标签云,如下图。则下列有关该标签云的说法中,不正确的是( )A.小明收集的文本资料属于非结构化数据B.在制作该标签云的过程中需要进行分词,但不需要特征提取C.在该标签云中,词语“卡塔尔”比“世界杯”的出现频率高D.该标签云不需要显示文本数据中的全部词语11.下列哪个选项是数字化可视化表达工具。( )A.数码照相机 B.搜索引擎 C.U盘 D.演示文稿12.“词云图”是数据可视化的一种方式。右图是小曲利用 Python编程对“云南”百度词条分析形成的词云图,下列说法中正确的是( )A.对文本分词后可直接创建词云,无须提取特征B.词云图必须显示该数据集中包含的全部词语C.从词云图中可以看出词语“云南”比“昆明”的出现频率高D.最能表现该数据集中文本特征的词是“铁路”13.2021年5月11日上午,国务院新闻办公室就第七次全国人口普查数据举行发布会。新闻媒体在报道该新闻时,运用 信息类型,可显著增强数据的直观可视化效果。( )A.声音 B.文本 C.图形 D.数字14.下列选项中不是数据可视化形式的是( )A.柱形图 B.雷达图 C.散点图 D.点阵图15.下列关于数据分析报告作用,不包括( )A.数据分析结果的呈现 B.记录项目实施各项日志C.数据分析项目的总结 D.为决策者提供决策依据16.关于平均分析法的描述不正确的是( )A.平均指标比总量指标更具有说服力B.平均数是综合指标,它的特点是将总体内各单位的数量差异具体化,C.利用平均指标对比某些现象在不同历史时期的变化,更能说明其发展趋势和规律D.平均分析法是运用计算平均数的方法来反映总体在一定时间、地点条件下某一数量特征的一般水平17.随着计算机的广泛应用,涌现出很多数据分析工具,下列不是数据分析工具的是( )A.图像处理软件 B.电子表格软件 C.在线数据分析平台 D.编程工具18.下图是对文本数据进行处理生成的“词云”图。图中的词语显示有大有小,显示较大的是因为这个词( )A.比较重要 B.出现次数较多 C.比较关键 D.比较流行19.常用的数据分析方法包括( )A.对比分析法、结构分析法B.平均分析法、结构分析法C.对比分析法、结构分析法、平均分析法D.对比分析法、平均分析法20.题图为统计局网站公布的中国创新指数变化情况图表。这种呈现数据的形式称为( )A.虚拟化形式 B.可视化形式 C.多样化形式 D.文字化形式二、填空题21.数据备份一般有本机备份和 两种方式。22.通过报告不仅是把数据分析的起因、过程、结果及建议完整的展现出来,更为决策者提供科学、严谨的决策依据。 ( )23.以图形、图像和动画等方式更加直观生动地呈现数据及数据分析结果,揭示数据之间的关系、趋势和规律等的表达方式称为 表达。24.对数据进行分析,首先要根据分析的目标 ,然后选择恰当的 进行分析, 是否正确,继而得出相应的结论。25.数据分析是指用恰当的 方法对收集来的数据进行 ,从而得出有意义的结论的技术。三、判断题26.在数据处理中,除了可以对数值型数据进行分析外,还可以对文本、图像等数据进行分析。( )27.数据分析的方法主要有对比分析、平均分析。对比分析是指将两个或两个以上的数据进行比较,分析它们的差异,来反映总体在一定时间、地点条件下某一数量特征的一般水平。 ( )28.词云可以使得难以实现结构化的数据文本挖掘成为轻而易举的事情。( )29.数据分析中采取调查问卷,问题设计越多,得到的信息越多。( )30.数据分析方法只有对比分析法和平均分析法两种。( )四、操作题31.小明收集了某2所学校的选课情况,对应科目值为1表示选课,为空表示未选。部分文件如图a所示。图a为统计分析各个学校的各个科目选课的情况,编写Python程序。请回答下列问题:(1)数据整理。已知前3列数据均没有缺失,每个学生选课数量应该为3,小明想要查看是否有学生的选课数量不为3,若有则输出该学生的学生编号。实现代码如下,请在划线处填入合适的代码。import pandas as pddf1=pd.read_excel("1.xlsx")df2=df1.T #将df1行列转置后的结果赋值给df2flag=Truefor i in df2.columns:if ① .count()!=6: s=df2.at["学生编号",i] print("编号为",s,"的学生选课科目数量不为3!") ②if flag:print("学生选课科目数量均为3!")(2)若存在学生选课数量不为3的,则该数据存在的数据问题是 (单选,填字母:A.数据重复B.异常数据C.逻辑错误)(3)数据计算和可视化。小明将上述数据整理后,计算两所学校各个科目选课人数占学校总人数的比例,绘制如图b所示散点图进行比较,部分Python程序如下,请在划线处填入合适的代码。图bg=dfl.groupby("学校名称").count()km=["物理","化学","生物","政治","历史","地理","技术"]zb=[]for i in g.index:for j in g.columns[2:]:a=g.at[i,j]/g.at[i,"姓名"]*100plt.scatter(km,zb,label=i+"各科选课占比")zb=[]plt.title("两所中学各科目选课占比比较")plt. legend();plt. show()(4)由图可知选课比例最接近的科目是 (选填:物理/化学/生物/政治/历史/地理/技术)。32.小明为了研究某地近十年每月的温差变化,编写Python程序。以2023年4月为例,该月每天的温度数据分别保存在以8位日期字符串命名的excel文件中,部分文件如图a所示,每个文件记录了一天24小时的温度数据,如图b记录了4月28日的数据。图a 图b(1)定义dv函数,功能为:读取某天的excel文件,返回当天最高温度与最低温度的差值。函数代码如下,划线处应填入的代码为 (单选,填字母)。A.df["温度"].head(1)-df["温度"].tail(1)B.df["温度"].(max()-min())C.df["温度"].max()-df["温度"].min()D.df["温度"].(head(1)-tail(1))def dv(dayfile): df=pd.read_excel(dayfile) diff=________ return diff(2)定义find函数,功能为:用字典创建DataFrame对象,并筛选出4月份温差大于13的日期,输出结果如图c所示,请在划线处填入代码。图cdef find(r,t): dic={"日期":r,"温差":t} dfl=pd.DataFrame(dic) df2= return df2(3)绘制4月份每天的温差柱形图,部分Python程序如下,请在划线处填写合适的代码。def tstr(t): if t<10: return'0'+str(t) else: return str(t)td=[];date=[]for i in range(30): dstr=tstr( ① ) dayfile='202304'+dstr+'.xlsx' date.append(dayfile[4:8]) td.append( ② )#设置绘图参数,代码略plt.bar(date, ③ )plt.show()print(find(date,td))图d33.小王通过扫描仪获取到技术周考的学生信息技术单选题答题信息,记录了学生每个小题的答题选项,如图a所示:为了统计分析出每一小题的答题情况,小王编写了Python 程序,请回答下列问题:(1)分析学生每个小题的 A,B,C,D 选项的占比,代码如下:import pandas as pd import matplotlib.pyplot as plt plt.rcParams[("font.sans-serif")]= ["KaiTi"] df=pd.read_excel ("ITdata.xlsx") stunum=len(df) for i in range(1,13): print("第"+str(i)+"小题") for k in "ABCD" : t= print(k+":",round(len(t)/stunum*100,2),"%")该程序段运行结果的部分界面如图b 所示。图b画线处填入的代码为 (单选,填字母)A.df["单选"+str(i)]==k] B.df[df["单选"+str(i)]==k]C.df[["单选"+str(i)]==k] D.df[df["单选"+str(i)]]==k(2)计算出全班学生的各小题得分并统计各小题平均分,绘制出线形图(如图c所示),部分Python程序如下,请在划线处填入合适的代码。 图 csans="CBCABCABDABD"qnum=list(df.columns)for i in df.index :#本次单选题的标准答案 for j in range(2,14): if df.at[i,qnum[j]]== : r=2 #回答正确得 2 分 else: r=0#回答不正确得 0 分df.at [i,qnum[j]]=raver= []for j in qnum[2:]: #统计各单选题的平均分 aver.append( )plt. (qnum[2:],aver,label="平均分")plt.legend()plt.show ()(3)由图b 可知,12 道选择题中难度最低的是“单选 ”。34.某次考试一共12题,1~10题为单选题,每小题3分,11~12题为非选择题,每题10分。阅卷后系统导出小题得分存储在文件xxcj. xlsx中,部分截图如图a所示。图a小明用Python编写了程序解决如下问题。(1)读取Excel文件中的数据赋值给df,划线处的代码为 (单选,填字母)。A.read_excel B.to_axcel C.read.excel D.read_xlsximport pandas as pddf=pd. ("xxcj.xlsx")(2)分析某小题的每个班级均分情况代码如下,请在划线处填入合适的代码。dfl=df.groupby("班级").dfl=dfl.drop(’考号’,axis=l)#删除“考号”列(3)将小题均分情况做可视化处理。如输入“10”,生成如第11题图b所示的折线图。加框处代码有误,请改正。图bimport matplotlib. pyplot as pltplt.rcParams[’font.sans-serif’]=[’SimHei’] # 使图形中的中文正常编码显示tno=input("请输入题号:")plt. plot(,dfl [tno],label="各班级均分")# 绘制年级均分折线图,代码略(4)从图b可以看出,第10题超过年级均分的班级个数是 。35.某网站服务器五月(31天)的后台访问记录保存在log.xlsx文件中,如1图所示:图1请回答下列问题:(1)定义oneday函数,功能为:读取日期为day的访问记录,将访问地区依次保存在列表city中,并返回该列表。函数代码如下:import pandas as pddf = pd.read_excel ('1og. xlsx')def oneday(day):city = []for i in :if df.at[i"时间戳"][0:2] == day:city. Append(df.at[I, "地区"])return city划线处代码为: (单选:A.df.index ()/B.df.index/C. df.values()/ D.df.values)(2)统计该月每天华东五市的访问数据,并绘制线型图,部分Python程序如下,请在划线处填写合适的代码。import matplotlib.pyplot as plteastcity=["上海"、"南京","杭州","苏州","无锡"]x = [i for i in range(1, 32)]y = []t = 0for i in range(1, 32):①if i < 10:day = "0" + daycity = one day(day)for j in city:if j in eastcity: ②y.append(t)t = 0plt.plot( ③ )plt.show()(3)由图2可知,该网站本月访问量低于4万次天数共有 天。图2参考答案:1.A2.A3.B4.C5.A6.C7.B8.B9.D10.B11.D12.C13.C14.D15.B16.A17.A18.B19.C20.B21.云备份22.对23.数据可视化24. 提出假设 分析方法 验证假设25. 统计分析 计算、处理26.正确27.错28.错误29.错误30.错误31. df2[i] flag=False C zb.append(a) 物理32. C df1[df1.温差>13] 或df1[df1["温差"]>13] i+1 dv(dayfile) td33. B sans[j-2] df[j].mean() plot 1034. A mean() dfl.index 7 或七 或7个 或七个35. B 或 df. index day = str(i) t+=1 x, y 5 展开更多...... 收起↑ 资源预览