资源简介 第三章 数据处理与应用 章节测试一、选择题1.下列设备中通常不能用于图像数据采集的是( )A.扫描仪 B.显示器 C.智能手机 D.数码相机2.李军同学在做研究性学习时,想通过问卷调查了解人们垃圾分类的情况,遇到了以下难题,请你帮他完成。请根据以上情境,完成此题。问卷的发放、填写、回收的过程主要属于数据处理的什么阶段( )A.数据采集 B.数据分析 C.数据呈现 D.数据整理3.数据安全主要的威胁是( )①计算机病毒②黑客攻击③数据存储介质损坏④个人失误⑤数据备份A.①②③④ B.①②③⑤ C.①②④⑤ D.②③④⑤4.利用计算平均数的方法,可以反映总体在一定时间、地点条件下数据特征的数据分析方法是( )A.对比分析法 B.平均分析法 C.交叉分析法 D.总结分析法5.下列关于数据采集的说法,正确的是( )A.传感器是数据采集必须使用的设备 B.采集的数据必须经过计算机加工才能够被使用C.扫描二维码是手机获取日常所需数据的唯一来源 D.“智能运动手环”可以获取运动数据6.如果设置某网络账号的密码,以下密码安全性最高的是( )A.123123 B.abcdef C.qq16888 D.Asd#2GY7.在高一半期考试后,现需分析每个班的平均成绩,选用下列哪种分析方法最合适( )A.对比分析 B.平均分析 C.聚类分析 D.案例分析8.为了防止丢失重要数据,应该对其进行( )A.备份 B.杀毒 C.格式化 D.可视化9.某班主任对班级的所有同学考试进行多次对照分析后,找到每位同学的薄弱学科和优势学科,这样的分析方法属于( )A.对比分析法 B.总体分析法 C.平均分析法 D.结构分析法10.小明U盘上存储的数据因人为失误不小心彻底删除了,不能找回。针对这样的情景,对于重要的数据应该采用什么方式保护数据的安全( )A.数据备份 B.数据加密 C.设置防火墙 D.打开杀毒软件11.下列哪种分析法不是常用数据分析的基本方法( )A.横向分析 B.纵向分析 C.平均分析 D.感性分析法12.通常情况下,以下相同长度的密码哪种安全级别最高( )A.纯英文 B.姓名首拼+手机号码C.姓名全拼+生日 D.大小写字母+数字+特殊符号13.数据分析广泛应用于社会各个领域,常见的数据分析方法有对比分析法、平均分析法和结构分析法等,关于对比分析法,以下说法中错误的是( )A.对比分析分为横向和纵向对比两大类 B.分析事物内部的结构和部分与整体之间的关系C.对比分析法将两个或两个以上的数据进行比较 D.对比分析法能够说明研究对象的规模大小14.数据采集是指人们根据需要获取数据,以下不能获取数据的是( )A.问卷调查采集数据 B.利用传感器采集数据C.调整表格中数据的字体大小 D.通过网络获取数据15.数据可视化表达是为了更加直观形象地呈现数据,下列关于数据可视化表达不合理的是( )A.利用折线图呈现多次考试成绩的变化趋势B.利用条形图展示娱乐节目参赛选手的得票情况C.利用雷达图对比两个用户在购买频率、购买商品种类等5个维度上的差异D.利用饼图反映游客人数与节假日关系二、填空题16.数据分析方法中, 就是分析并发现存在于大量数据之间的关联性或者相关性,从而描述一个事物中某些属性同时出现的规律和模式。17.平均分析就是运用 的方法,来反映总体在一定时间、地点条件下某一数量特征的 。18. 是指将两个或两个以上的数据进行比较,分析它们的 ,从而揭示这些数据所代表的事物发展变化 。对比分为 对比和 对比。横向对比指的是 的事物之间进行比较;纵向对比指的是和 事物的 进行比较。19.数据分析的常用方法有 、 等。20.对数据进行分析,首先要根据分析的目标 ,然后选择恰当的 进行分析, 是否正确,继而得出相应的结论。三、判断题21.在信息社会活动中,数据的价值日益凸显,因此,养成良好的数据备份习惯,有助于避免因为重要数据丢失而给工作和学习造成损失。( )22.高中生的个人数据泄密或丢失造成的损失和影响很小,可以不必在意数据的保护。( )23.由于学校计算机教室的服务器硬盘损坏,导致学生微电影作品丢失。该案例中的数据安全威胁属于个人失误。( )24.在计算机操作系统上安装杀毒软件和防火墙是一种数据保护方法。( )25.现在的数据加密技术很成熟,加密后的数据不会泄露。( )四、操作题26.小李利用他所学习的知识帮助老师整理并统计本次考试的成绩,成绩文件"cj.xlsx"的部分界面如图a所示:图a(1)在整理数据时发现一些数据问题,下列说法不正确的是 (单选,填字母)A.“赵正”同学有两条数据,需要进行数据合并处理B.“徐子言”同学的信息成绩51分,属于异常数据C.对于表格中的缺失数据,通常采用平均值、中间值或概率统计值来填充缺失值。(2)数据整理完毕后,为统计学生“信息”全校排名,选中F2单元格输入公式,然后利用自动填充完成F2:F201的数据计算,发现结果有误,请修改F2单元格的计算公式 (提示:RANK函数用于计算某单元格中数据在某区域内的排名,如=RANK(D2,D2:D201),计算D2单元格中数据在D2:D201的排名)(3)为了统计5个班级的平均分以及平均分最高的班级(若有多个班级平均分同时最高,取班级号最小的班级),小李编写了Python程序,运行界面如图b所示:图bPython代码如下,请在划线处填入合适的代码。import pandas as pda=[0,0,0,0,0,0] #用于统计班级总分,下标0不使用b=[0,0,0,0,0,0]#用于统计各班人数,下标0不使用c=[0,0,0,0,0,0]#用于存储各班平均分,下标0不使用df=pd. ① ("cj.xlsx")for i in range(len(df)): bj=int(df.at[i,"班级"]) a[bj]+=df.at[i,"信息"]+df.at[i,"通用"] b[bj]= ②for i in range(1,len(a)): c[i]=a[i]/b[i] print(i,"班的平均分为:",c[i])maxx=0pos=0for i in range(1,len(a)): if ③ : maxx=c[i] pos=iprint("平均分最高的班级为",pos,"班,平均分为:",maxx)27.为了解学生在食堂和校园超市的消费情况,学校把9月1-4日各个窗口的消费数据导出并保存在“eat.xlsx”文件中,数据格式如图1所示。如图2所示,1-14号窗口为食堂一楼,15-28号是食堂二楼,29-34号是校园超市。图1 图2 图3用python读取该文件并作数据分析后输出如图3所示结果,请回答下列问题。(1)读入数据后,需要将数据集df中的数据按窗口号设置相应的位置信息:#引用pandas及matplotlib,并设置参数,代码略df = pd.read_excel('eat.xlsx') df['位置']=" #增加'位置'列,初始值为空for i in ①____: if df['窗口'][i] <=14: df['位置'][i] ='食堂一楼' elif ②____: df['位置'][i] ='食堂二楼' else: df['位置'][i] ='校内超市'划线①处应填写代码: (单选,填写字母:A.df.index /B.df.columns /C.df.values)划线②处应填写代码:(2)完成窗口号设置后,统计各个位置的金额总和,代码如下:a=['校内超市','食堂一楼','食堂二楼']b = [0,0,0] #存储各个位置的消费总金额for x in df.values: for i in range(3): if x[5] == a[i]: ①____plt.bar(②____)#输出如图3所示图表plt.show()划线①处代码为: ,划线②处代码为: 。(3)观察图3可知,消费总金额最多的位置是 (单选,填字母)。A.校内超市 B.食堂一楼 C.食堂二楼28.李老师统计了某次考试各班学生的选择题答题情况(共12个小题,每小题答对记2分,答错记0分),数据存储在“score.xlsx”文件中,如图1所示。为计算每班选择题平均分(选择题平均分是指12个小题的平均分之和),同时找出选择题平均分最高的3个班级,李老师通过Python编程进行数据处理,并以图表的形式呈现结果。(1)实现上述功能的Python程序如下,请在划线处填入合适的代码。import pandas as pdimport matplotlib.pyplot as pltimport numpy as npplt.rcParams['font.sans-serif']=['SimHei'] #显示中文字符,字体为黑体df=pd.read_excel("① ")pjf=df.groupby("班级",as_index=False).mean()pjf= pjf.drop("考号",axis=1)pjf["选择题平均分"]= ②y1=pjf.min()["选择题平均分"]y2=pjf.max()["选择题平均分"]px=pjf.sort_values("选择题平均分",ascending=False)print(px)s= px.head(3)plt.figure()plt.bar(s.班级, ③ )plt.title("选择题平均分最高的3个班级")plt.ylim(y1-0.2,y2+0.2)plt.yticks(np.linspace(y1-0.2,y2+0.2,20)) #设置y坐标轴的刻度plt.show()(2)运行该程序段后,绘制出的图表如图2所示,则该图表的类型是 (填字母:A.线形图 /B.垂直柱形图 /C.水平柱形图 )。参考答案1.B2.A3.A4.B5.D6.D7.B8.A9.A10.A11.D12.D13.B14.C15.D16.关联分析17.计算平均值 一般水平18.对比分析 差异 情况和规律 横向 纵向 类似或者同类 相同 不同时期19.对比分析 平均分析20.提出假设 分析方法 验证假设21.正确22.错误23.错误24.正确25.错误26.B =RANK(D2,$D$2:$D$201) 或 =RANK(D2,D$2:D$201) read_excel b[bj]+1 c[i]>maxx27.A df['窗口'][i] <=28 b[i]+=x[3] 或 b[i]=b[i]+x[3] a,b C28.score.xlsx pjf.sum(axis=1) s.选择题平均分 或 s["选择题平均分"] B 展开更多...... 收起↑ 资源预览