资源简介 第四章 数据处理与应用 测试卷一、选择题1.在WPS表格中,下图所示的数据处理过程通常称为( )A.查找 B.排序 C.筛选 D.分类汇总2.“二维码编码及应用”情境问题,请结合生活实际,信息技术知识和下图完成此题。小强同学周末回到家,都要向班主任老师发送周末期间的健康码和行程码等信息,健康码分别有以下三种颜色显示。身处大数据时代,下列没有涉及到大数据应用的是( )A.个人通信行程卡 B.通过手机购买高铁票C.从手机中拷贝视频文件到电脑 D.高速路出入口用ETC系统进行自动收费3.下列选项中,不属于大数据应用的是( )A.电商网站搜集客户的社交数据 B.图书管理员手工整理图书C.新零售线上线下购物体验 D.智慧导航随时呈现各条道路通畅情况4.数据可视化可以帮助人们快速获取想要的信息,以下图表更能表示每部分所占比例的是( )A.柱形图 B.折线图 C.饼图 D.条形图5.为了解贵州省某地区11月的气温变化情况,最恰当的图表是( )A.词云图 B.折线图 C.饼图 D.热力图6.在WPS表格中,计算单元格中数据平均值的函数是( )A.AVERAGE B.SUM C.COUNT D.MAX7.在WPS表格中,利用IF函数可以实现判断赋值的数据处理工作。下图中,如果在C3单元格中输入公式“=IF(B3>=92,“一级”,(IF(B3>=80,“二级”,(IF (B3>=60,“三级”,“未入级”))))”,回车确定后C3单元格中显示的值是( )A.一级 B.二级 C.三级 D.未入级8.求单元格B3-B7的平均值,选用的公式( )A.SUM(B3:B7) B.AVERAGE(B3:B7) C.SIN(B3:B7) D.RANK(B3:B7)9.词云图是一种数据可视化的表达方式,下列关于词云图的说法错误的是( )A.词云图是目前常见的关键词数据可视化表达的一种方式B.可以通过词云图快速获取文本数据中所蕴含的关键信息C.可以通过词云图直观呈现《红楼梦》书中关键词的出现频次D.词云图只能通过字体的大小表示关键词的重要程度10.某品牌牛奶企业实现大数据管理,比如利用数据分析如何配比黄金比例的饲料,帮助奶牛达到最大产奶量,下列选项中关于大数据描述正确的是( )A.大数据管理平台提供数据采集,数据计算,数据存储,数据分析,数据可视化等大量开放能力B.大数据管理平台只进行数据监察,不配备自动预警提示C.大数据管理平台不需要容纳海量的数据D.尽管大数据管理平台中已有数据分析功能,但是还需要考虑专家的建议11.下列关于大数据基本特征的描述正确的是( )A.浙江省学籍管理平台中,所有的学生身份信息数据属于大数据B.大数据辅助商家更精准的广告投放,说明大数据的价值密度很高C.气象卫星收集的数据太多了,导致进行大数据处理时,无法及时满足天气预报的需求D.大数据的数据类型比较丰富,普遍存在各种结构化、半结构化和非结构化数据共存的现象12.下列选项中,不属于大数据为人们日常生活带来便利的是( )A.移动支付 B.网络约车出行 C.网络购物 D.论文编辑13.下列选项中,属于大数据应用的是( )①基于个人信息、行为、位置等数据而进行的个性化推荐、广告 ②流感、登革热等流行病预测应用平台可以提前一周发现疫情暴发状况 ③公交信息查询软件实时反馈公交车辆的运行信息,提升乘客的出行效率 ④景区获取游客来源,分析游客密度、景点的人流趋势等为智能化管理提供参考A.①②③ B.②③④ C.①②④ D.①②③④14.下列关于大数据的说法,正确的是( )A.大数据使人们注重事物的相关性B.大数据的数据量庞大,价值密度高C.大数据的应用降低了用户隐私信息泄露的风险D.对大数据进行分析时,即可分析全体数据,也可分析抽样数据15.按照处理数据类型的不同,采取的可视化数据分析类型也不同,下面说法正确的是( )A.饼图最适合描述数据之间的大小B.柱形图适用于比较数据大小C.条形图最适合描述数据之间的变化趋势D.折线图适用于描述数据的比例16.下列关于文本数据处理描述不正确的是( )A.文本数据处理主要应用在搜索引擎、情报分析、自动摘要、自动校对、自动应答等方面B.基于词典的分词方法、基于统计的分词方法和基于规则的分词方法是常用的中文分词算法,其中基于规则的统计方法在实际应用中较多C.标签云用词频表现文本特征,将关键词按照一定的顺序和规律排列,并以文字大小的形式代表词语的重要性D.典型的中文文本处理过程主要包括:分词、特征提取、数据分析、结果呈现等17.ChatGPT是一款聊天机器人程序。ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。它使用了Transformer神经网络架构,这是一种用于处理序列数据的模型,它会通过连接大量的语料库来训练模型,这些语料库包含了真实世界中的对话,使得ChatGPT上知天文下知地理,还能具备根据聊天的上下文进行互动的能力,实现与真正人类几乎无异的聊天场景。下列关于大数据的说法,正确的是( )A.利用大量的语料库训练模型需要大数据的支持B.ChatGPT的语料库因数据体量大,只能抽样处理C.语料数据中蕴含着巨大的价值,其价值密度高D.Hadoop 适用于实时数据的流计算18.下列关于大数据与大数据处理的说法,不正确的是( )A.处理大数据时,一般采用分治思想B.大数据的处理对象是全体数据,而不是抽样数据C.大数据的特点是数据量大、速度快、数据类型多、价值密度低D.Hadoop是一个可运行于大规模计算机集群上的分布式系统基础架构,适用于处理实时数据19.气象部门想绘制某地区近十年来降雨量随时间逐年变化的图表,以推测未来若干年降雨量的变化趋势,下列最适合选用的图表类型是( )A.柱形图 B.饼图 C.散点图 D.折线图20.以下( )不属于大数据应用带来的行业变化的A.电子商务平台精准推送相关产品信息B.预测节假日旅游人流分布及趋势C.企业提供的服务和产品将会更加符合用户需求D.汽车限行缓解了交通压力二、填空题21.吴老师在撰写基础会考模拟考试成绩分析报告,其中包含了文字、表格和图表等内容。(1)他使用Excel电子表格统计学生成绩,按照总分从高到低的顺序对全部学生进行排列,应该选择图一中的什么操作 ?(2)他的电脑里安装了“记事本”、“写字板”、“Word”、“WPS”等文本处理软件。要完成这样的成绩分析报告,应该选择什么软件 ?(3)吴老师的电子邮箱地址的用户名为xiaoli,使用qq邮箱服务,学校的电子邮箱地址的用户名为bsdwnfz,使用126邮箱服务。吴老师给学校发送电子邮件,他应该填写的收信人地址是 。22.Excel工作表中函数=SQRT(49)的返回值是 。23.Excel中在单元格内要换行,可以按 快捷键。24.在Excel中,若单元格引用随公式所在单元格位置的变化而改变,则称之为________。A.相对引用 B.绝对地址引用 C.混合引用 D.3-D引用25.在Excel工作表中,B4:E6单元区域包含的单元格个数为( )。三、判断题26.2020年年初一场突如其来的新冠疫情袭击全球,我国为确保人民群众生命健康安全,迅速开启了高科技防疫模式:利用大数据快速进行流调、普及非接触式体温检测、启用楼院刷脸|门禁系统、推出场所码准确掌握进出人员信息、开通移动终端健康码行程码实时查验、 建立常态化核酸检测机制等....这些措施为有效防疫和保障经济发展发挥了至关重要的作用。请结合题目叙述回答下列问题:在政府主导下,利用大数据技术,打破原有的行业数据垄断,通过对跨行业跨区域巨量数据的综合分析,为综合防控和政府快速决策提供了有力支撑。27.数据特征探索的主要任务是对数据进行预处理,发现和处理缺失值、异常数据,绘制直方图,观察分析数据的分布特征。( )28.只在单元格B5中输入“你好”,选中B5并执行“插入”菜单下的“行”命 令,则此时“你好”所在的单元格是B6 ( )29.大数据技术中不包括大数据预处理技术。( )30.字节跳动公司的抖音APP利用强大的算法对用户观看内容的大数据进行分析,为用户提供适合用户要求的内容。其算法对数据处理的过程属于数据分类。( )四、操作题31.某校高一选课数据存储在“xk.xlsx”中,并对数据进行处理,如图a所示。 图a(1)如图a所示,已正确计算了单元格D734中的数据,若希望使用自动填充功能完成区域E734:J734的计算。则单元格D734中的公式应修改为 。(2)下列说法正确的是 (多选,填字母)。A.分析表格数据时,如遇异常数据,可以直接删除或忽略B.为了检验选课的正确性,在K列利用公式计算选课结果,其值不为3即为选课有误C.为了更直观地呈现单科占比,可以选用散点图D.可以利用筛选功能,获取选择“物化生”组合的学生数据(3)小明用Python程序按班级分类统计了各学科选修人数,并以技术学科为例自动生成如图b所示的图表,请在①②处填入合适的代码。 图bimport pandas as pdimport matplotlib.pyplot as pltdf=pd. ① ("xk.xlsx")df2=df.groupby("班级",as_index=False).sum()plt.figure(figsize=(8,4)) ② plt.title("选考科目人数")plt.xlabel("班级")plt.ylabel("技术")plt.show()①处代码应为 。②处代码应为 (单选,填字母)。A.plt.bar(df2.班级,df2.技术) B.plt.bar(df2.index,df2.技术)C.plt.plot(df2.columns[0:],df2.技术) D.plt.plot(df2.班级,df2.技术)32.我校 2019 级学生高三二模部分成绩如图 a 所示,利用该数据展开了数据的统计分析和可视化呈现。图 a请回答下列问题:(1)如图所示,M3:M21 单元格的数据由 M2 单元格自动填充而得,现已知 M2 单元格数据为各科总分,则 M2 单元格的公式为 。(2)总分前 10 名的图表如图 b 所示,该图表类型为 。图 b(3)算法思路:先按“总分”降序排序,然后利用“姓名”和“总分”前 10 名制作图表,实现的代码如下。import pandas as pdimport matplotlib.pyplot as pltfont={'family':'MicroSoft YaHei'} # 显 示 中 文plt.rc('font',** font)df=pd.read_excel("2022WZ2M.xlsx")df_sort=df.sort_values("总分", )#取总分前 10 名制作图表x=df_sort['姓名'].head(10)y=plt.bar(x,y,color='b')plt.grid(alpha=0.5) # 添 加 网 格plt.title("2022 年温州二模总分前 10 名") #添加标题plt.show()请在程序划线处填上合适的代码。(4)制作每门学科的平均分,并按技术成绩降序排序,并将结果保存在文件“2022WZ2M_TJ.xlsx” 中,分析结果如图 c 所示。 图 c实现代码如下,请在划线处填上合适的代码。xk_avg=df. ("班级") #按班级分组xkavg_mean= #计算各科班级平均分xkavg_mean.to_excel("2022WZ2M_TJ.xlsx",index=True,header=True) #保存结果文件参考答案1.D2.C3.B4.C5.B6.A7.B8.B9.D10.A11.D12.D13.D14.A15.B16.B17.A18.D19.D20.D21.排序 WPS bsdwnfz@22.723.Alt+Enter24.A25.1226.正确27.正确28.正确29.错误30.错误31.=D733/SUM($D733:$J733) 或 =D733/SUM($D$733:$J$733) BD read_excel A32.=SUM(C2:L2) 柱形图 或 垂直柱形图 ascending= False df_sort['总分'].head(10)或 df_sort.总分.head或 df_sort['总分'][:10] 或 df_sort.总分[:10] 或其它等价答案 groupby xk_avg.mean() 展开更多...... 收起↑ 资源预览