资源简介 第三章 数据处理与应用 检测练习一、选择题1.下列关于数据可视化的描述中,错误的是( )A.标签云是基于语句的文本内容可视化B.数据可视化是将数据以图形图像等形式表示C.数据可视化可以直观地呈现数据中蕴含的信息D.数据可视化增强了数据的解释力与吸引力2.图为国家统计数据库 2019年GDP结构图,这种数据呈现方式为( )A.数据的可视化表达 B.数据的文本化表达C.数据的结构化表达 D.数据的多样化表达3.下列选项中,不属于数据可视化应用的是( )A.滴滴出行 B.掌上公交 C.高德地图 D.百度网盘4.随着技术工具的发展,数据采集的方式日趋多样,下列选项中, 不属于数据采集方式的是( )A.利用传感器直接采集数据 B.通过博客发布学习体会C.从各种数据库中采集数据 D.通过问卷调查采集数据5.下列选项中,属于数据安全保护措施的是( )A.数据加密 B.数据分析 C.数据修改 D.数据可视化6.中华恐龙园是常州的景点之一,小华通过多种方式获得了中华恐龙园的相关数据,下列选项中属于直接数据的收集方法为( )A.通过访谈法获得游客们对旅游景点的看法B.通过网络搜索中华恐龙园的景点介绍C.通过宣传手册了解中华恐龙园的景点D.通过某网上的宣传片了解中华恐龙园7.通过网络爬虫或网站公开 API 等方式从网站上获取数据信息的数据采集方法是( )A.网络数据采集法 B.传感器数据采集C.系统日志采集法 D.统计报表数据采集8.要检测数据是否存在异常值,除了可以使用箱型图,还可以使用的数据分析图有( )A.饼图 B.柱状图 C.散点图 D.折线图9.小申将一个月内每天的书籍销售量绘制了箱形图,以下可以用于数据分析报告的是( )A.有两天的销售量非常高B.这个月中销售量最大的一天,值在[300,400]之间C.这个月的书籍销售量中位数在100左右D.这个月中每天的销售量差异不大10.小申想分析某个月中小说、教材等书籍的销售百分比,适用的数据分析法是( )。A.对比分析法 B.平均分析法 C.结构分析法 D.数量分析法11.以下选项中( )更适合分析数据之间的逻辑关系,帮助人们发现数据背后的价值。( )A.柱型图 B.散点图 C.饼图 D.折线图12.期末复习时有同学用“思维导图”软件梳理《高中信息技术》各章节的知识点,取得了不错的学习效果。在数字化工具中,“思维导图”属于 工具。( )A.信息获取 B.数字化可视化表达 C.信息检索 D.信息存储13.下列有关数据采集的说法,不正确的是( )A.在信息技术应用普及前,人工采集数据是主流方式B.网络爬虫工具并非在任意网站上都能短时间获取大量的数据C.互联网上向公众开放的数据可以通过应用程序接口进行采集D.数据库是一个共享数据的资源,故应彻底开放访问策略,以提高资源共享效率14.华子导入一篇文章到词云图生成软件中,生成以下词云图。根据词云图可以知道该文本内容以 为主。( )A.应用技术 B.网络 C.信息技术学习 D.学生问题15.王丹家里有一些设备,如数码照相机、数码录像机、手写板、扫描仪等,这些设备属于( )工具。( )A.信息加工 B.信息检索C.数据采集 D.信息存储16.为保障数据安全,下列措施有效的是( )A.对密码等敏感信息进行数据校验B.进行数据备份可以预防数据丢失C.开启防火墙就能有效阻止内部网络的非法攻击D.安装杀毒软件就能有效防止所有病毒的攻击17.以下数据分析的可视化呈现,按照逻辑关系分类的是( )①散点图 ②堆叠面积图 ③雷达图 ④圈图 ⑤网络关系图 ⑥动态热力图 ⑦词云 ⑧折线图A.①③⑤⑦ B.②④⑥⑧ C.①②③④ D.⑤⑥⑦⑧18.信息社会数据保护也越来越重要,下列对数据保护理解有误的是( )A.目前尚无绝对安全的数据保护手段B.加密、校验都是保护数据的方法C.数据安全已上升至国家战略层次D.移动终端中的数据不需要采取安全防范措施19.数据安全关系到个人和国家的利益。下列做法能较有效保障数据安全的是( )A.随意存储数据 B.公开他人的数据C.定期备份数据 D.随意连接各种网络20.书店收银员用条码扫描器扫描书籍的条形码,采集书籍的相关数据。这属于数据处理过程中的( )A.数据采集 B.数据加工 C.数据整理 D.数据分类二、填空题21.在数据挖掘中通过观测大量数据后得出规则建立类别模式,将数据根据属性分门别类加以定义,这种处理问题的类型叫作 。22.为了更好地了解某地的水质情况,科研人员采集了该地各监测点当天的水质数据。数据中包含了各监测点的水质类别、水温(℃)、pH、溶解氧(mg/L)、高锰酸盐指数(mg/L)。通过数字化学习,小申了解到水质类别从高到低分为1-5类,级别最高(质量最好)为1,级别最低(质量最差)为5。小申根据如表所示的水质数据,编写程序绘制如图1示的各监测点水质类别和溶解氧分布可视化图形。小申编写的程序如下所示,请将程序填写完整,可以点击图标进入开发环境,数据文件与程序位于同一文件夹目录,本题提供的环境仅用作算法验证。监测点名称 水质类别 水温 pH 溶解氧 高锰酸盐指数监测点 1 4 24.8 7.25 4.77 5.16监测点 2 3 23.6 7.56 5.62 3.54……图1import pandas as pd import matplotlib.pyplot as plt plt.rcParams['font.sans-serif']=['SimHei'] df=pd.read_csv('T4_3.csv',encoding='ANSI') plt.title('各监测点水质类别和溶解氧分布') plt.xlabel('溶解氧(mg/L)') plt.ylabel('水质类别') plt.ylim((0,6)) plt.yticks([0,1,2,3,4,5]) ___① (df['溶解氧'],df['水质类别']) plt.show()23.为了更好地了解某地的水质情况,科研人员采集了该地各监测点当天的水质数据。数据中包含了各监测点的水质类别、水温(℃)、pH、溶解氧(mg/L)、高锰酸盐指数(mg/L)。通过数字化学习,小申了解到水质类别从高到低分为1-5类,级别最高(质量最好)为1,级别最低(质量最差)为5。小申把整理后的数据存储于“T4_2.csv”文件中。如图所示,他写程序对这些数据进行分析,在水质类别为3的记录中,找出水温的最大值。请将程序填写完整,可以点击图标进入开发环境,数据文件与程序位于同一文件夹目录,本题提供的环境仅用作算法验证。import pandas as pd import numpy as np df=pd.read_csv('T4_2.csv',encoding='ANSI') mydf=df[(____① ==3)] temp=np.max(mydf['水温']) print(temp)24.请列举出五个数据可视化表达的常见图表名称 。25.数据分析应用对象主要有 分析、 分析和 分析。三、判断题26.计算机病毒传播的途径主要有网络、光盘、移动存储设备,其中通过网络传播的速度最快。( )27.数据是现实世界原始事物现象的运动过程,是信息的载体。( )28.数据是现实世界客观事物的符号记录,是信息的载体,不能用计算机进行加工。( )29.平均分析和对比分析单个使用,更能清楚地反映要分析事物的不同情况特征。 ( )30.数据分析的方法主要有对比分析、平均分析。对比分析是指将两个或两个以上的数据进行比较,分析它们的差异,来反映总体在一定时间、地点条件下某一数量特征的一般水平。 ( )参考答案1.A2.A3.D4.B5.A6.A7.A8.C9.BC10.A11.B12.B13.D14.C15.C16.B17.A18.D19.C20.A21.决策树22.plt.scatter23.df["水质类别"]24.饼图、条形图、折线图、散点图、雷达图、词云图、热力图等。25.现状 原因 预测26.正确27.×28.×29.错30.错 展开更多...... 收起↑ 资源预览