资源简介 第二单元 数据处理与应用 单元检测一、选择题1.2022年北京冬季奥运会圆满结束,这不仅是一场体育盛会,也是一场文化盛宴、科技盛会。从充满文化韵味的“二十四节气”倒计时,到脱胎于篆刻、书法的冬奥标识;从创意源于西汉长信宫灯的冬奥会火炬接力火种灯,到取自《千里江山图》的冰场挡板图案,从展现文明交流交融的“黄河之水”,到最终幻化成“冰雪五环”……中华文化与奥运文化、冰雪元素完美融合,闪耀冬奥舞台,写下文明交流互鉴的新篇章。小明使用百度指数,以“冬奥会比赛项目”为关键词进行分析,得到大家对于比赛项目关注情况的图谱(如图),以数据可视化形式迅速展示要点信息。该图谱采用的是( )A.词云分布图 B.网络关系图 C.雷达图 D.热力图2.智能垃圾回收系统的“满溢提醒”功能是借助超声波传感器来获取相关数据。这种数据获取的方式属于( )A.智能识别 B.自动采集 C.自动控制 D.人工输入3.关于散点图,下列说法正确的是( )A.可呈现变量的频数分布B.可表示两种特征间的相关关系C.可描述变量的变化趋势D.可直观表述出各指标的位置4.数据处理的一般过程是( )。A.采集—分析—整理—可视化表达 B.采集—整理—可视化表达-分析C.采集—整理—分析-可视化表达 D.采集—可视化表达—整理-分析5.将一年级新生的资料录入到学籍管理系统中,这属于信息的( )A.存储 B.检索 C.加工 D.输出6.属于数字化可视化表达工具的是( )A.演示文稿 B.平板电脑 C.电子词典 D.编程软件7.如图展示了我国近十年的GDP。为了直观地显示GDP的变化趋势,可以使用( )进行的数据可视化。A.柱形图 B.折线图 C.饼图 D.雷达图8.在小区里,有的垃圾箱垃圾太多而溢出,有的却很少。做了一些研究后,小明同学整理数据,将原因与建议写成文字,准备交给物业。这属于数据处理过程中的( )A.撰写研究报告 B.数据整理C.数据分析 D.数据可视化9.在教科书中利用Python探究电流和电压、电阻的关系实验里,除了可以通过书中的Jupyter Notebook外,处理数据还可以通过下列( )工具实现。A.Python IDLE B.Xmind C.网络画板 D.几何画板10.下列适合用来采集《雷锋年谱》 图像的工具是( )A.台式电脑 B.编程软件 C.思维导图 D.数码照相机11.小张采集了运动会的报名数据录入到Excel文件,每位同学最多参加两个项目,部分界面如下图所示。他先使用Excel软件整理数据,存储为“运动会报名.xlsx”文件后,编写Python程序完成后续处理。小张对数据进行以下整理,操作恰当的是( )A.发现高一(1)班陈易涵有两条相同的数据,删除一条B.发现高一(3)班张怀沙的跳高一栏空着,填入数字“1”C.发现第6行“高一(二)班”的格式与其他数据不一致,删除第6行数据D.发现第8、9行都是高一(2)班李嘉佑的数据且都不完整,删除第8、9行数据12.想知道习近平主席在《庆祝中华人民共和国成立70周年大会上的讲话》中的讲话重点,最有效的可视化呈现类型是( )。A.饼图 B.词云图 C.柱形图 D.折线图13.数据可视化的呈现类型有( )A.探索型 B.试探型 C.逻辑型 D.布尔型14.数据处理的一般过程是( )A.采集—整理—可视化表达-分析 B.采集—整理—分析-可视化表达C.采集—可视化表达—整理-分析 D.采集—分析—整理—可视化表达15.高二年级的水平考试报名中,需要提供每位学生的数字照片一张,学校应该选择哪种信息采集工具最方便、快捷A.数码摄像机 B.普通相机 C.数码相机 D.扫描仪二、填空题16.数据可视化表达的呈现方式有很多,小明把高中同学“大学所在城市”数据,生成一个词云图,根据词云图可以知道,小明同学去 城市上大学的最多。17.图结构中的每个顶点( )与其他顶点有边相连,数据元素之间是( )的关系。18.数据之间有三种基本关系,分别是线性关系和 、网状关系。19.为了更好地了解某地的水质情况,科研人员采集了该地各监测点当天的水质数据。数据中包含了各监测点的水质类别、水温(℃)、pH、溶解氧(mg/L)、高锰酸盐指数(mg/L)。通过数字化学习,小申了解到水质类别从高到低分为1-5类,级别最高(质量最好)为1,级别最低(质量最差)为5。小申了解到水温、pH、溶解氧、高锰酸盐等指标都会影响水质类别,他选择了溶解氧进行重点分析。分析如图所示的“各监测点水质类别和溶解氧分布”可视化图形,说出溶解氧指数最高的监测点的水质类别为 。请学习数字化资源中的“地表水环境质量标准”,尝试归纳水质类别和溶解氧之间的相关关系 。20.词云是对文本数据进行分析处理后的可视化形式。某同学采集微信好友签名制作了如图所示的词云。观察词云图,分析并写出至少三个出现频率较高的词语 。三、判断题21.利用网络爬虫获取研究性学习所需要的数据,是采用了网络数据采集法。( )22.词云可以使得难以实现结构化的数据文本挖掘成为轻而易举的事情。( )23.数据可视化的目的是为了帮助用户过滤、清洗掉无用的、错误的数据。( )24.数据可视化是指以图形、图像、地图、动画等生动、易于理解的方式展示数据和诠释数据之间的关系、趋势与规律等,以便更好地理解数据。( )25.2022年4月初,太原市各中学再次开启了“停课不停学、离校不离教”线上教学。钉钉在线课堂教学过程中,老师运用思维导图软件结束课堂,再一次对教学内容概括和归纳,帮助学生理清知识脉络,把握重点,运用钉钉答题卡功能当堂检测每个学生学习效果,进而有针对性、更精准的辅导。老师通过答题卡的选项统计功能对学生更精准的辅导。这个事例说明学生提交的选项作为数据需要进行加工处理分析,就可以得到学生学习情况这一信息。( )四、操作题26.小红收集了部分城市202l年全年每大PM2.5、PM10、CO浓度数据。每大的数据分别保存在以8位日期字符串命名的CSV文件中,部分文件如图a所示,每个文件记录了一天24小时的监测数据。示例如图b所示。为统计分析城市A全年各月份PM2.5的月平均浓度(当月的日平均浓度的平均值),编写Python程序。请回答下列问题:(l)定义pmday函数,功能为:读取某天的CSV文件,返回城市A当天PM2.5的日平均浓度。函数代码如下,划线处应填入的代码为<单选,填字母)。A.df['类型']= ='PM2.5 B.df['类型'=='PM2.5']C.df[df['类型']]= ='PM2.5' D.df[df['类型']=='PM2.5']import pandas as pddef pmday(dayfile): df=pd read_csv(dayfile) #读取文件dayfile中的数据 df= return df['城市A'].mean() #返回城市A当天PM2.5的日平均浓度(2)统计城市A各月份PM2.5的月平均浓度并绘制线型图。部分Python程序如下,请在划线处填写合适的代码:import matplothb. pyplot as pltdef tstr(t): if t retrun '0'+str(t) else: retrun str(t)pm=[0]*12mdays=[31.28.31.30.31.30.31.31.30.31.30.31]for m in range(12): sm=0 mstr=tstr(m+1) for d in range(① ): dstr=tstr(d+l) day file='202l'+mstr+ dstr+'.csv' sd=pmday(dayfile) ② pm[m]=sm/mdays[m]x=[1,2,3,4,5,6,7,8,9,10,11,12]y=③plt. plot(x,y) #绘制线型图#设置绘图参数,显示如图c所示线型图,代码略(3)城市A 2021年PM2.5年平均浓度为34.6微克/立方米。由图c可知,城市A 2021年PM2.5月平均浓度超过年平均浓度的月份共 个。参考答案:1.A2.B3.B4.C5.A6.A7.B8.A9.A10.D11.A12.B13.A14.B15.C16.北京17.都可以 多对多18.树型关系19.1 溶解氧越高,水质类别质量越好。20.祖国 努力 爱 富强 分享等21.正确22.错误23.错误24.正确25.正确26.D mdays[m] sm+=sd pm 5 展开更多...... 收起↑ 资源预览