资源简介 (共13张PPT)第一节 常用表格数据的处理信息技术 必修1 数据与计算数据处理与应用第四章必备知识练1. 下列关于数据整理的说法,错.误.的是( )A. 对缺失的数据,可采用概率统计值来填补B. 对重复的数据,可进行合并处理C. 数据集中的异常数据可能包含重要信息D. 数据集中的逻辑错误数据可以统一转换【解析】 对于逻辑错误的数据,需要通过检测重新确定数据。D2. 某省在统计某考试的报名情况时,由于报名人数较多,先在各地级市统计报名情况,再把数据汇总在一起,该算法主要体现的思想是( )A. 枚举法 B. 解析法C. 分治算法 D. 顺序查找法【解析】 把一个大问题分成若干个小问题,这种思想称为分治思想。C3. 处理大数据的正确步骤是( )①数据预处理 ②数据采集 ③数据挖掘应用 ④数据分析A. ②③①④ B. ①②④③C. ②①④③ D. ②④①③C4. 下列关于数据处理的描述,正确的是( )A. 数据处理是将信息转换成数据的过程B. 数据处理是将数据转换成信息的过程C. 数据处理是对数据进行算术运算D. 数据处理是数据的简单收集【解析】 本题主要考查数据处理的描述。数据处理是将数据转换成信息的过程。B5. 卫生部门对学生视力情况大数据进行对比,预测出学生视力变化等数据。这一过程属于数据处理中的( )A. 数据搜索 B. 数据加工C. 数据采集 D. 数据分析【解析】 本题主要考查数据处理。数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。卫生部门对学生视力情况大数据进行对比,预测出学生视力变化等数据。这一过程属于数据处理中的数据分析。D6. 下列关于数据的说法,正确的是( )A. 数据处理的速度主要取决于计算机硬件设备,软件对它的影响不大B. 大数据中,每个数据的价值都非常大,不能随意处理C. 在计算机中,所有的数据都是结构化数据D. 数据安全不仅要保障数据不损坏,也要考虑数据被入侵偷窃的情况【解析】 本题主要考查数据的相关知识。数据处理的速度取决于计算机硬件设备和软件;大数据中,并非每个数据的价值都非常大;在计算机中,并非所有的数据都是结构化数据;数据安全不仅要保障数据不损坏,也要考虑数据被入侵和偷窃的情况。D关键能力练7. 下列数据应设计为流数据处理的是( )A. 某网店平台运营视图中的每周成交金额B. 电信运营商提供的通话记录C. 某地区的流感病例历史数据D. 某导航软件提供的城市实时拥堵指数【解析】 城市实时拥堵指数是根据城市当前时刻交通拥堵状况统计得出的数据,数据具有时效性,因此需要设计为流数据处理。D8. 实时处理与批处理整合的优势有( )①缩短了批处理计算和流计算之间的切换延时②降低了使用成本③可以在同一个平台做批处理计算和流计算④减少了系统开销A. ①②③④ B. ①②④C. ①③④ D. ②③④【解析】 这四项都是实时处理与批处理整合的优势。A9. 下列关于大数据处理的说法,正确的是( )A. 大数据处理系统无法同时实现批处理和流计算B. HBase是谷歌图处理系统Google Pregel开源实现的C. 实时处理和批处理的整合增加了系统开销D. MapReduce计算模型用于大规模数据集的并行运算【解析】 MapReduce是一种分布式并行计算模型,能够处理大规模数据集的并行计算。D10. 下列关于分布式数据库系统HBase的说法,错.误.的是( )A. HBase建立在HDFS提供的底层存储的基础上B. HBase主要用来存储非结构化数据和半结构化数据C. HBase在处理流数据时性能明显不足D. HBase采用基于行的存储方式,方便管理PB级的大数据【解析】 传统关系数据库如Mysql等采用基于行的存储方式,用于管理表结构的结构化数据,HBase采用基于列的存储方式。D第一节 常用表格数据的处理1. 下列关于数据整理的说法,错误的是( D )A. 对缺失的数据,可采用概率统计值来填补B. 对重复的数据,可进行合并处理C. 数据集中的异常数据可能包含重要信息D. 数据集中的逻辑错误数据可以统一转换【解析】 对于逻辑错误的数据,需要通过检测重新确定数据。2. 某省在统计某考试的报名情况时,由于报名人数较多,先在各地级市统计报名情况,再把数据汇总在一起,该算法主要体现的思想是( C )A. 枚举法 B. 解析法C. 分治算法 D. 顺序查找法【解析】 把一个大问题分成若干个小问题,这种思想称为分治思想。3. 处理大数据的正确步骤是( C )①数据预处理 ②数据采集 ③数据挖掘应用 ④数据分析A. ②③①④ B. ①②④③C. ②①④③ D. ②④①③4. 下列关于数据处理的描述,正确的是( B )A. 数据处理是将信息转换成数据的过程B. 数据处理是将数据转换成信息的过程C. 数据处理是对数据进行算术运算D. 数据处理是数据的简单收集【解析】 本题主要考查数据处理的描述。数据处理是将数据转换成信息的过程。5. 卫生部门对学生视力情况大数据进行对比,预测出学生视力变化等数据。这一过程属于数据处理中的( D )A. 数据搜索 B. 数据加工C. 数据采集 D. 数据分析【解析】 本题主要考查数据处理。数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。卫生部门对学生视力情况大数据进行对比,预测出学生视力变化等数据。这一过程属于数据处理中的数据分析。6. 下列关于数据的说法,正确的是( D )A. 数据处理的速度主要取决于计算机硬件设备,软件对它的影响不大B. 大数据中,每个数据的价值都非常大,不能随意处理C. 在计算机中,所有的数据都是结构化数据D. 数据安全不仅要保障数据不损坏,也要考虑数据被入侵偷窃的情况【解析】 本题主要考查数据的相关知识。数据处理的速度取决于计算机硬件设备和软件;大数据中,并非每个数据的价值都非常大;在计算机中,并非所有的数据都是结构化数据;数据安全不仅要保障数据不损坏,也要考虑数据被入侵和偷窃的情况。7. 下列数据应设计为流数据处理的是( D )A. 某网店平台运营视图中的每周成交金额B. 电信运营商提供的通话记录C. 某地区的流感病例历史数据D. 某导航软件提供的城市实时拥堵指数【解析】 城市实时拥堵指数是根据城市当前时刻交通拥堵状况统计得出的数据,数据具有时效性,因此需要设计为流数据处理。8. 实时处理与批处理整合的优势有( A )①缩短了批处理计算和流计算之间的切换延时②降低了使用成本③可以在同一个平台做批处理计算和流计算④减少了系统开销A. ①②③④ B. ①②④C. ①③④ D. ②③④【解析】 这四项都是实时处理与批处理整合的优势。9. 下列关于大数据处理的说法,正确的是( D )A. 大数据处理系统无法同时实现批处理和流计算B. HBase是谷歌图处理系统Google Pregel开源实现的C. 实时处理和批处理的整合增加了系统开销D. MapReduce计算模型用于大规模数据集的并行运算【解析】 MapReduce是一种分布式并行计算模型,能够处理大规模数据集的并行计算。10. 下列关于分布式数据库系统HBase的说法,错误的是( D )A. HBase建立在HDFS提供的底层存储的基础上B. HBase主要用来存储非结构化数据和半结构化数据C. HBase在处理流数据时性能明显不足D. HBase采用基于行的存储方式,方便管理PB级的大数据【解析】 传统关系数据库如Mysql等采用基于行的存储方式,用于管理表结构的结构化数据,HBase采用基于列的存储方式。 展开更多...... 收起↑ 资源列表 第一节 常用表格数据的处理.docx 第一节 常用表格数据的处理.pptx