资源简介 (共33张PPT)第4章 数据 处理与应用浙教版 信息技术(高中)必修1 数据与计算4.2 大数据处理学习目标1234大数据处理的基本思想批处理计算和流计算、图计算,编程处理数据文本数据处理,文本数据分析与应用数据可视化12重点难点重点:大数据处理的思想和编程处理数据。难点:编程处理数据。课堂导入大数据特征数据量体大速度快数据类型多价值密度低表格处理软件×大数据技术、理论和处理方法大数据处理的基本思想和架构分治思想开发“羊了个羊”小程序写代码画界面设计游戏宣传计算机专业美术专业计算机专业新媒体专业成果子问题==小问题?n:11:nn个志愿来自10个不同的城市,每个城市按每个志愿参加志愿活动降序排列。小明把n个志愿按城市分成10个集合,在每个集合进行排序,该算法主要采用的思想是( )A.顺序查找法B.枚举法C.分治算法D.解析法C把n个数据按序排序,若要查找一个数是否在这些数据中,把这些数分成前后两部分,与中间的数据进行对比,如果该数据在前半部分,则继续按前面的思想进行分别查找,该算法主要采用的思想是( )A.顺序查找法B.枚举法C.分治算法D.解析法C大数据处理静态数据流数据图数据批处理计算(Hadoop、spark等)流计算(storm、heron等)图计算(pregel、graphx等)图4.2.1 大数据处理类型1月内通过下列方式获取数据,数据类型属于静态数据的是( )A.各个监控不断向监控中心发送的数据B.同一时间内收到10万移动设备的位置信息C.服务器的近10天内的IP访问数据日志D.大型购物网站的广告推荐C某大型购物网站收集了用户浏览网站的数据用于广告个性化实时推荐,下列处理方式中合理的是A.选用针对静态数据的批处理计算B.选用针对流数据的实时计算C.选用针对图结构数据的图计算D.用统计分析软件提供的丰富的统计算法进行数据分析BA1、批处理计算Hadoop的设计初衷是面向大规模静态数据的批量处理,以下数据不适合使用Hadoop进行处理的是A.某市高三学生模拟考成绩B.某小区所有住户上半年的用水量C.某市天气的实时变化情况D.某大型超市3年的生鲜销售情况C图4.2.2 Hadoop的组成同时适用于静态和动态数据AC下列不属于Hadoop计算平台组成部分的是( )A.Common公共库B.分布式文件系统NTFSC.分布式数据库HBaseD.分布式并行计算模型MapReduceB下列关于分布式文件系统,说法错误的是( )A.是一个高度容错性的系统B.适合于静态数据的存储,但不适合于流数据的存储C.Hadoop系统采用基于列的存储方式进行存储D.大规模海量数据以文件的形式,用多个副本保存在不同的存储节点中BC图4.2.6 蛋白质激素构成图(由2.7万个节点和794万条边组成)D4、实时处理与批处理的整合D下列有关大数据中统计和处理说法正确的是( )A.批处理的结果不能用于实时处理系统中B.图处理软件主要包括图数据库和并行图处理系统C.同一个平台既要么做批处理,要么做实时流计算,不能两者兼之D.对于社交网络的个性化数据推荐,往往可以在批处理平台中进行计算B 展开更多...... 收起↑ 资源预览