资源简介 第一章 数据与大数据 章节练习一、选择题1.下列关于大数据的说法,正确的有:( )A.当数据量很大时,可以抽取部分数据作为大数据的数据源B.对于大数据不再追求精确性,而是能够接受数据的混杂性C.大数据产生的速度快,处理速度可以慢一些D.大数据让我们的生活更便利,百利而无一害2.以下哪些不是文本数据( )A.你发的微博 B.你聊天的信息C.一个班的学生成绩 D.报纸上的新闻3.将70个苹果从少到多依次放入7个箱子。在不拆开箱子的情况下,要取走任意个数的苹果,结合二进制思想,则第3个箱子里面装有几个苹果( )A.2 B.4 C.7 D.84.知错是一款错题App,具有基于云存储的错题收集、分类、统计分析等功能,并提供打印输出。错题收集可采用拍照或手工输入的方式,录入的错题将自动存储在云端数据库,学生可定期将错题整理打印成册。针对以上情境,下列说法正确的是( )A.收集到的错题是数据B.数据是计算机发明后才有的C.不同学生登录后看到的错题是相同的D.手工输入的错题在计算机中以十六进制方式进行处理5.下列选项中未用到大数据技术的是( )A.某网站利用可视化“迁徙”地图,分析各城市人口流动轨迹与特征B.流感爆发时期,用户利用“城市热力图”提供的信息,避开人流密度高的地区C.某平台以网民行为数据为基础,研究关键词搜索趋势,洞察网民消费特征D.在超市、银行等场所,用手持测温仪测量入场人员的体温数据6.下列属于数字信号的是()A.电话、电报、计算机输入/输出信号 B.电话、传真、数据信号C.电话、传真、电报、数据信号 D.电报、计算机输入/输出信号、数据信号7.下列有关数据和信息的说法,正确的是( )A.计算机中的数据以二进制的形式存储B.人们观看在线影视时,点播的视频是信息C.信息本身会因为被别人获取而发生损耗D.大数据的数据总量越大,价值密度就越高8.通常对声音进行编码前有两个步骤,它们是( )A.录制与编辑 B.写谱与混合 C.采样与量化 D.扫描与打印9.下列关于大数据的说法不正确的是( )A.大数据追求数据的精确性,处理大数据时要保证每个数据准确无误B.大数据一般具有数据规模大、速度快、数据类型多、价值密度低四个特征C.Hadoop是一个对静态数据进行分布式并行处理的基础软件框架D.道路交通中实时产生的流数据,随着时间的流逝,其价值随之降低10.IBM副总裁Dietrich曾说过“可以利用社交平台数据获得用户对某个产品的评价,但是往往上百万条记录中只有很小的一部分真正讨论这款产品”。这主要体现了大数据的( )特征( )A.数据体量大 B.数据类型多 C.数据变化速度快 D.价值密度低11.国家有关部门根据学生体质健康数据,制定了《国家学生体质健康标准》,其中指出的“高一男生的正常体重指数为16.5-23.2”属于( )A.智慧 B.数据 C.信息 D.知识12.下列关于数据和信息的说法,正确的是( )A.数据的表现形式只能是数字B.计算机中保存的数据可以是未经数字化的C.同一信息对所有人而言其价值是相同的D.信息可以变换其载体,但永远也不能脱离载体13.大数据的起源是( )A.电信 B.公共管理 C.互联网 D.金融14.“2021年12月24日平安夜,李明睡前发现阳台上的温度计读数为-2℃,他和爸爸一起把裸露在户外的水管用旧衣服包裹起来,并将阳台上的水龙头调整至滴水状态,用一个较大的桶接水。”结合上述事例,下列对于数据、信息、知识和智慧的描述错误的是( )A.-2是数字,是最简单的一种数据B.温度计读数-2℃表示该时间李明家阳台上的温度信息C.李明看到温度计读数为-2℃,联想到冰冻,这是智慧的体现D.李明和家人一起做了防水管冰冻措施,说明他们具备相关知识15.下列关于图像数字化的说法,正确的是( )A.通过手机拍照并存储可以实现图像的数字化B.图像的量化过程就是把图像分解成一个个像素C.黑白两色图像的颜色位深度是2位D.把一幅24位色的图像另存为256色,文件容量将变大二、填空题16.存储容量的基本单位是字节,英文Byte,简写B,它占 位二进制位。17.某同学在计算机中保存了一张有8种颜色的位图文件,该位图的每个像素至少要用 位二进制数进行编码。18.小张参与“声音的量化”实验活动课,他采用传感器采集声音,并利用示波器显示声波信号,其记录的主要活动过程与结果如下图1-3所示。请回答下列问题:(1)声音信号的数字化,需要经过采样、量化、数字化的过程。当对某个声音信号采样时,3秒内采集到的样本数为3000,则采样频率为 (单选,填字母)。A.300Hz B.1000Hz C.3000Hz D.9000Hz(2)如上图所示,将声音的高低划分成8个等级,每一个等级都使用等长的二进制位数表示,则量化位数最少为 比特。(单选,填字母)A.1 B.2 C.3 D.4(3)某声音数字化后的数据量为4MB,换算为 比特。(单选,填字母)A.8*4 B.1024*8*4C.1024*1024*4 D.1024*1024*8*4(4)一段时长为10s的wav单声道音频文件,采样频率是44.1kHz,量化位数为16bit,它所占的存储容量约为 。(单选,填字母)A.861KB B.6891B19.大数据技术指对巨量数据资源进行采集、提取、存储、 和表达的技术。20.小申家安装的智能家居系统示意图如图1所示。家里各类家电、安防及照明等物件接入网络,为日常生活带来便利。智能家居系统中的照明系统根据外界环境调节灯光亮度时,需要光传感器采集光照强度。光传感器的工作原理示意图如图2所示。图中横线①处应填入 。(选填:模数/数模)图1 图2三、判断题21.我们用手机的录音软件录音时,是将声音进行数字化。( )22.从互联网产生大数据的角度来看,大数据具有数据量大、数据类型多、价值密度高、变化速度快等特征。( )23.数据是现实世界中客观事物的符号记录,是信息的载体。( )24.未知样本不需要经过量化也能够被识别。( )25.数字信号在大小和时间上均连续,而模拟信号则相反。( )四、操作题26.自然界中的声音、图片等各种模拟信号,可通过数字化工具将模拟信号转换为数字信号被计算机处理。模拟信号的数字化过程,如下图所示:(1)将模拟信号转换成数字信号一般需要经过三个步骤:① ② ③编码(2)计算机中的声卡是实现声音信号“模数”和“数模”转换的硬件设备,其中录制声音的过程是实现 转换的过程(选填,填字母,A.“模数” B.“数模”)(3)下图是2段录音文件的参数信息,存储容量大小“旁白.mp3”是“伴奏.mp3”的 倍(四舍五入保留整数)27.下图是小凡学习信息系统后为家里设计搭建的一个小型家用影院,这个系统以无线网络为依托,以数字视频为核心,请根据小凡设计搭建过程进行分析。 (1)首先小凡进行了 ,这个阶段这个系统明确了系统以无线网络为依托,以数字视频为核心。(2)随后在 阶段,小凡根据功能设计、网络设备和各品牌音响的优劣及价格设计了设备采购方案及具体搭建系统的方案。(3)在 阶段,小凡根据设计方案实际布线,安装软硬件,连接相应的设备和线路,安装相应的软件,并调试音响。(4)在 阶段,进行系统日常检查和维护,并对发现的问题及时处理。28.Base64编码是计算机中常见的一种编码方式,规则是把3个字节(24位)的数据按6位1组分成4组(24÷6=4),然后将每组数据分别转换为十进制,根据图1所示的对应表将这些十进制数所对应的字符连接,即为Base64编码。索引 字符 索引 字符 索引 字符 索引 字符0 A 16 Q 32 g 48 w1 B 17 R 33 h 49 x2 C 18 S 34 i 50 y3 D 19 T 35 j 51 z4 E 20 U 36 k 52 05 F 21 V 37 l 53 16 G 22 W 38 m 54 27 H 23 X 39 n 55 38 I 24 Y 40 o 56 49 J 25 Z 41 p 57 510 K 26 a 42 q 58 611 L 27 b 43 r 59 712 M 28 c 44 s 60 813 N 29 d 45 t 61 914 O 30 e 46 u 62 +15 P 31 f 47 v 63 / 图1以编码字符“Max”为例,如图2所示,字符“Max”对应的ASCII编码十六进制分别是4DH,61H,78H,分别转换为8位二进制数,按6位二进制数分组后再转换成十进制,查找它们的对应字符,得到“Max”的Base64编码为“TWF4”。 图2请回答下列问题。(1)字符“N”的ASCII码值使用十六进制表示为 ,使用十进制表示为 ,使用8位二进制表示为 。(2)字符串“Num”的Base64编码为 。(3)按照Base64编码原理,原文的字节数量应该是3的倍数。如果这个条件不能满足的话,具体的解决办法如下:原文剩余的字节根据编码规则继续单独转(余下1个字符则转成2个字符,余下2个字符则变成3个字符;不够的位数用0补全),再用=号补满4个字符。例如字符“M”的Base64编码为“TQ==”。则Base64编码“R28=”的原文为 。五、简答题29.请写出大数据处理流程四步骤参考答案1.B2.C3.B4.A5.D6.D7.A8.C9.A10.D11.C12.D13.C14.C15.A16.817.318.B C D A19.分析20.模数21.正确22.错误23.正确24.错误25.错误26.采样 量化 A 227.系统规划 系统分析 系统实施 系统运行与维护28.4E 78 01001110 TnVt GO29.大数据处理流程主要包括四个关键步骤:数据采集、数据预处理、数据存储与分析以及数据可视化。(1)数据采集是大数据处理流程的第一步,也是至关重要的一步。数据采集的主要目的是从各种数据源中收集、识别和记录数据。在数据采集阶段,需要使用各种不同的技术和工具,例如ETL(提取、转换、加载)工具、数据清洗工具、数据库管理系统等等。(2)数据预处理是大数据处理流程的第二步,其主要目的是对数据进行清洗、整合和变换,以提高数据的质量和可用性。在这个阶段,需要使用各种数据处理技术和工具,例如数据去重、数据填补、数据规范化等等。(3)数据存储与分析是大数据处理流程的第三步,其主要目的是对数据进行存储和管理,并通过对数据的分析来获得有用的信息。在这个阶段,需要使用各种数据存储技术和工具,例如分布式文件系统、数据库管理系统等等。(4)数据可视化是大数据处理流程的最后一步,其主要目的是将数据处理的结果以可视化的方式呈现出来,以便更加直观地展示数据的特征和规律。在这个阶段,需要使用各种数据可视化技术和工具,例如表格、图表、地理信息系统等等。大数据处理流程的四大步骤是相互联系、相互影响的。通过这四个步骤的执行,可以有效地优化数据,充分挖掘数据的潜在价值,为决策和业务运营提供有力支持。同时,随着技术的不断发展和进步,大数据处理的流程和方式也将不断改变和优化,以更好地适应时代的需求和发展。 展开更多...... 收起↑ 资源预览