资源简介 第一章 认识数据与大数据 检测练习一、选择题1.下列关于信息编码的描述,正确的是( )A.用手机扫二维码支付是信息编码的过程B.只有数字化的数据才能被保存和处理C.已知大写字母“I”的ASCII值是49H,则大写字母“J”的ASCII值是50HD.n进制表达式(6)n+(1)n的计算结果为两位n进制数,则n一定为72.下列关于大数据和数据安全的说法,不正确的是( )A.大数据可以处理非结构化的数据B.可以通过数据校验来提高数据的保密性C.利用大数据进行数据处理时,个别数据不准确不影响分析结果D.大数据的应用和发展可以帮助人们更好地利用数据,但同时也增加了数据泄露风险3.下列关于数据和信息的说法,正确的是( )A.经加工处理后的假消息价值较低B.被删除到计算机中回收站的数据中没有信息存在C.残缺的竹简无法还原历史文献,说明了载体依附性D.大数据中数据结构很多,因此要求每个数据保证准确4.语音识别技术,目标是将人类的语音中的词汇内容转换为计算机可读的输入。语音识别的流程包括信号处理(模数转换等)、信号表征(特征提取等)、模式识别。其中特征提取、模式匹配和模型训练都离不开大量训练数据的积累和匹配, 随着大数据时代的来临,带来了大量文本或语音方面的语料数据。语音识别技术还引入深度神经网络技术,更逼近人脑的思维能力,同时借助于大数据,极大地提升了语音识别准确率。下列关于数据和大数据的说法不正确的是( )A.识别的语音为模拟信号B.语音识别结果在计算机内一般是以十六进制数存储C.大部分文本或语音方面的语料资源数据属于非结构化数据D.大数据价值密度低,需要对其“提纯”才能获得用于训练的语料数据5.下列关于大数据的说法,不正确的是( )A.处理大数据时,一般采用分治思想B.社交网络数据可采用图计算进行处理C.速度快是大数据的特征之一,仅指数据的产生速度快D.价值密度的高低与数据总量的大小成反比6.下列关于信息的说法,不正确的是( )A.计算机只能处理数字化后的信息 B.虚假广告的出现,说明信息具有真伪性C.数据灾备系统可以提高信息的安全性 D.通过计算机获取的信息都是真实可信的7.将十六进制数225 转换成二进制数是( )A.1000100101B B.100100110B C.11100001B D.100100111B8.将声音数字化的过程需要对声音进行采样,一般采用三个参数来衡量,其中不包括( )A.采样频率 B.色彩位数 C.声道数 D.量化位数9.数据压缩是我们常用的文件存储方式,关于数据压缩,下列说法正确的是( )A.WAV格式音频压缩为MP3格式,是无损压缩B.MPEG是常用的图片压缩格式C.因为有损压缩会产生失真,所以都使用无损压缩D.压缩比是衡量压缩技术的一个指标10.将二进制的数字“1000”转化十进制应该是( )A.4 B.6 C.8 D.1011.我们在选择数据采集方法时,既可以选择传感器采集数据,也可以使用网络获取数据。对于生活中获取到的各种各样的数据或信息,我们会将其进行数字化,从而更好的帮助我们去进行数据分析,而“数字化”的过程就是将生活中的“模拟量”转换成“数字量”,在下列设备中,( )能够将“模拟量”转换成“数字量”。①打印机 ②数码摄像机 ③扫描仪 ④绘图仪 ⑤录音笔A.①②③ B.②③⑤ C.②④⑤ D.②③④12.若对视频数据进行压缩,通常是为了( )A.声音更动听 B.存储容量更小 C.色彩更丰富 D.图像更清晰13.下列关于模拟信号数字化过程的说法不正确的是( )A.数字化过程一般需要经过采样、量化与编码B.数据在计算机中以二进制方式存储C.将模拟信号转换成数字信号,会引起失真D.量化值的范围是0~256,则量化位数最少是8位14.下列数据中,属于合法二进制数的是( )A.1011 B.202 C.12B D.ACE15.手机中的短视频应用,能够根据用户的浏览喜好,自动推荐相关视频,这主要体现了数据的( )特征。A.数据变化速度快 B.数据体量巨大C.数据类型多 D.价值密度低16.将6个灯泡排成一行,用 和表示灯亮和灯不亮,下图是这一行灯的五种情况,分别表示五个数字:1,2,3,4,5,那么表示的数是( )A.22 B.89 C.105 D.11317.下列关于大数据的说法,不正确的是( )A.大数据处理数据一般采用分治思想B.文本数据处理是大数据处理的重要分支之一C.大数据技术可以处理非结构化数据D.大数据处理的数据整体价值密度高18.下列有关大数据处理的说法,不正确的是( )A.处理大数据一般采用分治思想B.Hadoop架构适用于处理实时数据C.对历史数据一般采用批处理方式D.对社交网络、网购行为等数据一般采用图计算方式19.下列不属于大数据4V特征的是( )A.真实性 B.数据量 C.处理速度 D.多样性20.如图所示的是一张可回收物图片及其属性信息。若对此图片文件进行压缩,以下选项正确的是( )A.将此文件拓展名改为tif属于有损压缩B.将此文件用WinRAR软件进行压缩属于无损压缩C.将此文件重命名为玻璃瓶.zip属于有损压缩D.将此文件另存为jpg格式属于无损压缩二、填空题21.进制转换:11011011B=① D=② H22.一位八进制数可转换为 位二进制数。23.二进制数1011101100.011对应的十六进制数为 。24.两位同学传递一个9*9格的十字绣图案,并约定走线的格子“■”记为1,不走线的格子“□”记为0。1与0的个数用二进制数表示。换行用“00”表示。例如,“111”即表示连续的3个“■”“011”即表示连续的3个“□”。编码顺序按照从左到右,自上而下的规律进行逐行编写。右侧图案前三行编码为:01001 00 011 111 011 00 00。25.在微型计算机系统中,一个英文字符占1个字节,一个汉字占 字节三、判断题26.“人体正常体温平均在36~37℃之间”,此处的“37℃”是知识。( )27.多媒体计算机能够处理文字、声音、图像等信息。主要是因为这些信息都已被网络化。( )28.1个字节可以存放2个0~255之间的整数。( )29.分别使用44.1kHz和22.05kHz的采样频率对同一段声音进行数据编码,前者的声音保真度更高。( )30.大数据价值密度低,不会造成个人隐私的泄露。( )四、操作题31.哈夫曼编码:哈夫曼编码(Huffman Coding),又称霍夫曼编码,是一种编码方式,哈夫曼编码是可变字长编码(VLC)的一种,该方法完全依据字符出现概率来构造异字头的平均长度最短的码字,有时称之为最佳编码,也称霍夫曼(Huffman)编码。霍夫曼编码的基本方法是先对数据(如:文章)扫描一遍,计算出各数据元素(文字)出现的概率,按概率的大小指定不同长度的唯一码字,由此得到的一张霍夫曼码表。如:某文章只包含了“我”、“爱”、“中”、“国“四个字,它们出现的概念分别为0.125、0.125、0.2、0.3,那么它们的编码可以分别设为1000、1001、101和11。问题:(1)计算机科学中,数据编码是将数据转换为几进制数?(2)如果不采用哈夫曼编码,你知道还有哪些汉字编码系统?(3)你能把四个汉字的哈夫曼码转换为十进制数吗?32.编写VB程序,实现如下功能:在文本框Text1中输入二进制数,单击“转换”命令按钮Command1,在文本框Text2中输出对应的十六进制数。程序运行界面如图所示,请回答下列问题:(1)如果输入的二进制数为“1101010”,则得到的结果为 。(2)实现上述功能的 VB 程序如下,请在划线处填入合适代码。Private Function bw(x As Integer, y As String) As String'函数bw功能:若二进制位数不足,通过在前面添"0"使得位数为4的倍数 Dim r As Integer, i As Integer r = x Mod 4 If r <> 0 Then For i = 1 To 4 - r y = "0" + y Next i x = Len(y) End If bw =End FunctionPrivate Sub Command1_Click() Dim m As String, n As Integer, i As Integer, a As Integer Dim s As Integer, s1 As String, j As Integer m = Text1.Text n = Len(m) Text2.Text = "" m = '调整m的位数为4的倍数 For i = 1 To n - 3 Step 4 s = 0 For j = i To i + 3 a = Val(Mid(m, j, 1)) s = Next j If s >= 10 Then s1 = Chr(Asc("A") + s - 10) Else s1 = CStr(s) '函数CStr类似于Str,但无前导空格 End If Text2.Text = Text2.Text + s1 Next iEnd Sub参考答案1.D2.B3.C4.B5.C6.D7.A8.B9.D10.C11.B12.B13.D14.A15.A16.A17.D18.B19.A20.B21.219 DB22.323.2EC.624.010 101 011 101 010或010 11 011 11 01025.226.错误27.错误28.错误29.正确30.错误31.(1)二进制 (2)GB2312 GBK1.0 (3)(1000)2=8 (1001)2=9 (101)=5 (11)=332.6A y bw(n,m) s*2+a 展开更多...... 收起↑ 资源预览