资源简介 (共54张PPT)第一单元 数据与信息认识数据、信息与知识第一课一、什么是数据数据是现实世界客观事物的符号记录,是信息的载体,是计算机加工的对象。例如:180cm、70kg、36.5可以分别表示人体的身高、体重、体温情况;200m2、600m3、120km/h可以分别表示物体的面积、体积、速度等情况;二、数据的特征(1)二进制。在计算机中,数据以二进制的形式存储、加工。(2)语义性。语义是将数据符号解释为客观世界的事物。(3)分散性。数据是分散的记录,分别记录不同客观事物的运动状态。(4)多样性和感知性。数据记录的形式是多样的、可看的、可听的、可感知的,如图形、图像、视频、音频、文本等。三、数据的类型在计算机科学中,数据是对所有输入计算机并被计算机识别、存储和处理的符号的总称。四、数据和信息不同特征(1)数据的载体性与信息的依附性(2)数据的孤立性与信息的联系性(3)数据的客观性与信息的主观性五、数据和信息共同特征(1)普遍性(2)可处理性(3)传递性与共享性(4)价值相对性与时效性六、大数据(1)数据量(2)处理速度(3)多样性(4)价值性电信诈骗大数据“杀熟”信息茧房大数应用1、电商行业。电商行业是最早将大数据用于精准营销的行业,它可以根据消费者的习惯提前生产物料和物流管理,这样有利于美好社会的精细化生产。随着电子商务的越来越集中,大数据在行业中的数据量变得越大,并且种类非常多。在未来的发展中,大数据在电子商务中有大多的想象,其中主要包括预测趋势,消费趋势,区域消费特征,顾客消费习惯,消费者行为,消费热点和影响消费的重要因素。2、金融行业。主要使用在交易过程中。现在许多股权交易都是使用大数据算法进行的。这些算法能够越来越多地考虑社交媒体和网站新闻,并且决定接下来的几秒内是选择购买还是出售。3、生物技术。基因技术是人类未来挑战疾病的重要武器。科学家可以利用大数据技术的应用,这样能够加速他们自己的基因和其他动物基因的研究过程,并且还能成为人类未来克服疾病的重要武器之一。技术不仅可以改良作物,还可以利用遗传技术培育人体器官,消灭细菌等。电信诈骗大数据“杀熟”信息茧房七、数据、信息与知识的关系从数据到信息,再到知识,是一个低级到高级的认知过程。数据是信息和知识的来源。七、数据、信息与知识的关系从数据到信息,再到知识,是一个低级到高级的认知过程。数据是信息和知识的来源。简单地说:数据是载体。通过数据,我们可以获得信息、形成知识,甚至产生智慧。1、数据是现实世界原始事物现象的( ),是信息的载体。A、符号记录 B、还原 C、反映 D、提升学业评价2、人们在探索现实世界时,用( )记录自然现象与社会的发展,通过寻找其基本特征和规律,人们就能探索与揭示出自然和社会的发展规律。A. 文字 B. 图片 C. 数字 D. 数据3. 导航软件的实时路况信息会不断更新,这主要体现了信息具有( )。A. 真伪性 B. 时效性 C. 载体依附性 D. 可处理性数据编码字符编码图像编码声音编码视频编码数值数据编码编码:是指用预先规定的方法将数字、文字或其他对象转换成规定的符号组合,或将信息、数据转换为规定的脉冲电信号。鉴别:编码是对象的唯一标识。排序:具有一定的顺序,比较容易排序。专用含义:在计算机中, 编码一般是指用预先规定的方法将数字、文字、图像、声音、声音、视频等编成二进制代码的过程。(一)计算机与二进制数二进制:用0和1两个数码来表示,进位规则是“逢二进一”。0+0=0 0+1=1 1+1=10 11+1=100比特b:一个二进制位(0或1)称为一个比特(bit),比特是表示数据的 最小单位。数值数据编码数值数据编码过程:数值数据转换二进制数编码0、1代码(1)十进制数转二进制数方法:除2取余,逆序排列(15)10=( )2?(15)10=( 1111)215272321201余数111数值数据编码——转换(三)二进制数与十进制数之间的转换2、二进制数转十进制数(三)二进制数与十进制数之间的转换方法:“按权展开求和”具体步骤:先将二进制数写成加权系数展开式,而后根据十进制数的加法规则进行求和。(1111)2=1×20+1×21+1×22+1×23 =(15)10(1111010)2= =( )10位权:一个数值在某一位上所表示的数值的大小,进制的位数-1次幂。例如:(1111)2第四位的位权是1×23=8,(1462)10第四位的位权是1×103=1000数值数据编码——转换成语“半斤八两”是什么意思 将10两计做1斤,就是“十进制”将16两计做1斤,就是“十六进制”新疆人民至今仍习惯将20两计做1斤,本质上是1公斤(1 kg)两者表示的物品数量一样,只是进制不同数值数据编码——转换U盘容量的进制是多少?1 GB = 1024 MB1 MB = 1024 KB1 KB = 1024 B(Byte,字节)1 B = 8 bit(位,元件)厂商在生产时,以1000为进制计算机读取时,以1024为进制厂商生产了:64*1000*1000*1000*8个元件,共5.12*1011计算机读取:5.12*1011/8/1024/1024/1024,等于59.6GTB(terabyte),太字节PB(petabyte),拍字节TB(exabyte),艾字节数值数据编码——转换(三)N进制数与十进制数之间的转换1. N进制转十进制:按权展开相加2. 十进制转N进制:除N取余倒取法3. X进制转Y进制:以十进制做中转(17)8=7×80+1×81=(15)10(15)10=(17)81581807余数1数值数据编码——转换数值数据编码——转换二进制 0 1 10 10 100 101 110 111 1000 1001 1010 1011 1100 1101 1110 1111 ....十进制 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 ....数值数据编码——转换二进制 0 1 10 10 100 101 110 111 1000 1001 1010 1011 1100 1101 1110 1111 ....十进制 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 ....数值数据编码——编码(+21)10=(+10101)2=(00010101)原=(00010101)反==(00010101)补(-21)10=(-10101)2=(10010101)原=(11101010)反==(11101011)补数值数据编码——编码过程:数值数据转换二进制数编码0、1代码除2反向取余法原码、反码、补码数值数据编码有人写了一个数制转换的式子:70-25=41。若要使该等式成立,则70、25、41有可能分别为( )A. 十进制、十进制、十六进制 B. 十进制、十六进制、八进制 C. 十六进制、八进制、十进制 D. 八进制、八进制、十六进制字符编码字符编码的方式认识ASCII码认识汉字编码字符编码与进制数的关系字符编码※ 西文字符是如何转换为二进制的?※ 哪些因素会影响西文字符在计算机中所在存储容量呢?(一)西文字符编码字符编码字符编码中的字符包含:字母、符号、控制符、汉字等;字符编码:将字符按预先确定的方案转换为计算机能识别的二进制数;字符编码(一)西文字符编码——ASCII码ASCII码是由美国国家标准学会(American National Standard Institute,ANSI)制定的通用单字节字符编码方案。标准 ASCII码扩展 ASCII码7个二进制位表示,包括所有的大写和小写字母、数字0到9、标点符号,以及特殊控制符号。8个二进制位表示,第8位用于确定附加的128个特殊符号字符、外来语字母和图形符号。字符编码标准 ASCII码7个二进制位表示,包括所有的大写和小写字母、数字0到9、标点符号,以及特殊控制符号。字符编码扩展 ASCII码8个二进制位表示,第8位用于确定附加的128个特殊符号字符、外来语字母和图形符号。字符编码实 验 探 究打开记事本,输入say hello! 将其保存到电脑上然后查看文件的大小?字符编码打开记事本,输入say hello! 将其保存到电脑上然后查看文件的大小?实 验 探 究字符编码西文字符是如何转换为二进制的?哪些因素会影响西文字符在计算机中所在存储容量呢?ASCII码字符的个数编码方案汉字编码※ 汉字是如何转换为二进制的?※ 哪些因素会影响汉字在计算机中所在存储容量呢?字符编码(二)汉字编码大部分汉字用两个字节来表示,但有部分生僻字用四个字节表示。字符编码(三)unicode码.容纳世界上所有文字和符号。.每种语言中的每个字符设定了统一的且唯一的二进制编码。.一般用两个字节表示一个字符(非常偏僻的用4个字节)。.用unicode码比用ASCII码需要多一倍的空间,可变长的UTF-8。.UTF-8,1-6个字节,英文字母1个字节,汉字通常3个字节,生僻字4-6个字节。.UTF-16.UTF-32字符编码实 验 探 究9字节8字节15字节11字节18字节二、图像编码图像编码是什么图像编码的方式位图文件的大小二、图像编码※ 图像是如何转换为二进制的?※ 图像哪些因素会影响声音在计算机中所在存储容量呢?二、图像编码二、图像编码二、图像编码2^24=16777黑白图像 有2种(2=21)可选颜色 图像量化位数为1位16色图像 有16种(2=24)可选颜色 图像量化位数为4位256色图像 有256种(2=28)可选颜色 图像量化位数为8位24位真彩色 有16777种(2=224)可选颜色 图像量化位数为24位二、图像编码二、图像编码位图文件的大小(字节数)=图像分辨率×图像量化位数/8+颜色表项(4颜色种数)信息头(共40个字节)+文件头(共14个字节)有一幅8位的位置图图像,像素为1024×800,试确定其数据文件的大小。1024×800×8/8+4×256+40+14=820278≈8.2M三、声音编码※ 声音是如何转换为二进制的?※ 哪些因素会影响声音在计算机中所在存储容量呢?三、声音编码三、声音编码三、声音编码三、声音编码三、声音编码音频所占的存储容量:(采样频率×量化位数×声道数)÷8×持续时间100秒的双声道音乐,采样频率是44.1KHz,量化位数16位。计算该音频未经压缩时所占的存储容量。44.1×1000×16×2÷8×100=17640000Byte≈17MB。 展开更多...... 收起↑ 资源预览