资源简介 (共29张PPT)手机APP希望获得你的哪些信息?如果有监听,获得的数据规模巨大已经很难用传统方式进行处理。大数据技术应运而生改变生活数据与大数据第一章 1.41.5大数据时代2016年,数据科学家将大数据正式定义为:大数据代表着信息量大、速度快、种类繁多的信息资产,需要特定的技术和分析方法将其转化为价值。阅读书本26-27页,思考:1、什么是大数据?2、大数据的特征是什么?学生学籍系统中存放着大量的学生数据,这些数据是否是属于大数据?为什么?不是。1、通常指100 TB( 1TB=1024 GB )规模以上的数据量,数据量大是大数据的基本属性;2、大数据往往包含多种类型数据;3、大数据超出以往常用的数据采集、组织、管理和加工等软件的处理能力,要求新型集成技术从多元、复杂和巨量规模的数据集里洞察规律。阅读书本26-27页,思考:1、什么是大数据?2、大数据的特征是什么?身边的大数据应用安心出行路线规划精准推送广告投放大数据的特征Volume数量Velocity速度Variety多样Value价值数据体量巨大:以PB、EB或ZB为计量单位速度快:数据产生速度快数据处理速度快数据类型多:结构化、半结构化和非结构化数据共存价值密度低:价值大、数量大,可能发挥价值的是非常小的部分阅读书本26-27页,认识大数据的特征(存储单位从过去的GB到TB,乃至现在的PB、EB级别。)大数据的特征数据体量巨大1 KB = 1024 B (KB - kilobyte)1 MB = 1024 KB (MB - megabyte)1 GB = 1024 MB (GB - gigabyte)1 TB = 1024 GB (TB - terabyte)1 PB = 1024 TB (PB - petabyte)1 EB = 1024 PB (EB - exabyte)传统的个人电脑,处理的数据是GB/TB级;淘宝网近4亿的会员每天产生的商品交易数据约20TB;脸书约10亿的用户每天产生的日志数据超过300TB。数据正在快速增长,根据预测,到2024年全世界每年产生的数据总量将会达到143ZB(数据产生速度快、数据处理速度快)大数据的特征速度快每天处理过百亿条信息;每秒峰值几百万条;数据输入、处理与丢弃立刻见效。数据的生产和传播速度是非常迅速的(结构化、半结构化和非结构化数据共存)大数据的特征数据类型多结构化数据,如表格、财务系统数据、信息管理系统数据、医疗系统数据等,其特点是数据间因果关系强;非结构化数据,如视频、图片、音频等,其特点是数据间没有因果关系;半结构化数据,如HTML文档、邮件、网页等,其特点是数据间的因果关系弱。(价值大、数量大,可能发挥价值的是非常小的部分)大数据的特征价值密度低以视频为例,一部1小时的视频,在连续不间断的监控中,有用数据可能仅有一二秒。以小组为单位,讨论 “手机APP是否在‘监听’我们的生活?”这一话题,并派代表发言。课堂活动要求:1.确定发言人;2.明确记录者;3.完成汇报单;4.限时5分钟。以小组为单位,讨论 “手机APP是否在‘监听’我们的生活?”这一话题,并派代表发言。课堂活动1.技术上来说,并不存在于二十四小时能记录你每一句话,然后上传分析,还能智能解读的语音技术;2.监听手机是属于违法行为;3.APP只需要向你索要定位,读取联系人、WiFi、相册权限就可以对你进行精准的画像和追踪;4.读取剪贴板是系统赋予每个APP与生俱来的权利,剪贴板中又透漏出大量信息;……手机APP有多种途径获取我们的数据,进而起到“认识”我们的效果大数据对社会的影响大数据带来新的社会问题具备信息安全意识1、正确使用权限管理,如非必要,建议不要对APP开启手机的全部权限。2、甄别与远离危险APP,通过正规渠道下载软件;3、重要资料谨慎留存,避免将身份证、银行卡等证件拍照留存在手机相册中;4、不同软件尽量不要使用同一组账号密码;5、妥善处置快递单等包含个人信息的单据;……大数据对社会的影响大数据带来新的社会问题除手机的使用外,计算机数据管理与安全也需注意!!2020年,各种新型勒索病毒不断涌现。勒索病毒,是一种新型电脑病毒,主要以邮件、程序木马、网页挂马的形式进行传播。这种病毒利用各种加密算法对文件进行加密,被感染者一般无法解密,必须拿到解密的私钥才有可能破解。1.4.1数据管理文本文件常见的文件格式图像文件声音文件动画文件视频文件文件管理文本文件:txt;doc;wps;html;pdf图形像文件:jpg;bmp;gif;psd;png声音文件:wav;mid;mp3;wma动画文件:fla;gif;swf视频文件:avi;mpg;flv;mov1.4.1数据管理不要随意打开他人发送的网页链接、可执行程序(exe)或安装未知源的软件。数据库管理意义:①解决数据冗余的问题。②解决维护、更新数据时需要大量的人工干预的问题。1.4.1数据管理数据管理是利用 计算机硬件 和 软件技术 对数据进行有效 收集 、存储、 和 应用 的过程,其目的在于充分、有效地发挥数据的作用。计算机数据的管理已经经历了 人工管理 、文件管理和 数据库管理 三个阶段。现代社会数据管理的主要方式——传统数据库技术(1)基础:基于结构化数据开发。(2)特点:数据独立性、数据可共享(3)应用领域:政府、军工、教育、电力、金融、农业、卫生、交通、科技等行业。1.4.1数据管理2021年6月3日丘市睢(suī)阳区人民法院在裁判文书网,公开了一份刑事判决书,显示一名住在河南商丘市的本科毕业的大学生逯(lù)某自2019年11月起,对淘宝实施了长达八个月的数据爬取并盗走大量用户数据。在阿里巴巴注意到这一问题前,已经有超过11亿8千多万条用户信息泄露。。威胁数据安全的因素硬盘驱动器损坏、操作失误、黑客入侵、感染计算机病毒、遭受自然灾害……1.4.2数据安全保护数据安全的方法(1)做好防护上的安全保护存储数据的介质。对于政府部门或企业的数据,目前主要采取主动防护的手段,如通过磁盘列阵、数据备份、异地容灾。(2)提高数据本身的安全可通过数据加密、数据校验等方法提高数据的保密性和完整性。(3)个人保护数据的手段数据备份;定期杀毒;不访问危险网址;不打开危险邮件、链接;定期升级系统;安装系统补丁大数据思维分析的是全体数据,而不是抽样数据数据不再追求精确性,而是能够接受数据的混杂性不一定强调对事物因果关系,而是更加注重相关性大数据是一场变革, 改变的不仅是数据,还有人们的思维。大数据分析的是全体数据,而不是抽样数据全样本数据分析数据太多,无法保存和分析,统计学采用抽样;抽样数据能否取得重大成功,依赖于采样的“绝对随机性”。更加科学地得出结论,分析方法精准、全面;但存在技术门槛高,数据获取要求高等情况。抽样数据分析对于数据不再追求精确性,而是能够接受数据的混杂性对于传统的数据库,数据有严谨的结构,人们追求数据的准确性,通过各种技术或人工手段,来保证每个数据准确无误。而在大数据处理过程中,数据的来源多种多样,这些数据可以是结构化的、半结构化的,也可以是非结构化的。当数据量大到一定程度时,个别数据的不准确就显得不那么重要。不一定强调对事物因果关系,而是更加注重相关性相关关系通过识别有用的关联物来帮助人们分析一个现象,而不是揭示其内部机理。如果能够知道因果关系固然也好,但如果能够指导我下一步该做些什么,也就足够了。大数据对社会的影响大数据带来新的社会问题大数据已经渗入到社会的各个层面,不断提高工作效率与生活便利性大数据让决策更加精准大数据带来新的就业机会课堂小结课堂小结作业信息技术作业本《1.4数据管理与安全》及《1.5数据与大数据》的基础训练部分改变生活数据与大数据讨论汇报单汇报人:记录员:组员:内容:本小组经过讨论,一致认为:手机APP (是/否)在“监听”我们的生活?证据如下(请简要概括):1、2、3、我们认为,手机APP是通过以下途径 (“监听”/“了解”)我们的:1、2、3、4、手机APP的使用,我们的总体感受是:对于手机APP在使用中给部分人带来的恐慌,我们的建议是:我们小组汇报结束。 展开更多...... 收起↑ 资源列表 必修一1.41.5 数据与大数据.pptx 汇报单.docx