资源简介 (共43张PPT)Big Data5.1 认识大数据创新 科技 思维 价值人工智能物联网云计算大数据大量的数据?=大数据大数据走进大数据大数据的概念大数据的特征大数据对日常生活的影响走进大数据PART 01出行到达的地点和选择的交通工具刷微博、所在地地理位置数据的产生在日常工作、生活和学习等活动中,人们的一举一动基本上都可以数字化。例如,从家中出门到达工作地点选择的交通工具、路线和所有时间;每刷一次微博、拨打一次电话、发送一条短信、网上银行转账或者浏览相关网站,甚至所在的地理位置信息等都产生了大量的数据。date大数据的概念PART 02什么是大数据?大数据是指无法在可承受的时间范围内用常规软件工具进行高效捕捉、管理和处理的信息集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。对谁做狭义大数据做什么目的大容量数据获取数据存储数据分析数据挖掘价值大数据1GB1MB1KB1024B1024KB1024MB大数据到底有多大1TB1024GB传统电脑 GB/TB级别硬盘 1TB/2TB/4TB大数据是什么级别?PBEB1 PB = 1024 TB (PB - petabyte)1 EB = 1024 PB (EB - exabyte)存储20万张照片20万首MP3音乐20万部电子书1TB硬盘存储2亿张照片2亿首MP3音乐1PB 2个机柜有多大?如果并排放这些机柜,可以连绵1.2公里那么长。如果摆放在机房里,需要21个标准篮球场那么大的机房1EB 2000个机柜阿里、腾讯、百度阿里数据中心的内景EB级别有多大?从2011年----2020年1.8ZB-35ZB数据1ZB=1024EB阶段自动被动主动数据产生阶段被动主动自动各行各业开始产生了数据,从而被记录在数据库中。这时的数据,以结构化数据为主计算机被发明之后的阶段随着互联网和移动通信设备的普及,人们开始使用博客、facebook、youtube这样的社交网络,从而主动产生了大量的数据。互联网2.0时代随着物联网的发展,各种各样的感知层节点开始自动产生大量的数据,例如遍布世界各个角落的传感器、摄像头。感知式系统阶段天气预报地球物理探矿大气监测天体运动观测大数据的产生大数据的特征PART 03大数据案例某市交通智能化分析平台的数据来源于道路交通、电信、地理信息系统等各行各业。例如,交通卡刷卡每天产生190万条记录,手机定位数据每天产生1800万条,出租车运营数据每天产生100万条,电子停车收费系统数据每天产生50万条,等等。这些数据在体量和速度上都达到了大数据的规模。特征4VBDCAVariety多样velocity高速Value低价值密度Volume大量互联网产生大数据角度CHANPIN低价值密度2014年美国波士顿爆炸案,现场调取了10TB的监控数据(包括移动基站的通讯记录,附近商店、加油站、报摊的监控录像以及志愿者提供的影像资料),最终找到了嫌疑犯的一张照片。大数据刚刚过去的一分钟数据世界里发生了什么?高速12306:1840张车票被卖出Twitter:98000条推送被发出Facebook:69.5万条状态被更新Youtube:2880分钟的视频被上传Google:200万次搜索请求被提交email:Email:2.04亿封被发出大数据案例搜索引擎公司通过跟踪网民对“感冒症状”以及“治疗”等关键词的搜索,发现某个时段在某个区域内搜索数量急剧增长,从而成功预测了新冠疫情的暴发时间、地域。样本趋于总体精确让位于模糊相关性重于因果The activities of a company with buying and selling a product or service. The activitiesThe activities of a company with buying and selling a product or service. The activitiesThe activities of a company with buying and selling a product or service. The activities互联网思维角度大数据案例目前,某基于大数据的网约车平台已覆盖全国400多个城市,涵盖出租车、快车、顺风车、代驾、专车、试驾以及租车等多项业务,为人们的出行带来极大的便利。我们只需在网约车APP上输入或者说出目的地,强大的智能系统就立刻分配订单,即时通知附近司机;借助定时定位系统,我们可以看到司机的大致位置以及预计到达时间。分布式存储分布式并行计算应用分布式并行计算处理互联网的大数据大数据存储在互联网不同的服务器和各客户终端大数据存储与计算角度讨论传统数据与大数据的区别?以小组为单位,通过查找资料、学习和交流,填写下表。传统数据 大数据数据量小数据类型少价值密度高更新速度慢追求数据精确性本地存储数据体量巨大数据类型繁多价值密度低更新速度快追求数据模糊性性分布式存储交流大数据对日常生活的影响PART 04使人们日常生活更为便捷方便支付方便出行方便购物与产品推介方便看病与诊病大数据影响方便支付网约车方便出行方便购物与产品推介购物行为分析方便看病与诊病麦当劳肯德基苹果旗舰店他们的位置都是建立在数据分析基础上的精准选址,沃尔玛通过数据挖掘优化供应链,亚马逊、淘宝则为用户提供更加专业化和个性化的服务。手机计算机网络信用卡等都会产生数据个人信息泄露被不法分子窃取、对我们及身边的亲人造成伤害信息伤害与诈骗大数据负面影响个人信息泄露信息诈骗数据泄露安全安全练习1、下列关于大数据的特征,说法正确的是( )A数据价值密度高B 数据类型少C.数据基本无变化D.数据体量巨大2、从互联网产生大数据的角度来看,大数据具有的特征是( )A“4V"特征:大量(Volume)、多样(Variety)、低价值密度(Value)、高速(Velocity )B样本渐趋于总体,精确让位于模糊,相关性重于因果C分布式存储, 分布式并行计算D.没有特征DA作业淘宝购物平台上各种商品应有尽有,假如你和同学在该平台开了一个零食网店,最近你要调整经营策略,以提高网店的盈利水平。在调整经营策略之前你必须进行前期调研分析,比如通过分析淘宝网上各类零食的销量数据,去重新定位销售商品的种类和价格;通过分析网店销售数据订单,去了解客户的购物喜好,去判断哪些商品可以捆绑销售。从而下架一些销量不好商品和上架一些新的商品。那么,你要完成前期调研工作,需要获取到哪些数据呢?怎样获取到这些数据呢?从获取数据中怎样提炼出有价值的信息呢?以小组为单位,通过学习、交流,探索和实践,得出可视化结论。THANKS创新 科技 思维 价值 展开更多...... 收起↑ 资源预览