资源简介 (共27张PPT)第5单元数据分析与人工智能Contents5.1 走近数据分析e7d195523061f1c0c2b73831c94a3edc981f60e396d3e182073EE1468018468A7F192AE5E5CD515B6C3125F8AF6E4EE646174E8CF0B46FD19828DCE8CDA3B3A044A74F0E769C5FA8CB87AB6FC303C8BA3785FAC64AF54247D6964A8FBCED17CC661E9BBDBC040BE2E9BB5E7852A1CA2182FF1ADFE626A1F75E2AA4E3E887391BF8A0180D4EB5E92BD1FF04EF24E0AA94125.2 探秘人工智能PRESENTATION TEMPLATESIMPLY | SIMPLE | MODERNe7d195523061f1c0c2b73831c94a3edc981f60e396d3e182073EE1468018468A7F192AE5E5CD515B6C3125F8AF6E4EE646174E8CF0B46FD19828DCE8CDA3B3A044A74F0E769C5FA8CB87AB6FC303C8BA3785FAC64AF54247D6964A8FBCED17CC661E9BBDBC040BE2E9BB5E7852A1CA2182FF1ADFE626A1F75E2AA4E3E887391BF8A0180D4EB5E92BD1FF04EF24E0AA94学习目标★ 了解数据分析的几种常用方法。★ 体验对比分析和平均分析的—般分析过程。★ 了解大数据的含义,认识大数据分析在信息社会的重要作用。e7d195523061f1c0c2b73831c94a3edc981f60e396d3e182073EE1468018468A7F192AE5E5CD515B6C3125F8AF6E4EE646174E8CF0B46FD19828DCE8CDA3B3A044A74F0E769C5FA8CB87AB6FC303C8BA3785FAC64AF54247D6964A8FBCED17CC661E9BBDBC040BE2E9BB5E7852A1CA2182FF1ADFE626A1F75E2AA4E3E887391BF8A0180D4EB5E92BD1FF04EF24E0AA9427路49路小海同学每天7: 00乘坐27路车去学校,17: 00左右放学回家。他觉得每天往返途中,公交车上并不拥挤。而妈妈每天8: 00乘坐49路车出发,18: 00下班。她总是抱怨乘车者太多。真相只有一个,到底是什么?e7d195523061f1c0c2b73831c94a3edc981f60e396d3e182073EE1468018468A7F192AE5E5CD515B6C3125F8AF6E4EE646174E8CF0B46FD19828DCE8CDA3B3A044A74F0E769C5FA8CB87AB6FC303C8BA3785FAC64AF54247D6964A8FBCED17CC661E9BBDBC040BE2E9BB5E7852A1CA2182FF1ADFE626A1F75E2AA4E3E887391BF8A0180D4EB5E92BD1FF04EF24E0AA94活动一 进行数据分析一、师生讨论,提出假设假设1:可能49路车8:00与18:00左右客流量比27路7:00与17:00客流量大。假设2:可能8:00与18:00刚好是49路车的高峰期,而7:00与17:00不是27路车的高峰期。假设3:可能某一段时间内49路车的平均客流量要更大。e7d195523061f1c0c2b73831c94a3edc981f60e396d3e182073EE1468018468A7F192AE5E5CD515B6C3125F8AF6E4EE646174E8CF0B46FD19828DCE8CDA3B3A044A74F0E769C5FA8CB87AB6FC303C8BA3785FAC64AF54247D6964A8FBCED17CC661E9BBDBC040BE2E9BB5E7852A1CA2182FF1ADFE626A1F75E2AA4E3E887391BF8A0180D4EB5E92BD1FF04EF24E0AA94直接数据/原始数据/一手数据间接数据/二手数据统计调查或科学实验通过查阅资料获得的数据,或他人对原始数据处理过的数据。数据的来源与收集数据的来源旧知全班同学的测试结果从网上搜索到的各人格解析e7d195523061f1c0c2b73831c94a3edc981f60e396d3e182073EE1468018468A7F192AE5E5CD515B6C3125F8AF6E4EE646174E8CF0B46FD19828DCE8CDA3B3A044A74F0E769C5FA8CB87AB6FC303C8BA3785FAC64AF54247D6964A8FBCED17CC661E9BBDBC040BE2E9BB5E7852A1CA2182FF1ADFE626A1F75E2AA4E3E887391BF8A0180D4EB5E92BD1FF04EF24E0AA94调查法访谈法观察法实验法直接数据数据的来源与收集旧知e7d195523061f1c0c2b73831c94a3edc981f60e396d3e182073EE1468018468A7F192AE5E5CD515B6C3125F8AF6E4EE646174E8CF0B46FD19828DCE8CDA3B3A044A74F0E769C5FA8CB87AB6FC303C8BA3785FAC64AF54247D6964A8FBCED17CC661E9BBDBC040BE2E9BB5E7852A1CA2182FF1ADFE626A1F75E2AA4E3E887391BF8A0180D4EB5E92BD1FF04EF24E0AA94查阅文献资料关注媒体资源从相关数据公司购买浏览权威网站利用搜索引擎在网上进行检索间接数据数据的来源与收集旧知已经经过加工处理,使用起来更加方便e7d195523061f1c0c2b73831c94a3edc981f60e396d3e182073EE1468018468A7F192AE5E5CD515B6C3125F8AF6E4EE646174E8CF0B46FD19828DCE8CDA3B3A044A74F0E769C5FA8CB87AB6FC303C8BA3785FAC64AF54247D6964A8FBCED17CC661E9BBDBC040BE2E9BB5E7852A1CA2182FF1ADFE626A1F75E2AA4E3E887391BF8A0180D4EB5E92BD1FF04EF24E0AA94二、对比数据,分析方法8点与18点的49路车比7点与17点的27路车客流量更大?对比分析中的横向对比分析是指在类似的或同类的事物之间进行比较,从而揭示两类事物之间的关系。假设1:2749e7d195523061f1c0c2b73831c94a3edc981f60e396d3e182073EE1468018468A7F192AE5E5CD515B6C3125F8AF6E4EE646174E8CF0B46FD19828DCE8CDA3B3A044A74F0E769C5FA8CB87AB6FC303C8BA3785FAC64AF54247D6964A8FBCED17CC661E9BBDBC040BE2E9BB5E7852A1CA2182FF1ADFE626A1F75E2AA4E3E887391BF8A0180D4EB5E92BD1FF04EF24E0AA94假设2:如果你想知道49路车和27路车的高峰期呢?对同一事物不同时间客流量进行对比分析,这种分析方式被称为纵向对比分析。二、对比数据,分析方法27e7d195523061f1c0c2b73831c94a3edc981f60e396d3e182073EE1468018468A7F192AE5E5CD515B6C3125F8AF6E4EE646174E8CF0B46FD19828DCE8CDA3B3A044A74F0E769C5FA8CB87AB6FC303C8BA3785FAC64AF54247D6964A8FBCED17CC661E9BBDBC040BE2E9BB5E7852A1CA2182FF1ADFE626A1F75E2AA4E3E887391BF8A0180D4EB5E92BD1FF04EF24E0AA94例如比较不同线路的平均客流量。通过求得的平均数来代表车辆在一定时间内的一般客流量水平,这样比较平均数,就可以知道那条线路客流量更大,这种分析方式称为平均分析法。假设3:如何证明某段时间49路车的平均客流量大于27路?27路与49路公交线路客流量表 时间段 27路 49路 时间段 27路 49路6:00-7:00 45 61 15:00-16:00 58 987:00-8:00 120 170 16:00-17:00 70 1028:00-9:00 160 211 17:00-18:00 120 1259:00-10:00 143 149 18:00-19:00 121 12310:00-11:00 53 122 19:00-20:00 65 5711:00-12:00 72 99 20:00-21:00 50 3012:00-13:00 59 65 21:00-22:00 30 2513:00-14:00 58 100 22:00-23:00 16 1314:00-15:00 56 96二、数据计算,平均分析e7d195523061f1c0c2b73831c94a3edc981f60e396d3e182073EE1468018468A7F192AE5E5CD515B6C3125F8AF6E4EE646174E8CF0B46FD19828DCE8CDA3B3A044A74F0E769C5FA8CB87AB6FC303C8BA3785FAC64AF54247D6964A8FBCED17CC661E9BBDBC040BE2E9BB5E7852A1CA2182FF1ADFE626A1F75E2AA4E3E887391BF8A0180D4EB5E92BD1FF04EF24E0AA94数据分析主要用于现状分析、原因分析和预测分析。进行数据分析时1.首先要根据分析的目标提出假设2.选择恰当的分析方法进行分析,验证假设是否正确3.得出相应的结论。数据分析提出假设进行分析验证假设得出结论e7d195523061f1c0c2b73831c94a3edc981f60e396d3e182073EE1468018468A7F192AE5E5CD515B6C3125F8AF6E4EE646174E8CF0B46FD19828DCE8CDA3B3A044A74F0E769C5FA8CB87AB6FC303C8BA3785FAC64AF54247D6964A8FBCED17CC661E9BBDBC040BE2E9BB5E7852A1CA2182FF1ADFE626A1F75E2AA4E3E887391BF8A0180D4EB5E92BD1FF04EF24E0AA94善于学习,更善于总结你认为横向对比分析法与纵向对比分析法有什么区别?与平均分析法呢?数据分析方法 应用实例 适用范围 作用横行对比分析纵向对比分析平均分析部分食物中营养营养成分对比表一天中气温的变化情况不同食物中蛋白质含量的对比;49路车与27路车客流量的对比同类事物比较事物间大小、数量关系一天气温变化情况;49路车客流高峰期单一事物展现变化过程同类事物水果类食物中蛋白质含量的平均值;国家人口的平均寿命衡量平均水平e7d195523061f1c0c2b73831c94a3edc981f60e396d3e182073EE1468018468A7F192AE5E5CD515B6C3125F8AF6E4EE646174E8CF0B46FD19828DCE8CDA3B3A044A74F0E769C5FA8CB87AB6FC303C8BA3785FAC64AF54247D6964A8FBCED17CC661E9BBDBC040BE2E9BB5E7852A1CA2182FF1ADFE626A1F75E2AA4E3E887391BF8A0180D4EB5E92BD1FF04EF24E0AA94数据可视化表达以图形、图像和动画等方式更加直观、生动地呈现数据及数据分析结果,揭示数据之间的关系趋势和规律等的表达方式。基本图表类型:柱状图饼图折线图专业性工具:WordArtCitespace微词云e7d195523061f1c0c2b73831c94a3edc981f60e396d3e182073EE1468018468A7F192AE5E5CD515B6C3125F8AF6E4EE646174E8CF0B46FD19828DCE8CDA3B3A044A74F0E769C5FA8CB87AB6FC303C8BA3785FAC64AF54247D6964A8FBCED17CC661E9BBDBC040BE2E9BB5E7852A1CA2182FF1ADFE626A1F75E2AA4E3E887391BF8A0180D4EB5E92BD1FF04EF24E0AA94数据分析报告组成目的背景存在的问题希望解决的问题数据来源思路?分析的过程结论建议方法模型e7d195523061f1c0c2b73831c94a3edc981f60e396d3e182073EE1468018468A7F192AE5E5CD515B6C3125F8AF6E4EE646174E8CF0B46FD19828DCE8CDA3B3A044A74F0E769C5FA8CB87AB6FC303C8BA3785FAC64AF54247D6964A8FBCED17CC661E9BBDBC040BE2E9BB5E7852A1CA2182FF1ADFE626A1F75E2AA4E3E887391BF8A0180D4EB5E92BD1FF04EF24E0AA94任务二 体验公交服务假如来到一个陌生的地方,需要知道自己所处的具体位置,拿出手机,里面的地图软件可以很方便地帮助你定位、计算并推荐去目的地的路线假设我现在学校,计划从华师附中出发前往友谊阳光城e7d195523061f1c0c2b73831c94a3edc981f60e396d3e182073EE1468018468A7F192AE5E5CD515B6C3125F8AF6E4EE646174E8CF0B46FD19828DCE8CDA3B3A044A74F0E769C5FA8CB87AB6FC303C8BA3785FAC64AF54247D6964A8FBCED17CC661E9BBDBC040BE2E9BB5E7852A1CA2182FF1ADFE626A1F75E2AA4E3E887391BF8A0180D4EB5E92BD1FF04EF24E0AA94e7d195523061f1c0c2b73831c94a3edc981f60e396d3e182073EE1468018468A7F192AE5E5CD515B6C3125F8AF6E4EE646174E8CF0B46FD19828DCE8CDA3B3A044A74F0E769C5FA8CB87AB6FC303C8BA3785FAC64AF54247D6964A8FBCED17CC661E9BBDBC040BE2E9BB5E7852A1CA2182FF1ADFE626A1F75E2AA4E3E887391BF8A0180D4EB5E92BD1FF04EF24E0AA94大数据分析是指对规模巨大的数据进行分析。对数量巨大、来源分散、格式多样的数据进行采集、存储和分析关联,从中发现新知识、创造新价值、提升新能力的新一代信息技术和服务业态。e7d195523061f1c0c2b73831c94a3edc981f60e396d3e182073EE1468018468A7F192AE5E5CD515B6C3125F8AF6E4EE646174E8CF0B46FD19828DCE8CDA3B3A044A74F0E769C5FA8CB87AB6FC303C8BA3785FAC64AF54247D6964A8FBCED17CC661E9BBDBC040BE2E9BB5E7852A1CA2182FF1ADFE626A1F75E2AA4E3E887391BF8A0180D4EB5E92BD1FF04EF24E0AA94在公交站台等车,久等不来总令人焦急实时公交信息查询软件则可以实时反馈公交车辆的运行信息,提升乘客的出行效率。e7d195523061f1c0c2b73831c94a3edc981f60e396d3e182073EE1468018468A7F192AE5E5CD515B6C3125F8AF6E4EE646174E8CF0B46FD19828DCE8CDA3B3A044A74F0E769C5FA8CB87AB6FC303C8BA3785FAC64AF54247D6964A8FBCED17CC661E9BBDBC040BE2E9BB5E7852A1CA2182FF1ADFE626A1F75E2AA4E3E887391BF8A0180D4EB5E92BD1FF04EF24E0AA94实时公交系统根据用户当前的位置,迅速定位最近的公交站点,查找系统中公交车辆的位置数据,选出经过该站点所有线路车辆的即将到站信息,使用户可以直观地在手机上查看车辆实时位置。e7d195523061f1c0c2b73831c94a3edc981f60e396d3e182073EE1468018468A7F192AE5E5CD515B6C3125F8AF6E4EE646174E8CF0B46FD19828DCE8CDA3B3A044A74F0E769C5FA8CB87AB6FC303C8BA3785FAC64AF54247D6964A8FBCED17CC661E9BBDBC040BE2E9BB5E7852A1CA2182FF1ADFE626A1F75E2AA4E3E887391BF8A0180D4EB5E92BD1FF04EF24E0AA94实时公交信息查询软件使用体验 序号 体验并思考问题 结果1 查看该软件为用户提供了哪些实用功能? 路线、时间及距离查询2 如果有条件,乘公交车出行时使用该软件,并回答以下问题: 1.它所提供的公交车运行信息是否及时准确? 2.它是否可以提供多种出行方案? 基本准确 可以提供多种出行方案3 定位公交车位置信息需要哪些技术?它们各有什么优缺点? GPS/北斗定位技术、3G/4G通信技术、GIS地理信息系统技术大数据分析带来价值的同时,也在隐私保护、安全问题等方面带来危机。因此,合理、健康地使用大数据,遵循“数据道德” 是我们的必备品质。e7d195523061f1c0c2b73831c94a3edc981f60e396d3e182073EE1468018468A7F192AE5E5CD515B6C3125F8AF6E4EE646174E8CF0B46FD19828DCE8CDA3B3A044A74F0E769C5FA8CB87AB6FC303C8BA3785FAC64AF54247D6964A8FBCED17CC661E9BBDBC040BE2E9BB5E7852A1CA2182FF1ADFE626A1F75E2AA4E3E887391BF8A0180D4EB5E92BD1FF04EF24E0AA94大数据分析的应用大数据分析离我们生活并不遥远,生活中广泛应用着,比如在教育、医疗、保险、商业、金融等方面。再比如衣食住行方面:1、淘宝通过对海量数据的掌握和分析,为用户提供更加个性化和专业化的服务。2、出行的实时交通3、......面对海量的数据,为了搜索、处理、分析、归纳和总结其深层次的规律,大数据分析应运而生。e7d195523061f1c0c2b73831c94a3edc981f60e396d3e182073EE1468018468A7F192AE5E5CD515B6C3125F8AF6E4EE646174E8CF0B46FD19828DCE8CDA3B3A044A74F0E769C5FA8CB87AB6FC303C8BA3785FAC64AF54247D6964A8FBCED17CC661E9BBDBC040BE2E9BB5E7852A1CA2182FF1ADFE626A1F75E2AA4E3E887391BF8A0180D4EB5E92BD1FF04EF24E0AA94 存储是分布的呀!“分布式”的存储为以后“分布式处理”做准备,“分布”是高效处理的前提,否则大数据处理怎么这么快。处理也是分布!在分析之前对数据进行规整化是处理阶段的重要工作。一切为了提高效率!大数据分析的方法有很多,统计分析和数据挖掘也是大数据分析。大数据采集分布式文件存储分布式数据库存储分布式处理分析拓展知识因为大数据的量大到不能再使用常规的方法进行存储和处理,所以大数据分析和普通的数据分析也有所区别。大数据分析的一般流程可以表示如图:e7d195523061f1c0c2b73831c94a3edc981f60e396d3e182073EE1468018468A7F192AE5E5CD515B6C3125F8AF6E4EE646174E8CF0B46FD19828DCE8CDA3B3A044A74F0E769C5FA8CB87AB6FC303C8BA3785FAC64AF54247D6964A8FBCED17CC661E9BBDBC040BE2E9BB5E7852A1CA2182FF1ADFE626A1F75E2AA4E3E887391BF8A0180D4EB5E92BD1FF04EF24E0AA941.某公司根据对上一年各个季度原材料供应商A送货量及时率的分析及建模,预测本季度该供应商的订单履约率下降2%。该过程最有可能用到的数据分析方法有?( )A.平均分析 B.纵向对比分析 C.横向对比分析 D.一般分析2.某企业通过分析及统计不同的客户对于同一内容的刷新时间、处理时间及解决问题的时间等,推测一般用户的使用时间。该过程最有可能用到的数据分析方法有?( )A.平均分析 B.纵向对比分析 C.横向对比分析 D.一般分析巩固提升BACe7d195523061f1c0c2b73831c94a3edc981f60e396d3e182073EE1468018468A7F192AE5E5CD515B6C3125F8AF6E4EE646174E8CF0B46FD19828DCE8CDA3B3A044A74F0E769C5FA8CB87AB6FC303C8BA3785FAC64AF54247D6964A8FBCED17CC661E9BBDBC040BE2E9BB5E7852A1CA2182FF1ADFE626A1F75E2AA4E3E887391BF8A0180D4EB5E92BD1FF04EF24E0AA94案例分析:根据大数据发现人们的出行规律在美国旧金山举行的KDD2016学术会议上,罗格斯大学的熊辉等学者向大家报告了他们的研究论文。论文指出,北京在2014年的前9个月就有350名扒手在地铁交通系统上被抓, 490名扒手在公交车上被抓。因此,他们认为可以通过对北京智能公交一卡通数据进行分析研究,根据异常交通记录分析来抓小偷。如要实现这个功能,要调用哪些数据呢?同学们也可以上网搜索相关资料,了解大数据专家是如何分析的。参考答案:案例来源于熊辉等学者提交的论文。论文中阐述了他收集乘客的公交一卡通数据记录,分析了896条地铁经过的44524个公交车站和18条地铁经过的320个地铁站的数据。从出行轨迹提取特征。例如正常行人在从A地区到B地区会考虑最短时间、距离,或者最少换乘,但是类似“A-C-D-B”这种无目的的异常交通方式为异常行为。如果异常行为足够多,则他可能是一名扒手。具体的算法和模型,可见论文详细描述。(有兴趣的同学,再继续研究)拓展练习e7d195523061f1c0c2b73831c94a3edc981f60e396d3e182073EE1468018468A7F192AE5E5CD515B6C3125F8AF6E4EE646174E8CF0B46FD19828DCE8CDA3B3A044A74F0E769C5FA8CB87AB6FC303C8BA3785FAC64AF54247D6964A8FBCED17CC661E9BBDBC040BE2E9BB5E7852A1CA2182FF1ADFE626A1F75E2AA4E3E887391BF8A0180D4EB5E92BD1FF04EF24E0AA94课堂小结走近数据分析体验公交出行体验实时公交数据分析的基本方法数据可视化表达数据分析报告对比分析法平均分析法大数据地图软件含义重要作用THANK four watching 展开更多...... 收起↑ 资源预览