资源简介 (共44张PPT)第11课 预测模型构建年 级:九年级学 科:初中信息科技(浙教版)基于模型进行出行方式预测预测模型构建与训练出行数据采集数据预处理确定影响因素课前回顾人工智能预测出行的一般步骤我的人工智能预测出行项目 出行时间预测影响预测的因素 出行方式、距离、天气、特定时段、早 / 晚高峰、节日放假出行数据采集方式 访问气象台官方网站或 API 接口,获取每日的详细天气信息。问卷调查、社交媒体数据抓取及交通 APP 的数据共享,收集大家的出行日期、出发时间、目的地、出行方式及实际到达时间等信息。出行数据采集结果课前回顾是否节假日 是否高峰 出行方式 出行距离 (km) 雨雪 到达时间 (min)是 是 自驾 3.9 小 7是 是 自行车 3.7 无 17是 是 滴滴出行 1.3 无 两是 是 自驾 8 无 16否 否 自行车 1.8 无 八是 是 出租车 1.2 大 4是 是 自行车 5.4 大 26是 是 火车 5.2 大 30是 是 自行车 300000000 无 14是 否 出租车 3.9 无 16是 是 自行车 0.9 无 4是 是 打车 1.4 无 9是 否 开车 3.8 无 10否 否 打车 4.3 无 20是 是 自己开车 9.6 无 17是 否 自行车 2.9 无 15是 否 自己开车 13.3 大 35是 是 步行 1.6 无 24是 否 自驾 4.3 无 15是 是 步行 3.1 中 49课前回顾我的人工智能预测出行项目 拥堵情况预测影响预测的因素 时间、天气、道路口的设施条件、不同车辆的行驶速度和驾驶行为、突发事件(交通事故、道路施工)和大型活动出行数据采集方式 气象台的信息和交通 app 的数据共享“道路口的设施条件、不同车辆的行驶速度和驾驶行为、突发事件(交通事故、道路施工)和大型活动” 的数据采集困难出行数据采集结果日期 时间 是否下雨 是否下雪 是否有雾 拥堵情况2012 年 10 月 2 日 9:00 否 否 否 拥堵2012 年 10 月 2 日 10:00 否 否 否 拥堵2012 年 10 月 2 日 11:00 否 否 否 拥堵2012 年 10 月 2 日 12:00 否 否 否 拥堵2012 年 10 月 2 日 13:00 否 否 否 拥堵2012 年 10 月 2 日 14:00 否 否 否 拥堵2012 年 10 月 2 日 15:00 否 否 否 拥堵2012 年 10 月 2 日 16:00 否 否 否 严重拥堵2012 年 10 月 2 日 17:00 否 否 否 拥堵2012 年 10 月 2 日 18:00 否 否 否 拥堵2012 年 10 月 2 日 19:00 否 否 否 缓行2012 年 10 月 2 日 20:00 否 否 否 缓行2012 年 10 月 2 日 21:00 否 否 否 缓行2012 年 10 月 2 日 22:00 否 否 否 通畅2012 年 10 月 2 日 23:00 否 否 否 通畅2012 年 10 月 3 日 0:00 否 否 否 通畅2012 年 10 月 3 日 1:00 否 否 否 通畅2012 年 10 月 3 日 2:00 否 否 否 通畅数据预处理 - 构建数据集是否节假日 是否高峰 出行方式 出行距离 (km) 雨雪 到达时间 (min)是 是 自驾 3.9 小 7是 是 自行车 3.7 无 17是 是 滴滴出行 1.3 无 两是 是 自驾 8 无 16否 否 自行车 1.8 无 八是 是 出租车 1.2 大 4是 是 自行车 5.4 大 26是 是 火车 5.2 大 30是 是 自行车 300000000 无 14是 否 出租车 3.9 无 16是 是 自行车 0.9 无 4是 是 打车 1.4 无 9是 否 开车 3.8 无 10否 否 打车 4.3 无 20是 是 自己开车 9.6 无 17是 否 自行车 2.9 无 15是 否 自己开车 13.3 大 35是 是 步行 1.6 无 24是 否 自驾 4.3 无 15是 是 步行 3.1 中 49数据预处理 - 构建数据集日期 时间 是否下雨 是否下雪 是否有雾 拥堵情况2012 年 10 月 2 日 9:00 否 否 否 拥堵2012 年 10 月 2 日 10:00 否 否 否 拥堵2012 年 10 月 2 日 11:00 否 否 否 拥堵2012 年 10 月 2 日 12:00 否 否 否 拥堵2012 年 10 月 2 日 13:00 否 否 否 拥堵2012 年 10 月 2 日 14:00 否 否 否 拥堵2012 年 10 月 2 日 15:00 否 否 否 拥堵2012 年 10 月 2 日 16:00 否 否 否 严重拥堵2012 年 10 月 2 日 17:00 否 否 否 拥堵2012 年 10 月 2 日 18:00 否 否 否 拥堵2012 年 10 月 2 日 19:00 否 否 否 缓行2012 年 10 月 2 日 20:00 否 否 否 缓行2012 年 10 月 2 日 21:00 否 否 否 缓行2012 年 10 月 2 日 22:00 否 否 否 通畅2012 年 10 月 2 日 23:00 否 否 否 通畅2012 年 10 月 3 日 0:00 否 否 否 通畅2012 年 10 月 3 日 1:00 否 否 否 通畅2012 年 10 月 3 日 2:00 否 否 否 通畅数据预处理 - 构建数据集1.打开自己采集的数据,分析其中存在哪些问题,思考该如何进行处理,并记录在任务单上。学习活动一:异常数据 数据预处理方案【学习任务一】打开自己采集的数据,分析其中存在哪些问题,思考该如何进行处理,并记录在下方表格中。数据预处理 - 构建数据集数据范围采集方式数据单位数据预处理 - 构建数据集数据清洗的策略异常值偏离正常样本过多的值数据预处理 - 构建数据集数据清洗的策略异常值数据预处理 - 构建数据集数据预处理 - 构建数据集数据清洗的策略异常值数据预处理 - 构建数据集删除异常值的情况:1. 确定异常值是由于数据错误造成的;2. 数据集足够大,删除几个点不会显著影响分析;3. 异常值不能代表正在研究的人群时。谨慎删除数据清洗的策略异常值数据预处理 - 构建数据集直接删除数据清洗的策略缺失值数据预处理 - 构建数据集根据其分布特性选择均值、中位数填充,或使用定值法、插值法、机器学习模型预测等方法。数据清洗的策略缺失值数据预处理 - 构建数据集数据格式数据范围采集方式数据单位数据预处理 - 构建数据集数据格式数据范围采集方式数据单位数据预处理 - 构建数据集采集方式数据格式数据范围数据单位采样频率构建数据集的方式:预测模型建构确定数据采集方式、数据格式、数据范围、采样频率等信息,再标注、存 储和管理数据。2. 打开自己采集的数据,根据数据预处理方案,动手实践。学习活动一:数据预处理 - 构建数据集数据预处理 - 构建数据集是否节假日 是否高峰 出行方式 出行距离(km) 雨雪 到达时间(min)是 是 自驾 3.9 小 7是 是 自行车 3.7 无 17是 是 出租车 1.3 无 2是 是 自驾 8 无 16否 否 自行车 1.8 无 8是 是 出租车 1.2 大 4是 是 自行车 5.4 大 26是 是 火车 5.2 大 30是 是 自行车 3 无 14是 否 出租车 3.9 无 16是 是 自行车 0.9 无 4这份数据合格了吗?数据预处理 - 构建数据集是否节假日 是否高峰 出行方式 出行距离(km) 雨雪 到达时间(min)是 是 自驾 3.9 小 7是 是 自行车 3.7 无 17是 是 出租车 1.3 无 2是 是 自驾 8 无 16否 否 自行车 1.8 无 8是 是 出租车 1.2 大 4是 是 自行车 5.4 大 26是 是 火车 5.2 大 30是 是 自行车 3 无 14是 否 出租车 3.9 无 16是 是 自行车 0.9 无 4这份数据合格了吗?数据预处理 - 构建数据集是否节假日 是否高峰 出行方式 出行距离(km) 雨雪 到达时间(min)是 是 自驾 3.9 小 7是 是 自行车 3.7 无 17是 是 出租车 1.3 无 2是 是 自驾 8 无 16否 否 自行车 1.8 无 8是 是 出租车 1.2 大 4是 是 自行车 5.4 大 26是 是 火车 5.2 大 30是 是 自行车 3 无 14是 否 出租车 3.9 无 16是 是 自行车 0.9 无 4如何非数值信息转换为数值信息?数据预处理 - 构建数据集是否节假日 是否高峰 出行方式 出行距离(km) 雨雪 到达时间(min)是 是 自驾 3.9 小 7是 是 自行车 3.7 无 17是 是 出租车 1.3 无 2是 是 自驾 8 无 16否 否 自行车 1.8 无 8是 是 出租车 1.2 大 4是 是 自行车 5.4 大 26是 是 火车 5.2 大 30是 是 自行车 3 无 14是 否 出租车 3.9 无 16是 是 自行车 0.9 无 4如何非数值信息转换为数值信息?数据预处理 - 构建数据集1. 确定量化标准,并记录任务单。学习活动二:数据项 编码方案数据预处理 - 构建数据集是否节假日 是否高峰 出行方式 出行距离(km) 雨雪 到达时间(min)是 是 自驾 3.9 小 7是 是 自行车 3.7 无 17是 是 出租车 1.3 无 2是 是 自驾 8 无 16否 否 自行车 1.8 无 8是 是 出租车 1.2 大 4是 是 自行车 5.4 大 26是 是 火车 5.2 大 30是 是 自行车 3 无 14是 否 出租车 3.9 无 16是 是 自行车 0.9 无 4数据预处理 - 构建数据集是否节假日 是否高峰 出行方式 出行距离(km) 雨雪 到达时间(min)是 是 自驾 3.9 小 7是 是 自行车 3.7 无 17是 是 出租车 1.3 无 2是 是 自驾 8 无 16否 否 自行车 1.8 无 8是 是 出租车 1.2 大 4是 是 自行车 5.4 大 26是 是 火车 5.2 大 30是 是 自行车 3 无 14是 否 出租车 3.9 无 16是 是 自行车 0.9 无 4量化标准:0 是1 否0 00 00 00 01 10 00 00 00 00 10 0数据预处理 - 构建数据集是否节假日 是否高峰 出行方式 出行距离(km) 雨雪 到达时间(min)是 是 自驾 3.9 小 7是 是 自行车 3.7 无 17是 是 出租车 1.3 无 2是 是 自驾 8 无 16否 否 自行车 1.8 无 8是 是 出租车 1.2 大 4是 是 自行车 5.4 大 26是 是 火车 5.2 大 30是 是 自行车 3 无 14是 否 出租车 3.9 无 16是 是 自行车 0.9 无 40 00 00 00 01 10 00 00 00 00 10 0量化标准:1 步行2 自行车3 驾车4 出租车5 公交车6 火车32432426242数据预处理 - 构建数据集是否节假日 是否高峰 出行方式 出行距离(km) 雨雪 到达时间(min)是 是 自驾 3.9 小 7是 是 自行车 3.7 无 17是 是 出租车 1.3 无 2是 是 自驾 8 无 16否 否 自行车 1.8 无 8是 是 出租车 1.2 大 4是 是 自行车 5.4 大 26是 是 火车 5.2 大 30是 是 自行车 3 无 14是 否 出租车 3.9 无 16是 是 自行车 0.9 无 40 00 00 00 01 10 00 00 00 00 10 032432426242量化标准:0 无1 小雨2 中雨3 大雨4 小雪5 中雪6 大雪10000336000数据预处理 - 构建数据集是否节假日 是否高峰 出行方式 出行距离(km) 雨雪 到达时间(min)是 是 自驾 3.9 小 7是 是 自行车 3.7 无 17是 是 出租车 1.3 无 2是 是 自驾 8 无 16否 否 自行车 1.8 无 8是 是 出租车 1.2 大 4是 是 自行车 5.4 大 26是 是 火车 5.2 大 30是 是 自行车 3 无 14是 否 出租车 3.9 无 16是 是 自行车 0.9 无 40 00 00 00 01 10 00 00 00 00 10 03243242624210000336000常见的编码方式独热编码标签编码频率编码标签编码数据预处理 - 构建数据集是否节假日 是否高峰 出行方式 出行距离(km) 雨雪 到达时间(min)是 是 自驾 3.9 小 7是 是 自行车 3.7 无 17是 是 出租车 1.3 无 2是 是 自驾 8 无 16否 否 自行车 1.8 无 8是 是 出租车 1.2 大 4是 是 自行车 5.4 大 26是 是 火车 5.2 大 30是 是 自行车 3 无 14是 否 出租车 3.9 无 16是 是 自行车 0.9 无 40 00 00 00 01 10 00 00 00 00 10 03243242624210000336000开动脑筋:日期该如何量化?2. 打开自己的数据集,结合编码方案,动手处理数据。学习活动二:数据预处理 - 构建数据集数据预处理 - 构建数据集这份数据合格了吗?基于模型进行出行方式预测预测模型构建与训练出行数据采集数据预处理确定影响因素课前回顾人工智能预测出行的一般步骤模型训练1. 打开代码,阅读并分析代码中有几个功能模块,并记录在任务单上。学习活动三:代码有____个模块 每个模块的功能模型训练代码有____个模块 每个模块的功能1. 输入历史数据2. 利用输入的历史数据,训练神经网络模型。3. 输入新的数据4. 模型预测,并输出预测结果和误差。4模型训练2. 总结训练人工智能预测模型的过程,并填写在任务单上。学习活动三:构建数据集的方式:预测模型建构确定数据采集方式、数据格式、数据范围、采样频率等信息,再标注、存 储和管理数据。新数据结果预测输入训练“标签”“特征”历史数据神经网络训练模型模型训练将处理好的数据集命名为“data.xls”,复制到程序文件的根目录处,并运行代码,记录模型的预测结果学习活动四:实际数据 预测结果 预测平均误差模型训练课后作业请同学们填写项目化结构反馈表,分析本项目的亮点、问题并思考如何解决。项目目标: P(plus)/ 亮点D(delta)/ 建议Q(question)/ 问题下课Thanks!https://www.21cnjy.com/recruitment/home/fine 展开更多...... 收起↑ 资源列表 media1.mov 第11课 预测模型构建 课件 2025-2026学年九年级全册信息技术浙教版.pptx