第11课 预测模型构建 课件 2025-2026学年九年级全册信息技术浙教版

资源下载
  1. 二一教育资源

第11课 预测模型构建 课件 2025-2026学年九年级全册信息技术浙教版

资源简介

(共44张PPT)
第11课 预测模型构建
年 级:九年级
学 科:初中信息科技(浙教版)
基于模型进行出行方式预测
预测模型构建与训练
出行数据采集
数据预处理
确定影响因素
课前回顾
人工智能预测出行的一般步骤
我的人工智能预测出行项目 出行时间预测
影响预测的因素 出行方式、距离、天气、特定时段、早 / 晚高峰、节日放假
出行数据采集方式 访问气象台官方网站或 API 接口,获取每日的详细天气信息。
问卷调查、社交媒体数据抓取及交通 APP 的数据共享,收集大家的出行日期、出发时间、目的地、出行方式及实际到达时间等信息。
出行数据采集结果
课前回顾
是否节假日 是否高峰 出行方式 出行距离 (km) 雨雪 到达时间 (min)
是 是 自驾 3.9 小 7
是 是 自行车 3.7 无 17
是 是 滴滴出行 1.3 无 两
是 是 自驾 8 无 16
否 否 自行车 1.8 无 八
是 是 出租车 1.2 大 4
是 是 自行车 5.4 大 26
是 是 火车 5.2 大 30
是 是 自行车 300000000 无 14
是 否 出租车 3.9 无 16
是 是 自行车 0.9 无 4
是 是 打车 1.4 无 9
是 否 开车 3.8 无 10
否 否 打车 4.3 无 20
是 是 自己开车 9.6 无 17
是 否 自行车 2.9 无 15
是 否 自己开车 13.3 大 35
是 是 步行 1.6 无 24
是 否 自驾 4.3 无 15
是 是 步行 3.1 中 49
课前回顾
我的人工智能预测出行项目 拥堵情况预测
影响预测的因素 时间、天气、道路口的设施条件、不同车辆的行驶速度和驾驶行为、突发事件(交通事故、道路施工)和大型活动
出行数据采集方式 气象台的信息和交通 app 的数据共享
“道路口的设施条件、不同车辆的行驶速度和驾驶行为、突发事件(交通事故、道路施工)和大型活动” 的数据采集困难
出行数据采集结果
日期 时间 是否下雨 是否下雪 是否有雾 拥堵情况
2012 年 10 月 2 日 9:00 否 否 否 拥堵
2012 年 10 月 2 日 10:00 否 否 否 拥堵
2012 年 10 月 2 日 11:00 否 否 否 拥堵
2012 年 10 月 2 日 12:00 否 否 否 拥堵
2012 年 10 月 2 日 13:00 否 否 否 拥堵
2012 年 10 月 2 日 14:00 否 否 否 拥堵
2012 年 10 月 2 日 15:00 否 否 否 拥堵
2012 年 10 月 2 日 16:00 否 否 否 严重拥堵
2012 年 10 月 2 日 17:00 否 否 否 拥堵
2012 年 10 月 2 日 18:00 否 否 否 拥堵
2012 年 10 月 2 日 19:00 否 否 否 缓行
2012 年 10 月 2 日 20:00 否 否 否 缓行
2012 年 10 月 2 日 21:00 否 否 否 缓行
2012 年 10 月 2 日 22:00 否 否 否 通畅
2012 年 10 月 2 日 23:00 否 否 否 通畅
2012 年 10 月 3 日 0:00 否 否 否 通畅
2012 年 10 月 3 日 1:00 否 否 否 通畅
2012 年 10 月 3 日 2:00 否 否 否 通畅
数据预处理 - 构建数据集
是否节假日 是否高峰 出行方式 出行距离 (km) 雨雪 到达时间 (min)
是 是 自驾 3.9 小 7
是 是 自行车 3.7 无 17
是 是 滴滴出行 1.3 无 两
是 是 自驾 8 无 16
否 否 自行车 1.8 无 八
是 是 出租车 1.2 大 4
是 是 自行车 5.4 大 26
是 是 火车 5.2 大 30
是 是 自行车 300000000 无 14
是 否 出租车 3.9 无 16
是 是 自行车 0.9 无 4
是 是 打车 1.4 无 9
是 否 开车 3.8 无 10
否 否 打车 4.3 无 20
是 是 自己开车 9.6 无 17
是 否 自行车 2.9 无 15
是 否 自己开车 13.3 大 35
是 是 步行 1.6 无 24
是 否 自驾 4.3 无 15
是 是 步行 3.1 中 49
数据预处理 - 构建数据集
日期 时间 是否下雨 是否下雪 是否有雾 拥堵情况
2012 年 10 月 2 日 9:00 否 否 否 拥堵
2012 年 10 月 2 日 10:00 否 否 否 拥堵
2012 年 10 月 2 日 11:00 否 否 否 拥堵
2012 年 10 月 2 日 12:00 否 否 否 拥堵
2012 年 10 月 2 日 13:00 否 否 否 拥堵
2012 年 10 月 2 日 14:00 否 否 否 拥堵
2012 年 10 月 2 日 15:00 否 否 否 拥堵
2012 年 10 月 2 日 16:00 否 否 否 严重拥堵
2012 年 10 月 2 日 17:00 否 否 否 拥堵
2012 年 10 月 2 日 18:00 否 否 否 拥堵
2012 年 10 月 2 日 19:00 否 否 否 缓行
2012 年 10 月 2 日 20:00 否 否 否 缓行
2012 年 10 月 2 日 21:00 否 否 否 缓行
2012 年 10 月 2 日 22:00 否 否 否 通畅
2012 年 10 月 2 日 23:00 否 否 否 通畅
2012 年 10 月 3 日 0:00 否 否 否 通畅
2012 年 10 月 3 日 1:00 否 否 否 通畅
2012 年 10 月 3 日 2:00 否 否 否 通畅
数据预处理 - 构建数据集
1.打开自己采集的数据,分析其中存在哪些问题,思考该如何进行处理,并记录在任务单上。
学习活动一:
异常数据 数据预处理方案
【学习任务一】
打开自己采集的数据,分析其中存在哪些问题,思考该如何进行处理,并记录在下方表格中。
数据预处理 - 构建数据集
数据范围
采集方式
数据单位
数据预处理 - 构建数据集
数据清洗的策略
异常值
偏离正常样本过多的值
数据预处理 - 构建数据集
数据清洗的策略
异常值
数据预处理 - 构建数据集
数据预处理 - 构建数据集
数据清洗的策略
异常值
数据预处理 - 构建数据集
删除异常值的情况:
1. 确定异常值是由于数据错误造成的;
2. 数据集足够大,删除几个点不会显著影响分析;
3. 异常值不能代表正在研究的人群时。
谨慎删除
数据清洗的策略
异常值
数据预处理 - 构建数据集
直接删除
数据清洗的策略
缺失值
数据预处理 - 构建数据集
根据其分布特性选择均值、中位数填充,或使用定值法、插值法、机器学习模型预测等方法。
数据清洗的策略
缺失值
数据预处理 - 构建数据集
数据格式
数据范围
采集方式
数据单位
数据预处理 - 构建数据集
数据格式
数据范围
采集方式
数据单位
数据预处理 - 构建数据集
采集方式
数据格式
数据范围
数据单位
采样频率
构建数据集的方式:
预测模型建构
确定数据采集方式、数据格式、数据范围、采样频率等信息,再标注、存 储和管理数据。
2. 打开自己采集的数据,根据数据预处理方案,动手实践。
学习活动一:
数据预处理 - 构建数据集
数据预处理 - 构建数据集
是否节假日 是否高峰 出行方式 出行距离(km) 雨雪 到达时间(min)
是 是 自驾 3.9 小 7
是 是 自行车 3.7 无 17
是 是 出租车 1.3 无 2
是 是 自驾 8 无 16
否 否 自行车 1.8 无 8
是 是 出租车 1.2 大 4
是 是 自行车 5.4 大 26
是 是 火车 5.2 大 30
是 是 自行车 3 无 14
是 否 出租车 3.9 无 16
是 是 自行车 0.9 无 4
这份数据合格了吗?
数据预处理 - 构建数据集
是否节假日 是否高峰 出行方式 出行距离(km) 雨雪 到达时间(min)
是 是 自驾 3.9 小 7
是 是 自行车 3.7 无 17
是 是 出租车 1.3 无 2
是 是 自驾 8 无 16
否 否 自行车 1.8 无 8
是 是 出租车 1.2 大 4
是 是 自行车 5.4 大 26
是 是 火车 5.2 大 30
是 是 自行车 3 无 14
是 否 出租车 3.9 无 16
是 是 自行车 0.9 无 4
这份数据合格了吗?
数据预处理 - 构建数据集
是否节假日 是否高峰 出行方式 出行距离(km) 雨雪 到达时间(min)
是 是 自驾 3.9 小 7
是 是 自行车 3.7 无 17
是 是 出租车 1.3 无 2
是 是 自驾 8 无 16
否 否 自行车 1.8 无 8
是 是 出租车 1.2 大 4
是 是 自行车 5.4 大 26
是 是 火车 5.2 大 30
是 是 自行车 3 无 14
是 否 出租车 3.9 无 16
是 是 自行车 0.9 无 4
如何非数值信息转换为数值信息?
数据预处理 - 构建数据集
是否节假日 是否高峰 出行方式 出行距离(km) 雨雪 到达时间(min)
是 是 自驾 3.9 小 7
是 是 自行车 3.7 无 17
是 是 出租车 1.3 无 2
是 是 自驾 8 无 16
否 否 自行车 1.8 无 8
是 是 出租车 1.2 大 4
是 是 自行车 5.4 大 26
是 是 火车 5.2 大 30
是 是 自行车 3 无 14
是 否 出租车 3.9 无 16
是 是 自行车 0.9 无 4
如何非数值信息转换为数值信息?
数据预处理 - 构建数据集
1. 确定量化标准,并记录任务单。
学习活动二:
数据项 编码方案
数据预处理 - 构建数据集
是否节假日 是否高峰 出行方式 出行距离(km) 雨雪 到达时间(min)
是 是 自驾 3.9 小 7
是 是 自行车 3.7 无 17
是 是 出租车 1.3 无 2
是 是 自驾 8 无 16
否 否 自行车 1.8 无 8
是 是 出租车 1.2 大 4
是 是 自行车 5.4 大 26
是 是 火车 5.2 大 30
是 是 自行车 3 无 14
是 否 出租车 3.9 无 16
是 是 自行车 0.9 无 4
数据预处理 - 构建数据集
是否节假日 是否高峰 出行方式 出行距离(km) 雨雪 到达时间(min)
是 是 自驾 3.9 小 7
是 是 自行车 3.7 无 17
是 是 出租车 1.3 无 2
是 是 自驾 8 无 16
否 否 自行车 1.8 无 8
是 是 出租车 1.2 大 4
是 是 自行车 5.4 大 26
是 是 火车 5.2 大 30
是 是 自行车 3 无 14
是 否 出租车 3.9 无 16
是 是 自行车 0.9 无 4
量化标准:
0 是
1 否
0 0
0 0
0 0
0 0
1 1
0 0
0 0
0 0
0 0
0 1
0 0
数据预处理 - 构建数据集
是否节假日 是否高峰 出行方式 出行距离(km) 雨雪 到达时间(min)
是 是 自驾 3.9 小 7
是 是 自行车 3.7 无 17
是 是 出租车 1.3 无 2
是 是 自驾 8 无 16
否 否 自行车 1.8 无 8
是 是 出租车 1.2 大 4
是 是 自行车 5.4 大 26
是 是 火车 5.2 大 30
是 是 自行车 3 无 14
是 否 出租车 3.9 无 16
是 是 自行车 0.9 无 4
0 0
0 0
0 0
0 0
1 1
0 0
0 0
0 0
0 0
0 1
0 0
量化标准:
1 步行
2 自行车
3 驾车
4 出租车
5 公交车
6 火车
3
2
4
3
2
4
2
6
2
4
2
数据预处理 - 构建数据集
是否节假日 是否高峰 出行方式 出行距离(km) 雨雪 到达时间(min)
是 是 自驾 3.9 小 7
是 是 自行车 3.7 无 17
是 是 出租车 1.3 无 2
是 是 自驾 8 无 16
否 否 自行车 1.8 无 8
是 是 出租车 1.2 大 4
是 是 自行车 5.4 大 26
是 是 火车 5.2 大 30
是 是 自行车 3 无 14
是 否 出租车 3.9 无 16
是 是 自行车 0.9 无 4
0 0
0 0
0 0
0 0
1 1
0 0
0 0
0 0
0 0
0 1
0 0
3
2
4
3
2
4
2
6
2
4
2
量化标准:
0 无
1 小雨
2 中雨
3 大雨
4 小雪
5 中雪
6 大雪
1
0
0
0
0
3
3
6
0
0
0
数据预处理 - 构建数据集
是否节假日 是否高峰 出行方式 出行距离(km) 雨雪 到达时间(min)
是 是 自驾 3.9 小 7
是 是 自行车 3.7 无 17
是 是 出租车 1.3 无 2
是 是 自驾 8 无 16
否 否 自行车 1.8 无 8
是 是 出租车 1.2 大 4
是 是 自行车 5.4 大 26
是 是 火车 5.2 大 30
是 是 自行车 3 无 14
是 否 出租车 3.9 无 16
是 是 自行车 0.9 无 4
0 0
0 0
0 0
0 0
1 1
0 0
0 0
0 0
0 0
0 1
0 0
3
2
4
3
2
4
2
6
2
4
2
1
0
0
0
0
3
3
6
0
0
0
常见的编码方式
独热编码
标签编码
频率编码
标签编码
数据预处理 - 构建数据集
是否节假日 是否高峰 出行方式 出行距离(km) 雨雪 到达时间(min)
是 是 自驾 3.9 小 7
是 是 自行车 3.7 无 17
是 是 出租车 1.3 无 2
是 是 自驾 8 无 16
否 否 自行车 1.8 无 8
是 是 出租车 1.2 大 4
是 是 自行车 5.4 大 26
是 是 火车 5.2 大 30
是 是 自行车 3 无 14
是 否 出租车 3.9 无 16
是 是 自行车 0.9 无 4
0 0
0 0
0 0
0 0
1 1
0 0
0 0
0 0
0 0
0 1
0 0
3
2
4
3
2
4
2
6
2
4
2
1
0
0
0
0
3
3
6
0
0
0
开动脑筋:
日期该如何量化?
2. 打开自己的数据集,结合编码方案,动手处理数据。
学习活动二:
数据预处理 - 构建数据集
数据预处理 - 构建数据集
这份数据合格了吗?
基于模型进行出行方式预测
预测模型构建与训练
出行数据采集
数据预处理
确定影响因素
课前回顾
人工智能预测出行的一般步骤
模型训练
1. 打开代码,阅读并分析代码中有几个功能模块,并记录在任务单上。
学习活动三:
代码有____个模块 每个模块的功能
模型训练
代码有____个模块 每个模块的功能
1. 输入历史数据
2. 利用输入的历史数据,训练神经网络模型。
3. 输入新的数据
4. 模型预测,并输出预测结果和误差。
4
模型训练
2. 总结训练人工智能预测模型的过程,并填写在任务单上。
学习活动三:
构建数据集的方式:
预测模型建构
确定数据采集方式、数据格式、数据范围、采样频率等信息,再标注、存 储和管理数据。
新数据
结果
预测
输入
训练
“标签”“特征”
历史数据
神经网络训练模型
模型训练
将处理好的数据集命名为“data.xls”,复制到程序文件的根目录处,并运行代码,记录模型的预测结果
学习活动四:
实际数据 预测结果 预测平均误差
模型训练
课后作业
请同学们填写项目化结构反馈表,分析本项目的亮点、问题并思考如何解决。
项目目标: P(plus)/ 亮点
D(delta)/ 建议
Q(question)/ 问题
下课
Thanks!
https://www.21cnjy.com/recruitment/home/fine

展开更多......

收起↑

资源列表