【核心素养目标】第1单元 第4课《跨学科活动:身高推断》课件+素材-【清华大学版2024】《信息科技》八下

资源下载
  1. 二一教育资源

【核心素养目标】第1单元 第4课《跨学科活动:身高推断》课件+素材-【清华大学版2024】《信息科技》八下

资源简介

(共39张PPT)
第1单元 第4课
跨学科活动:身高推断
(清华大学版)八年级

1
核心素养目标
3
新知讲解
5
拓展延伸
7
板书设计
2
新知导入
4
课堂练习
6
课堂总结
课后作业
8
01
核心素养目标
信息意识
计算思维
数字化学习与创新
信息社会责任
认识到使用算法和数据分析技术需要承担社会责任,包括对数据的合理使用、对结果的科学解读以及对他人隐私的尊重。
熟练完成身高数据采集分析、机器学习等现代技术,激发他们的创新思维,鼓励他们探索新的解决方案和应用场景。
利用搜集的身高数据,具体问题具体分析,选择出最合适的算法,训练一个能推断身高的模型并不断优化完善。
能意识到数据的来源、数据的质量以及数据隐私的重要性。理解如何合理使用数据,确保数据的合法性和伦理性。
02
新知导入
本课中你将体验:
如何收集各种与身高有关的数据,形成数据集
如何选择合适的算法训练一个能推断身高的模型
如何搭建一个身高推断系统
02
新知导入
在一些电视剧和电影中常常能看到这样的场景:神探仅通过现场的脚印,就能初步推断出犯罪嫌疑人的身高。神探之所以能推断出犯罪嫌疑人的身高,是因为人的身高与脚的长度、宽度和步伐长度有一定的关系。请你组建一个小组,应用机器学习知识探究身高和脚长等因素的关系,并训练一个能推断身高的人工智能模型,进一步思考可以用这些知识解决哪些问题。
02
新知导入
03
新知讲解
一、需求分析
身高推断系统项目的设计,必须先完成问题分析,查找相关资料并思考哪些因素与身高有关联,确认数据收集计划,同时要基于收集的数据进行数据整理并生成一个数据集,训练一个能准确推断身高的模型,最终将模型应用到一个 Web 页面。请你结合前面的学习,根据项目需求将表 1.4.1填写完整。
03
新知讲解
03
新知讲解
二、分工合作
为了更好地完成身高推断系统这个项目,你的小组需要进行分工合作,小组成员的分工角色与合作职责,可以参照表 1.4.2所示范例设计,也可以另行设计。
姓名 角色 分工
A 组长 负责项目统筹、监督与管理
B 成员 负责进行数据集制作与文档撰写
C 成员 负责模型训练与评估
D 成员 负责模型部署与程序测试
E 成员 负责总结内容
03
新知讲解
三、规划实施
身高推断系统项目的实施过程,可分为方案设计、数据准备、训练模型、搭建系统、测试优化等环节。
03
新知讲解
1.方案设计
身高推断系统项目方案的设计,一般包括:收集哪些数据,如何收集数据,数据集怎么制作;如何训练模型,选择哪种算法,希望模型达到什么样的效果;设计并开发一个什么样的身高推断系统,有哪些功能。
请搜索并学习更多相关知识,结合需求分析中的表格内容来设计项目方案。
03
新知讲解
2.数据准备
数据准备需要你完成数据收集、清洗和整理及数据集划分等工作。数据收集的方法很多,针对身高推断系统项目,建议选择在线调查的收集方式。请规划好要收集的信息,设计调查问卷,完成数据收集工作。
注意:收集好数据后,还需做数据整理,再将数据集划分为训练集和验证集。
请在收集数据的过程中完成表 1.4.3。
03
新知讲解
表1.4.3 数据准备记录表
序号 内容 描述
1 涉及的变量 主变量:身高(cm)
协变量:年龄(岁)、性别(男/女)、父母身高总和(cm)、体重(kg)、运动时长(周·小时)、睡眠质量评分(1-5分)、
2 划分比例 训练集:验证集=7:3(采用 Stratified Sampling分层抽样保证样本代表性)
3 数据量 总样本量 ≥200训练集
≥140例验证集
≥60例(满足最小样本量要求)
03
新知讲解
3.训练模型
准备好划分为训练集和验证集的身高数据集之后,训练模型环节要经历模型搭建并训练、模型测试与评估等流程。请同学们尝试训练一个最佳的身高推断模型并保存。可以尝试不同的回归算法,比较所训练的模型在对验证集进行模型推理时计算出的 R值,分析并确认一个最好的模型,将效果比较及分析记录到表 1.4.4 中。
03
新知讲解
序号 算法名称 R2值
1 线性回归 0.75
2 决策树回归 0.82
3 随机森林回归 0.88
总结分析
在测试的三种回归算法中,随机森林回归表现出最佳拟合效果(R2=0.88)。 相比线性回归(R2=0.75),非线性算法(决策树/随机森林)更能捕捉身高数据中的非线性关系。 验证结果表明该模型具有较好的泛化能力(假设3.验证集 R2与训练集接近)。 建议最终采用随机森林回归作为最优模型,若存在过拟合现象可调整树的数量或深度参数。
03
新知讲解
4.搭建系统
请参照学习过的模型应用知识,利用 XEduHub 和 PyWebl0 搭建一个人体身高推断系统,要实现载人训练好的模型并能完成推断结果的输出,同时实现方案设计的功能,包括个性化输入、输出交互设计等。
03
新知讲解
5.测试优化
搭建好身高推断系统后,还要经历测试优化环节,方可用于问题解决。测试时,可直接寻找不同的新用户使用你的系统,输入数据,看看推断结果是否正确或基本符合要求,同时也评估一下系统的其他功能。优化应包括模型优化和系统功能优化,模型优化可从数据集和算法入手,系统功能优化则是朝功能更强大的方向修改模型应用的程序。
03
新知讲解
请对你所在小组开发的身高推断系统进行测试优化,并根据测试中发现的问题或不足思考相应的解决方法,记录在表1.4.5 中。
03
新知讲解
表1.4.5 测试情况与解决思路
序号 发现的问题或不足 解决思路
1 预测结果偏差较大(身高+15cm误差) 1.增加训练样本量至 500例
2.引入XGBoost算法替代随机森林
2 模型对新地区数据泛化能力弱 合并5所学校的体检数据集、使用迁移学习微调预训练模型
3 Web端响应延迟超过3秒 1.将Scikit-learn模型转换为 TensorFlow Lite格式
2.采用缓存机制存储预测结果
4 缺失值未处理导致预测失败 使用lterative lmputer填补缺失值、在问卷中增加必填项校验
5 SHAP值解释可视化效果不佳 改用 RadViz图形展示特征贡献度、生成3D热力图辅助理解
03
新知讲解
四、交流评价
项目成果交流,分成果整理与交流两个环节。成果整理,其内容涉及项目需求分析、项目方案设计、素材收集、模型部署和应用等方面,并为之制作汇报交流用的 PPT。
项目成果评价,可基于表1.4.6的评价量规,来对自己与他人的项目成果进行客观的评价,并记录评价结果。
03
新知讲解
04
课堂练习
一、选择题
1、在机器学习中,哪个算法通常用于预测连续的目标变量(如身高)?
A. 逻辑回归 B. K-means聚类
C.线性回归 D. 决策树分类器
2、当我们对一个回归模型进行优化时,应该使用以下哪种评估指标来评估模型的预测效果?
A. 精确度(Accuracy) B. 均方误差(MSE)
C. F1-score D. 召回率(Recall)
3、对于推断身高的回归模型,若想要提高模型的预测精度,以下哪种方法是最有效的?
A.增加数据量 B.降低模型复杂度
C.使用更少的特征 D.删除噪声数据
C
B
A
04
课堂练习
4、若推断身高的模型输出结果出现了过拟合现象,以下哪种方法最适合进行调整?
A.增加模型训练的次数 B.使用正则化技术
C.增加训练集的大小 D.改变模型的类型
二、判断题
1、线性回归模型可以用于推断身高这一问题,因为身高与年龄之间的关系可以用线性模型来近似。
2、在进行身高预测时,如果数据集的特征之间存在很强的相关性,那么使用主成分分析(PCA)进行特征降维是一个好方法。
3、在使用神经网络进行身高预测时,增加网络层数总是能提高模型的准确性。
B
×


04
课堂练习
三、操作题
假设你有一组数据,其中包含了多个人的年龄和性别以及他们的身高(单位:cm)。通过这些数据,设计一个简单的模型来推断一个人的身高。
1. 创建一个包含至少5个人数据的训练集,数据包括年龄(整数)、性别(男/女)、身高(cm)。
2. 使用线性回归模型训练该数据集,以预测身高。
3. 给定一个新人的年龄和性别,预测其身高。
05
拓展延伸
模型选择与优化
模型比较:除了线性回归,还可以尝试其他回归模型,如决策树回归、随机森林回归、支持向量机回归等。
超参数调优:通过网格搜索或随机搜索来选择最佳的超参数,进一步提高模型的性能。
05
拓展延伸
数据的标准化与归一化
内容:不同特征可能存在尺度差异,通过标准化(Standardization)或归一化(Normalization)将数据处理成统一尺度。
应用:在身高预测中,处理不同特征(如体重、年龄等)的尺度差异,有助于提升模型性能,特别是在神经网络和KNN等算法中。
05
拓展延伸
特征工程
数据预处理:包括数据标准化、归一化等技术,能够改善模型的性能。
特征提取与选择:如何根据数据的不同特性选择合适的特征(如年龄、性别、体重等),并通过相关性分析、主成分分析(PCA)等方法进行特征提取。
示例:使用 BMI(体重/身高的平方)作为新的特征,或者结合历史数据进行更准确的推断。
05
拓展延伸
多模态学习
集成学习:结合多个模型的预测结果(例如,使用加权平均方法或投票机制)来提高身高预测的准确性。
多模态数据融合:除了传统的数值型数据,还可以通过图像、视频等其他模态数据来增强身高预测模型的性能。
05
拓展延伸
多项式回归
内容:通过增加高次项来扩展线性回归模型,使其能够捕捉更复杂的关系。
应用:在年龄与身高之间可能存在非线性关系,使用多项式回归可以提升模型对复杂数据的拟合能力。
示例:引入年龄的平方、性别的交互项等。
06
小结与评价
单元回顾
本单元你学习了:
人工智能起源和机器学习的概念
机器学习的基本流程
利用 BaseML 工具完成模型训练和评估
机器学习模型的应用
06
小结与评价
知识梳理
06
小结与评价
学习检测
1、人工智能的起源可以追溯到达特茅斯会议,达特茅斯会议是( )年召开的。
A.1956 B.1966 C.1970 D.19752.
2、机器学习是一种使计算机能够( ),而无须进行明确编程的科学。
A.休眠 B.学习 C.播放音乐 D.画画
A
B
06
小结与评价
学习检测
3、小明在开始训练模型前,对收集到的数据做了如下整理:将 80% 的数据用于模型的训练,称为 ;剩余20% 的数据用于验证模型的识别效果,称为 。
4、机器学习中,模型从已知数据中学习规律的过程称为 。
5、假设你有一个数据集,其中包含了一系列的房屋信息,如面积、卧室数量、地理位置和价格。你的任务是创建一个模型,根据给定房屋信息来预测房屋的总价值。试描述整理数据、训练模型以及评估模型性能的基本步骤。
训练集
验证集
训练或学习
06
小结与评价
反思评价
在本单元的学习过程中,肯定少不了与他人进行互动交流、参与作品制作等活动。现在请就此进行总结与反思,以便更好地促进自身成长。
1.从同伴那里学到了什么
2.与同伴分享过哪些观点
3.工具、方法的使用是否得当
4.是否有值得推广的经验
07
课堂总结
1
引入新知内容
跨学科活动:身高推断
2
进行需求分析和分工合作
3
完成规划实施和评价交流
4
完成课堂练习
5
进行知识拓展
1
2
3
4
5
08
板书设计
跨学科活动:身高推断
1、进行新知引入
2、进行需求分析和分工合作
3、完成规划实施和评价交流
4、完成课堂练习
5、进行知识拓展
课后作业。
1、身高预测模型进行调参优化。
2、总结单元内容,完成思维导图。
09
课后作业
1、使用网格搜索或随机搜索对你的身高预测模型进行调参,并报告调优前后的模型性能变化。
2、回顾本单元所学内容,完成一份思维导图。
https://www.21cnjy.com/recruitment/home/fine

展开更多......

收起↑

资源列表