资源简介 (共39张PPT)第1单元 第4课跨学科活动:身高推断(清华大学版)八年级下1核心素养目标3新知讲解5拓展延伸7板书设计2新知导入4课堂练习6课堂总结课后作业801核心素养目标信息意识计算思维数字化学习与创新信息社会责任认识到使用算法和数据分析技术需要承担社会责任,包括对数据的合理使用、对结果的科学解读以及对他人隐私的尊重。熟练完成身高数据采集分析、机器学习等现代技术,激发他们的创新思维,鼓励他们探索新的解决方案和应用场景。利用搜集的身高数据,具体问题具体分析,选择出最合适的算法,训练一个能推断身高的模型并不断优化完善。能意识到数据的来源、数据的质量以及数据隐私的重要性。理解如何合理使用数据,确保数据的合法性和伦理性。02新知导入本课中你将体验:如何收集各种与身高有关的数据,形成数据集如何选择合适的算法训练一个能推断身高的模型如何搭建一个身高推断系统02新知导入在一些电视剧和电影中常常能看到这样的场景:神探仅通过现场的脚印,就能初步推断出犯罪嫌疑人的身高。神探之所以能推断出犯罪嫌疑人的身高,是因为人的身高与脚的长度、宽度和步伐长度有一定的关系。请你组建一个小组,应用机器学习知识探究身高和脚长等因素的关系,并训练一个能推断身高的人工智能模型,进一步思考可以用这些知识解决哪些问题。02新知导入03新知讲解一、需求分析身高推断系统项目的设计,必须先完成问题分析,查找相关资料并思考哪些因素与身高有关联,确认数据收集计划,同时要基于收集的数据进行数据整理并生成一个数据集,训练一个能准确推断身高的模型,最终将模型应用到一个 Web 页面。请你结合前面的学习,根据项目需求将表 1.4.1填写完整。03新知讲解03新知讲解二、分工合作为了更好地完成身高推断系统这个项目,你的小组需要进行分工合作,小组成员的分工角色与合作职责,可以参照表 1.4.2所示范例设计,也可以另行设计。姓名 角色 分工A 组长 负责项目统筹、监督与管理B 成员 负责进行数据集制作与文档撰写C 成员 负责模型训练与评估D 成员 负责模型部署与程序测试E 成员 负责总结内容03新知讲解三、规划实施身高推断系统项目的实施过程,可分为方案设计、数据准备、训练模型、搭建系统、测试优化等环节。03新知讲解1.方案设计身高推断系统项目方案的设计,一般包括:收集哪些数据,如何收集数据,数据集怎么制作;如何训练模型,选择哪种算法,希望模型达到什么样的效果;设计并开发一个什么样的身高推断系统,有哪些功能。请搜索并学习更多相关知识,结合需求分析中的表格内容来设计项目方案。03新知讲解2.数据准备数据准备需要你完成数据收集、清洗和整理及数据集划分等工作。数据收集的方法很多,针对身高推断系统项目,建议选择在线调查的收集方式。请规划好要收集的信息,设计调查问卷,完成数据收集工作。注意:收集好数据后,还需做数据整理,再将数据集划分为训练集和验证集。请在收集数据的过程中完成表 1.4.3。03新知讲解表1.4.3 数据准备记录表序号 内容 描述1 涉及的变量 主变量:身高(cm)协变量:年龄(岁)、性别(男/女)、父母身高总和(cm)、体重(kg)、运动时长(周·小时)、睡眠质量评分(1-5分)、2 划分比例 训练集:验证集=7:3(采用 Stratified Sampling分层抽样保证样本代表性)3 数据量 总样本量 ≥200训练集≥140例验证集≥60例(满足最小样本量要求)03新知讲解3.训练模型准备好划分为训练集和验证集的身高数据集之后,训练模型环节要经历模型搭建并训练、模型测试与评估等流程。请同学们尝试训练一个最佳的身高推断模型并保存。可以尝试不同的回归算法,比较所训练的模型在对验证集进行模型推理时计算出的 R值,分析并确认一个最好的模型,将效果比较及分析记录到表 1.4.4 中。03新知讲解序号 算法名称 R2值1 线性回归 0.752 决策树回归 0.823 随机森林回归 0.88总结分析在测试的三种回归算法中,随机森林回归表现出最佳拟合效果(R2=0.88)。 相比线性回归(R2=0.75),非线性算法(决策树/随机森林)更能捕捉身高数据中的非线性关系。 验证结果表明该模型具有较好的泛化能力(假设3.验证集 R2与训练集接近)。 建议最终采用随机森林回归作为最优模型,若存在过拟合现象可调整树的数量或深度参数。03新知讲解4.搭建系统请参照学习过的模型应用知识,利用 XEduHub 和 PyWebl0 搭建一个人体身高推断系统,要实现载人训练好的模型并能完成推断结果的输出,同时实现方案设计的功能,包括个性化输入、输出交互设计等。03新知讲解5.测试优化搭建好身高推断系统后,还要经历测试优化环节,方可用于问题解决。测试时,可直接寻找不同的新用户使用你的系统,输入数据,看看推断结果是否正确或基本符合要求,同时也评估一下系统的其他功能。优化应包括模型优化和系统功能优化,模型优化可从数据集和算法入手,系统功能优化则是朝功能更强大的方向修改模型应用的程序。03新知讲解请对你所在小组开发的身高推断系统进行测试优化,并根据测试中发现的问题或不足思考相应的解决方法,记录在表1.4.5 中。03新知讲解表1.4.5 测试情况与解决思路序号 发现的问题或不足 解决思路1 预测结果偏差较大(身高+15cm误差) 1.增加训练样本量至 500例2.引入XGBoost算法替代随机森林2 模型对新地区数据泛化能力弱 合并5所学校的体检数据集、使用迁移学习微调预训练模型3 Web端响应延迟超过3秒 1.将Scikit-learn模型转换为 TensorFlow Lite格式2.采用缓存机制存储预测结果4 缺失值未处理导致预测失败 使用lterative lmputer填补缺失值、在问卷中增加必填项校验5 SHAP值解释可视化效果不佳 改用 RadViz图形展示特征贡献度、生成3D热力图辅助理解03新知讲解四、交流评价项目成果交流,分成果整理与交流两个环节。成果整理,其内容涉及项目需求分析、项目方案设计、素材收集、模型部署和应用等方面,并为之制作汇报交流用的 PPT。项目成果评价,可基于表1.4.6的评价量规,来对自己与他人的项目成果进行客观的评价,并记录评价结果。03新知讲解04课堂练习一、选择题1、在机器学习中,哪个算法通常用于预测连续的目标变量(如身高)?A. 逻辑回归 B. K-means聚类C.线性回归 D. 决策树分类器2、当我们对一个回归模型进行优化时,应该使用以下哪种评估指标来评估模型的预测效果?A. 精确度(Accuracy) B. 均方误差(MSE)C. F1-score D. 召回率(Recall)3、对于推断身高的回归模型,若想要提高模型的预测精度,以下哪种方法是最有效的?A.增加数据量 B.降低模型复杂度C.使用更少的特征 D.删除噪声数据CBA04课堂练习4、若推断身高的模型输出结果出现了过拟合现象,以下哪种方法最适合进行调整?A.增加模型训练的次数 B.使用正则化技术C.增加训练集的大小 D.改变模型的类型二、判断题1、线性回归模型可以用于推断身高这一问题,因为身高与年龄之间的关系可以用线性模型来近似。2、在进行身高预测时,如果数据集的特征之间存在很强的相关性,那么使用主成分分析(PCA)进行特征降维是一个好方法。3、在使用神经网络进行身高预测时,增加网络层数总是能提高模型的准确性。B× 04课堂练习三、操作题假设你有一组数据,其中包含了多个人的年龄和性别以及他们的身高(单位:cm)。通过这些数据,设计一个简单的模型来推断一个人的身高。1. 创建一个包含至少5个人数据的训练集,数据包括年龄(整数)、性别(男/女)、身高(cm)。2. 使用线性回归模型训练该数据集,以预测身高。3. 给定一个新人的年龄和性别,预测其身高。05拓展延伸模型选择与优化模型比较:除了线性回归,还可以尝试其他回归模型,如决策树回归、随机森林回归、支持向量机回归等。超参数调优:通过网格搜索或随机搜索来选择最佳的超参数,进一步提高模型的性能。05拓展延伸数据的标准化与归一化内容:不同特征可能存在尺度差异,通过标准化(Standardization)或归一化(Normalization)将数据处理成统一尺度。应用:在身高预测中,处理不同特征(如体重、年龄等)的尺度差异,有助于提升模型性能,特别是在神经网络和KNN等算法中。05拓展延伸特征工程数据预处理:包括数据标准化、归一化等技术,能够改善模型的性能。特征提取与选择:如何根据数据的不同特性选择合适的特征(如年龄、性别、体重等),并通过相关性分析、主成分分析(PCA)等方法进行特征提取。示例:使用 BMI(体重/身高的平方)作为新的特征,或者结合历史数据进行更准确的推断。05拓展延伸多模态学习集成学习:结合多个模型的预测结果(例如,使用加权平均方法或投票机制)来提高身高预测的准确性。多模态数据融合:除了传统的数值型数据,还可以通过图像、视频等其他模态数据来增强身高预测模型的性能。05拓展延伸多项式回归内容:通过增加高次项来扩展线性回归模型,使其能够捕捉更复杂的关系。应用:在年龄与身高之间可能存在非线性关系,使用多项式回归可以提升模型对复杂数据的拟合能力。示例:引入年龄的平方、性别的交互项等。06小结与评价单元回顾本单元你学习了:人工智能起源和机器学习的概念机器学习的基本流程利用 BaseML 工具完成模型训练和评估机器学习模型的应用06小结与评价知识梳理06小结与评价学习检测1、人工智能的起源可以追溯到达特茅斯会议,达特茅斯会议是( )年召开的。A.1956 B.1966 C.1970 D.19752.2、机器学习是一种使计算机能够( ),而无须进行明确编程的科学。A.休眠 B.学习 C.播放音乐 D.画画AB06小结与评价学习检测3、小明在开始训练模型前,对收集到的数据做了如下整理:将 80% 的数据用于模型的训练,称为 ;剩余20% 的数据用于验证模型的识别效果,称为 。4、机器学习中,模型从已知数据中学习规律的过程称为 。5、假设你有一个数据集,其中包含了一系列的房屋信息,如面积、卧室数量、地理位置和价格。你的任务是创建一个模型,根据给定房屋信息来预测房屋的总价值。试描述整理数据、训练模型以及评估模型性能的基本步骤。训练集验证集训练或学习06小结与评价反思评价在本单元的学习过程中,肯定少不了与他人进行互动交流、参与作品制作等活动。现在请就此进行总结与反思,以便更好地促进自身成长。1.从同伴那里学到了什么 2.与同伴分享过哪些观点 3.工具、方法的使用是否得当 4.是否有值得推广的经验 07课堂总结1引入新知内容跨学科活动:身高推断2进行需求分析和分工合作3完成规划实施和评价交流4完成课堂练习5进行知识拓展1234508板书设计跨学科活动:身高推断1、进行新知引入2、进行需求分析和分工合作3、完成规划实施和评价交流4、完成课堂练习5、进行知识拓展课后作业。1、身高预测模型进行调参优化。2、总结单元内容,完成思维导图。09课后作业1、使用网格搜索或随机搜索对你的身高预测模型进行调参,并报告调优前后的模型性能变化。2、回顾本单元所学内容,完成一份思维导图。https://www.21cnjy.com/recruitment/home/fine 展开更多...... 收起↑ 资源列表 【清华大学版】《信息科技》八年级下册第1单元第4课《跨学科活动:身高推断》.pptx 引入视频.mp4