【核心素养目标】电子工业版信息科技九上 2.2《预测-回归算法》课件+教案+素材

资源下载
  1. 二一教育资源

【核心素养目标】电子工业版信息科技九上 2.2《预测-回归算法》课件+教案+素材

资源简介

(共34张PPT)
2.2 回归算法
电子工业出版社 第五册
教学目标
1、信息意识:能够理解信息技术回归算法的重要性,并能识别各类信息资源的特点和可靠性。
2、计算思维:能运用计算思维的方法和策略来解决问题,包括分析问题、设计算法和评估解决方案。
3、数字化学习与创新:能熟练使用计算机软件和工具,例如搜索引擎、数据挖掘工具等,进行信息检索和整理。
4、信息社会责任:能理解信息技术对社会的影响,包括隐私保护、信息安全等方面的问题。
情境描述
马宁最近在研究遗传因素对人的身高的影响,他了解到,一般个子特别高的父亲的儿子会比父亲矮一些,个子特别矮的父亲的儿子会比父亲高一些。孩子不会不断地更高或更矮,而更倾向于家族中同性别人群的平均身高。更高或更矮的趋势不会一直持续下去,而会回到某个中心,这种现象就是回归。
蓝点:个体身高
红线:平均身高
情境描述
AI 技术正日益成为预测的新帮手。回归是监督学习的一个重要问题,回归用于预测输入变量和输出变量之间的关系,常见的回归算法有线性回归、非线性回归等。回归算法可以用来解决生活中的很多问题,如预测电影票房走势、人口增长趋势、商品价格与销售量的关系、居民的支出与收入的关系等。
蓝点:个体身高
红线:平均身高
情境描述
活动1
绘制预测线
新知讲解
学校为了促进同学们运动,要组织一次路线长6千米的“健步走,励志行”活动,小艾同学想要预测自己多长时间可以走完6 千米,你可以帮助他吗
实践探究1
1、请你测量周围8位同学的身高和步幅,并填到下表中。
身高/cm 步幅/cm 身高/cm 步幅/cm
150
155
160
165
170
175
180
185
50
55
60
65
70
75
80
85
实践探究2
2.请根据1.表中数据在下图中描点,并尝试画出一条趋势图。
实践探究2
3.分析人的步幅与其身高存在怎样的关系。一般年轻人快走一分钟可以走130步,请你预测健步走6千米所需的时间。
答:取步幅平均值65cm,那么一分钟走130步
则130*65=8450cm,也就是一分钟走84.5m
6千米=6000m,那么用6000/84.5=71.006分钟。
助力知识
回归是研究因变量对自变量的依赖关系的一种统计分析方法,目的是通过给定值来估计或预测因变量的均值。回归研究的是因变量和自变量之间的关系,可以用于发现变量之间的因果关系,也可以用于预测。利用人工智能做预测的方法有很多,常见的有线性回归、非线性回归等。
在众多数据中,如果能找出一条直线,较为准确地代表已有数据的走向,准确地描述数据之间的关系,这就是线性回归。按照自变量的多少,可分为一元线性回归和多元线性回归。如果一个自变量和一个因变量之间的关系可以用一条直线近似表示,那么这种回归被称为一元线性回归。验证欧姆定律的实验根据采集的数据计算电阻值,探究电流、电压、电阻之间的关系。同学们可以根据若干组测量得到的电流、电压数据,绘制出表示电流、电压之间关系的散点图。
助力知识—线性回归
通过观察散点图,我们发现数据样本点呈条状分布,随着流过待测电阻的电流增大,电压也不断升高,可以用一条直线近似地表示它们之间的关系。自变量电流用x表示,因变量电压用y表示,那么表示电流与电压变化关系的这条近似直线 (称为回归直线) 可以用y=kx+b表示,其中k为回归系数,b为截距。回归系数的绝对值越大,表示x对y的影响越大,若回归系数为正,表示y随x的增大而增大: 若回归系数为负,表示y随x的增大而减小; 若回归系数为零,表示回归直线与x轴平行。
助力知识—线性回归
根据已知电流推算电压的过程就是运用线性回归原理进行预测的过程,有了这个关系。在自变量已知的情况下,就能很容易地推算出因变量的数值。由于实验中往往存在传感器误差、电磁干扰等许多干扰因素,研究这组数据时,你可能会发现当自变量的取值一定时,因变量的取值也会有波动。
助力知识—线性回归
助力知识
多元线性回归主要研究一个因变量与多个自变量之间的相关关系,与一元线性回归的原理类似,区别在于影响因素(自变量)多一些。例如,影响产品单位成本的变量不仅有产量,还包括原材料价格、劳动力价格,劳动效率及废品率等因素。对这种多变量模型的分析,就是多元线性回归分析。如图所示。
助力知识—线性回归
助力知识
在实际应用中,两个变量之间并不总呈线性关系,对这种类型现象的分析和预测一般要应用非线性回归预测。例如,药物在体内的浓度与时间的关系是非线性的,如图所示。
助力知识—非线性回归
活动2
找出更准确的预测线
新知讲解
国家统计局组织调查,采集居民收入、支出、家庭经营和生产投资状况等数据,数据采集完成后,使用统一的方法进行数据处理,然后将数据传输至国家统计局进行统一汇总、计算。调查到的居民可支配收入和居民消费支出数据在一定程度上可以反映居民的生活水平。
新知讲解
依据居民人均可支配收入累计值和居民人均消费支出累计值,绘制散点图,可以发现,根据散点图中的数据点能画出多条直线,如图所示。根据不同的直线,由居民人均可支配收入累计值预测出的居民人均消费支出累计值是不同的。
新知讲解
我们把根据某条直线预测得到的值称为估计值。估计值和实际值越接近就表示估计值越准确,说明该直线越能体现自变量和因变量之间的关系,现在观察下表,结合该数据表分析线1、线2、线3,哪条直线能更好地表示居民人均可支配收入累计值和居民人均消费支出累计值之间的关系。
时间 居民人均可支配收入累计值/元 居民人均消费支出累计值/元
2013年第一季度 5006 3370
2013年第二季度 9049 6257
2013年第三季度 13557 9476
2013年第四季度 18311 13220
2014年第一季度 5562 3755
居民人均消费支出累计估计值/元
线1 线2 线3
3370 3370 3383
6362 6159 6257
10032 9270 9476
13220 12550 12833
3500 3755 1300
新知讲解
1、请你判断上表中哪一条直线能够比较准确地进行预测 为什么
较为准确预测的线:
原因:
线2
估计值和实际值越接近,就表示估计值越准确
居民人均消费支出累计值/元
线1
新知讲解
请结合上表中的数据,补全下表的数据,并计算出线1、线2、线3的误差平方和。
时间 居民人均可支配收入累计值/元
居民人均消费支出累计值/元
2013年第一季度 5006 3370
2013年第二季度 9049 6257
2013年第三季度 13557 9476
2013年第四季度 18311 13220
2014年第一季度 5562 3755
估计值 误差
误差平方
3370 0
6362 105
10032 556
13220 0
3500 -255
线2
线3
估计值 误差
误差平方
3370
6159
9270
12550
3755
估计值 误差
误差平方
3383
6257
9476
12833
1300
0
0
11025
309136
65025
0
98
206
670
0
-13
0
0
387
2455
0
9640
42436
448900
0
169
0
0
149
769
6027
025
新知讲解
注意:手动计算误差和误差平方和,容易出错并且效率不高,可以借助Excel中的求和函数SUM计算多个数的和,或借助求平方和函数SUMSO计算多个数的平方和。
经过计算,误差平方和最小的线可以较准确地表示居民人均可支配收入累计值和居民人均消费支出累计值的关系。
助力知识
估计值和实际值之间的差称为误差,为了求得能准确体现自变量和因变量之间关系的直线,需要用最小二乘法求出哪条直线更接近实际值。最小二乘法(又称最小平方法)是一种数学优化方法,它通过寻找各个数据点的误差平方和的最小值来确定最佳的模型,使得估计值和实际值更为接近。为什么要用各个数据点的误差平方和,而非简单地用误差求和呢 这是因为估计值可能大于也可能小于实际值,从而分别产生正误差或负误差。误差的和可能会因为正负相消而变小,而并非因为模型好。如图所示,蓝点是实际值,黄点为估计值,绿线是线性模型,红线显示了估计值和实际值之间的误差。
活动3
拓展延伸
拓展延伸
1、思考并讨论线性回归和非线性回归的分析方法分别适合在什么情况下应用
线性回归 非线性回归
关系近似为线性 关系不是线性的
数据具有较小的噪声 数据具有较大的噪声
解释性要求高 关注预测准确度
数据规模较大 数据规模较小
拓展延伸
思考并讨论线性回归算法在市场营销和广告效果评估中如何使用?
通过将广告费用、推广活动等作为自变量,销售额或消费者参与度作为因变量,线性回归模型能够帮助确定哪些因素对销售或参与度有最大影响。
项目实施
年份 生活垃圾清运量/万吨 年末总人口/万人
2004 15509.3 129988
2005 15576.8 130756
2006 14841.3 131448
2007 15214.5 132129
2008 15437.7 132802
2009 15733.7 133450
2010 15804.8 134735
根据国家统计局提供的信息,在 2004 年到2018 年的15 年间,我国生活垃圾清运量增加了 7000 万余吨,年末总人口增加了近1亿人,如表所示。结合本节知识,尝试探索生活垃圾清运量和年末总人口的关系,并使用线性回归算法分析预测当年末总人口增长为 140000 万人时生活垃圾清运量的值。
年份 生活垃圾清运量/万吨 年末总人口/万人
2011 16395.3 135404
2012 17080.9 136072
2013 17238.6 136782
2014 17860.2 137462
2015 19141.9 138271
2016 20362 139008
2017 21520.9 139538
预测结果:当年末总人口增长为 140000 万人时生活垃圾清运量的值为____________
21350.6万吨.
巩固练习
1.常见的人工智能回归算法可以分为( )和( )。
2.如果一个自变量和一个因变量之间的关系可以用一条直线近似表示,这种回归被称为( )。
3.通过寻找各个数据的误差平方和最小值来确定最佳的模型,使得估计值和实际值更为接近的方法是( )。
答案:1、传统回归算法和机器学习回归算法
2、线性回归
3、最小二乘法
巩固练习
4.举出生活中可以用线性回归算法进行预测的实例。许多变量之间存在着相互依存、相互制约、相互影响的关系
生活中还有哪些变量之间存在线性关系,可以用线性回归算法进行预测?请举例说明并填写下表。
实例 线性关系
实例1 人口变化趋势
实例2
实例3
实例4
身高和体重之间的关系
消费支出与收入之间的关系
物价指数
课堂总结
回归算法在信息技术领域具有广泛的应用,但适合的算法取决于问题的特性和数据的分布。了解不同回归算法的原理和特点,结合实际情况选择合适的算法,并进行合理的数据预处理和模型评估,可以提高回归模型的预测性能和可解释性 。
板书设计
回归算法
一、绘制预测线
二、找出更准确的预测线
三、线性回归
课后作业
1、搜索了解回归算法更多实例?
2、搜索了解预测线?
3、搜索了解如何找到更准确的预测线?
谢谢
21世纪教育网(www.21cnjy.com)
中小学教育资源网站
兼职招聘:
https://www.21cnjy.com/recruitment/home/admin中小学教育资源及组卷应用平台
信息技术 2.2回归算法
课题 回归算法 单元 第二单元 学科 信息技术 年级 九年级
教材分析 信息技术是一门知识性、技能性与创新性相结合的学科。现阶段,信息技术教育的理念已发生了质的飞跃,从单纯的技能训练上升为全面的信息素养的培养。教材以提高全体学生信息素养、养成学生自主学习意识和能力、培养学生数字化创新精神,从生活中发现问题、明确任务、确立目标、分析任务。在探究过程中逐步找到解决问题的方法。实用的小技巧,适时点拨关键操作。旨在帮助学生掌握信息时代生存与发展必需的基础知识和基础技能,养成信息意识、计算思维、数字化学习与创新、信息社会责任的核心素养。
教学目标 1、信息意识:能够理解信息技术回归算法的重要性,并能识别各类信息资源的特点和可靠性。2、计算思维:能运用计算思维的方法和策略来解决问题,包括分析问题、设计算法和评估解决方案。3、数字化学习与创新:能熟练使用计算机软件和工具,例如搜索引擎、数据挖掘工具等,进行信息检索和整理。4、信息社会责任:能理解信息技术对社会的影响,包括隐私保护、信息安全等方面的问题。
重点 一、绘制预测线二、找出更准确的预测线三、线性回归
难点 1、绘制预测线
教学过程
教学环节 教师活动 学生活动 设计意图
导入新课 马宁最近在研究遗传因素对人的身高的影响,他了解到,一般个子特别高的父亲的儿子会比父亲矮一些,个子特别矮的父亲的儿子会比父亲高一些。孩子不会不断地更高或更矮,而更倾向于家族中同性别人群的平均身高。更高或更矮的趋势不会一直持续下去,而会回到某个中心,这种现象就是回归。AI 技术正日益成为预测的新帮手。回归是监督学习的一个重要问题,回归用于预测输入变量和输出变量之间的关系,常见的回归算法有线性回归、非线性回归等。回归算法可以用来解决生活中的很多问题,如预测电影票房走势、人口增长趋势、商品价格与销售量的关系、居民的支出与收入的关系等。 观看视频了解生活中的回归算法,思考回归算法有哪些应用。 帮助学生理解人工智能回归算法的含义打开课堂。
讲授新课 一、活动1:绘制预测线1、学校为了促进同学们运动,要组织一次路线长6千米的“健步走,励志行”活动,小艾同学想要预测自己多长时间可以走完6 千米,你可以帮助他吗 2.请你测量周围8位同学的身高和步幅,并填表。请根据你所测量的数据在下图中描点并尝试画出一条趋势图。分析人的步幅与其身高存在怎样的关系。一般年轻人快走一分钟可以走130步,请你预测健步走6千米所需要的时间。助力知识---线性回归回归是研究因变量对自变量的依赖关系的一种统计分析方法,目的是通过给定值来估计或预测因变量的均值。回归研究的是因变量和自变量之间的关系,可以用于发现变量之间的因果关系,也可以用于预测。利用人工智能做预测的方法有很多,常见的有线性回归、非线性回归等在众多数据中,如果能找出一条直线,较为准确地代表已有数据的走向,准确地描述数据之间的关系,这就是线性回归。按照自变量的多少,可分为一元线性回归和多元线性回归。如果一个自变量和一个因变量之间的关系可以用一条直线近似表示,那么这种回归被称为一元线性回归。验证欧姆定律的实验根据采集的数据计算电阻值,探究电流、电压、电阻之间的关系。同学们可以根据若干组测量得到的电流、电压数据,绘制出表示电流、电压之间关系的散点图。通过观察散点图,我们发现数据样本点呈条状分布,随着流过待测电阻的电流增大,电压也不断升高,可以用一条直线近似地表示它们之间的关系。自变量电流用x表示,因变量电压用y表示,那么表示电流与电压变化关系的这条近似直线 (称为回归直线) 可以用y=kx+b表示,其中k为回归系数,b为截距。回归系数的绝对值越大,表示x对y的影响越大,若回归系数为正,表示y随x的增大而增大: 若回归系数为负,表示y随x的增大而减小; 若回归系数为零,表示回归直线与x轴平行。根据已知电流推算电压的过程就是运用线性回归原理进行预测的过程,有了这个关系。在自变量已知的情况下,就能很容易地推算出因变量的数值。由于实验中往往存在传感器误差、电磁干扰等许多干扰因素,研究这组数据时,你可能会发现当自变量的取值一定时,因变量的取值也会有波动。多元线性回归主要研究一个因变量与多个自变量之间的相关关系,与一元线性回归的原理类似,区别在于影响因素(自变量)多一些。例如,影响产品单位成本的变量不仅有产量,还包括原材料价格、劳动力价格,劳动效率及废品率等因素。对这种多变量模型的分析,就是多元线性回归分析。如图所示。助力知识—非线性回归在实际应用中,两个变量之间并不总呈线性关系,对这种类型现象的分析和预测一般要应用非线性回归预测。例如,药物在体内的浓度与时间的关系是非线性的,如图所示。二、活动2 找出更准确的预测线1、国家统计局组织调查,采集居民收入、支出、家庭经营和生产投资状况等数据,数据采集完成后,使用统一的方法进行数据处理,然后将数据传输至国家统计局进行统一汇总、计算。调查到的居民可支配收入和居民消费支出数据在一定程度上可以反映居民的生活水平。依据居民人均可支配收入累计值和居民人均消费支出累计值,绘制散点图,可以发现,根据散点图中的数据点能画出多条直线,如图所示。根据不同的直线,由居民人均可支配收入累计值预测出的居民人均消费支出累计值是不同的。我们把根据某条直线预测得到的值称为估计值。估计值和实际值越接近就表示估计值越准确,说明该直线越能体现自变量和因变量之间的关系,现在观察下表,结合该数据表分析线1、线2、线3,哪条直线能更好地表示居民人均可支配收入累计值和居民人均消费支出累计值之间的关系。1.2、根据下表数据分析线1、线2、线3哪条直线能更好地表示居民人均可支配收入累计值和居民人均消费支出累计值之间的关系。1.3、请结合上表中的数据,补全下表的数据,并计算出线1、线2、线3的误差平方和。注意:手动计算误差和误差平方和,容易出错并且效率不高,可以借助Excel中的求和函数SUM计算多个数的和,或借助求平方和函数SUMSO计算多个数的平方和。经过计算,误差平方和最小的线可以较准确地表示居民人均可支配收入累计值和居民人均消费支出累计值的关系助力知识—最小二乘法估计值和实际值之间的差称为误差,为了求得能准确体现自变量和因变量之间关系的直线,需要用最小二乘法求出哪条直线更接近实际值。最小二乘法(又称最小平方法)是一种数学优化方法,它通过寻找各个数据点的误差平方和的最小值来确定最佳的模型,使得估计值和实际值更为接近。为什么要用各个数据点的误差平方和,而非简单地用误差求和呢 这是因为估计值可能大于也可能小于实际值,从而分别产生正误差或负误差。误差的和可能会因为正负相消而变小,而并非因为模型好。如图所示,蓝点是实际值,黄点为估计值,绿线是线性模型,红线显示了估计值和实际值之间的误差。三、活动3 拓展延伸1、思考并讨论线性回归和非线性回归的分析方法分别适合在什么情况下使用?2、思考并讨论线性回归算法在市场营销和广告效果评估中如何使用?四、项目实施1、估计值和实际值之间的差称为误差,为了求得能准确体现自变量和因变量之间关系的直线,需要用最小二乘法求出哪条直线更接近实际值。最小二乘法(又称最小平方法)是一种数学优化方法,它通过寻找各个数据点的误差平方和的最小值来确定最佳的模型,使得估计值和实际值更为接近。为什么要用各个数据点的误差平方和,而非简单地用误差求和呢 这是因为估计值可能大于也可能小于实际值,从而分别产生正误差或负误差。误差的和可能会因为正负相消而变小,而并非因为模型好。如图所示,蓝点是实际值,黄点为估计值,绿线是线性模型,红线显示了估计值和实际值之间的误差。预测结果:当年末总人口增长为 140000 万人时生活垃圾清运量的值为?五、巩固练习1.常见的人工智能回归算法可以分为( )和( ).2 2.如果一个自变量和一个因变量之间的关系可以用一条直线近似表示,这种回归被称为( ).3.通过寻找各个数据的误差平方和最小值来确定最佳的模型,使得估计值和实际值更为接近的方法是( ).4.举出生活中可以用线性回归算法进行预测的实例。许多变量之间存在着相互依存、相互制约、相互影响的关系,生活中还有哪些变量之间存在线性关系,可以用线性回归算法进行预测?请举例说明并填写下表。 学生通过互相讨论,了解预测线的绘制和绘制预测线前所需要做的准备工作。学生通过所给出的表格数据思考如何选择和绘制更准确的预测线。学生完成任务学生实践并总结实践的感受。学生根据巩固练习完成题目,加深对知识的理解 帮助学生更多地思考预测线如何绘。。通过真实的数据进行实验,引导学生更深刻地认识回归算法的使用和预测线的绘制。通过任务的方式,帮助学生养成解决问题能力。培养学生语言组织能力以及对于信息的采集和总结能力帮助学生记忆课堂知识
布置作业 1、搜索了解回归算法更多实例2、搜索了解预测线3、搜索了解如何找到更准确的预测线 完成作业 培养学生查阅资料的能力,分析解决问题的能力
课堂小结 回归算法在信息技术领域具有广泛的应用,但适合的算法取决于问题的特性和数据的分布。了解不同回归算法的原理和特点,结合实际情况选择合适的算法,并进行合理的数据预处理和模型评估,可以提高回归模型的预测性能和可解释性 。 分组总结归纳 锻炼学生的总结能力,逻辑思维、语言表达能力。
板书 一、绘制预测线二、找出更准确的预测线三、线性回归 学习、记忆及勾画知识点 明确教学内容及重点和难点
21世纪教育网 www.21cnjy.com 精品试卷·第 2 页 (共 2 页)
HYPERLINK "http://www.21cnjy.com/" 21世纪教育网(www.21cnjy.com)

展开更多......

收起↑

资源列表