【核心素养目标】第2单元 第1课《神经网络与深度学习》课件+素材-【清华大学版2024】《信息科技》八下

资源下载
  1. 二一教育资源

【核心素养目标】第2单元 第1课《神经网络与深度学习》课件+素材-【清华大学版2024】《信息科技》八下

资源简介

(共52张PPT)
第2单元 第1课
神经网络与深度学习
(清华大学版)八年级

1
核心素养目标
3
新知讲解
5
拓展延伸
7
板书设计
2
新知导入
4
课堂练习
6
课堂总结
课后作业
8
01
核心素养目标
信息意识
计算思维
数字化学习与创新
信息社会责任
神经网络和深度学习在提升技术效能的同时,需要树立正确的信息伦理观和社会责任感,确保技术的健康发展。
深度学习课程促进了数字化学习工具和资源的创新,能够运用个性化学习和智能化学习方式改进学习效率和开拓创新思维。
通过学习神经网络与深度学习,能够掌握问题的建模、分解及求解过程,提升抽象和结构化思考问题的能力。
能够培养对信息技术发展的敏感性,意识到技术变革带来的机遇与挑战,理解信息技术在现代社会中的作用。
02
新知导入
本单元你将学习:
什么是神经网络和深度学习
什么是卷积神经网络
怎样训练深度神经网络模型
如何评估与部署模型
02
新知导入
近年来,人工智能技术不断发展,深度学习作为一种基于人工神经网络的机器学习方法,在许多领域取得了突破性的进展,尤其在计算视觉领域,深度学习显示出了显著的优势。
02
新知导入
2014年,人工智能在人脸识别方面的准确率首次超过人眼;2015年,微软亚洲研究院视觉计算组开发的计算机视觉系统,在 ImageNet 大规模视觉识别挑战赛(ImageNet Large ScaleVisual Recognition Challenge,ILSVRC)中首次超越人类进行对象识别分类的能力。之后,人工智能受到前所未有的重视,人工智能产业进入了快速发展阶段。
02
新知导入
你知道机器识别的应用有哪些吗 它给我们的生活学习带来了哪些影响 请将所了解的信息填在下表中。
学习热身
02
新知导入
你知道吗
科学家发现,当图像进入哺乳动物大脑的视觉皮层时,神经元都会将它们拆分成一系列形状组合。这一发现为人工智能研究提供了两个思路:一个是每个神经元只需要对视野的局部进行感知,然后将局部信息综合起来得到全局信息;另一个是用多个不同功能的神经元对图像进行多次检测。
卷积神经网络模仿生物的视知觉机制,利用卷积运算对图像进行特征提取,是深度学习的代表算法之一。
02
新知导入
本课中你将学习:
单层感知机模型包括哪些基本结构
多层感知机的基本原理是什么
全连接神经网络的应用有哪些
深度学习的优势有哪些
深度神经网络的开发框架和工具有哪些
02
新知导入
线性回归模型在预测简单关系(如根据脚长预测身高)时表现良好,但在面对自然界的复杂关系(如看图识物、下围棋、自动驾驶等)时则显得力不从心。科学家为处理复杂的输入、输出关系进行了大量的尝试,设计了多种机器学习的算法,如非线性回归、支持向量机和神经网络等,其中神经网络能够很好地表示复杂的物理变量关系。本节课,我们将从介绍神经网络的起源出发,带领同学们逐步了解深度神经网络模型强大的预测能力。
02
新知导入
03
新知讲解
一、人工神经网络的起源
20 世纪初期,科学家就已经知道人类的大脑有超过 800 亿个神经元,神经元的工作机制是当外部刺激达到一个值时,神经元会向下一个神经元发出信号。当时很难解释,为什么大量功能单一的神经元连在一起就能形成思维和智慧。
03
新知讲解
1943年,美国神经生理学家沃伦·麦卡洛克(WarrenMcCuloch)和数学家沃尔特·皮茨(Walter Pitts)合作,提出了“M-P 模型”,证明了简单的神经元模型可以通过相互连接和组合实现复杂的逻辑功能,并提出了“人工神经网络”这一概念,如图 2.1.1所示。
03
新知讲解
二、人工神经网络的发展
“M-P模型”的提出在当时并没有引起人们的重视,直到 1957年弗兰克·罗森布拉特(Frank Rosenblatt)设计了感知机模型,这才引发了一次人工智能领域的研究热潮。感知机模型是第一个具有学习能力的神经网络,罗森布拉特还造出了第一台硬件感知机“Mark-1”,如图 2.1.2 所示,它经过学习后能识别出英文字母。
03
新知讲解
1.单层感知机
罗森布拉特设计的感知机只有一层,也称单层感知机。单层感知机的成功引发了联结主义的兴起。但不久之后,人工智能奠基人之一的马文·明斯基(Marvin Lee Minsky)和麻省理工学院的西蒙·派珀特(Seymour Papert)从数学和逻辑上证明了单层感知机的重大局限--只能解决“线性可分”问题。
03
新知讲解
明斯基还认为,虽然通过多层感知机可以解决非线性可分的问题,但连接数量太多会导致无法训练,研究两层乃至更多层的感知机是没有价值的。这一论断引发了连锁反应,给人工智能的发展带来了沉重的打击。
03
新知讲解
阅读
线性可分与线性不可分是机器学习中划分数据集的两个术语。线性可分指数据集存在一个线性边界,使所有属于一个类的数据点都位于这个边界的一侧,而所有属于另一个类的数据点都位于另一侧。如图2.1.3(a)所示,假设有两类数据点散布在二维平面上,一类是圆点,另一类是叉点。
03
新知讲解
阅读
如果能找到一条直线,把两类数据分开,那么这个数据集是线性可分的:相反,如果找不到这样的直线,那么该数据集被视为线性不可分。如图2.1.3(b)所示,某些圆点被包围在由叉点形成的圈中,找不到一条单一的直线将它们完全分开,所以这个数据集是线性不可分的。
03
新知讲解
2.多层感知机
因为明斯基对感知机的论断,神经网络被打入冷宫,所有“以机器模拟大脑结构”的研究被视作异端,只剩下少数人还在坚持。1986年,杰弗里·辛顿(Geoffrey Hinton)教授发现可以通过特定算法(误差反向传播)对多层神经网络进行训练,有效地解决更为复杂的非线性问题,人工神经网络逐步从单层走向了多层。
03
新知讲解
如图 2.1.4 所示,在单层感知机模型的基础上增加了多个隐藏层,形成了多层感知机(multilayer perceptron,MLP)模型,也称为多层神经网络。正如明斯基的论断,随着隐藏层的增加,神经网络的非线性表达能力将得到大大增强。
03
新知讲解
探 索
单层感知机增加若干隐藏层就组成了多层感知机,既然多层感知机能解决这么多的问题,为什么不采用“多多益善”的思路,建构模型的时候尽可能多添加隐藏层 模型的隐藏层增多会导致哪些问题
梯度消失与爆炸:深层网络可能会遇到梯度消失或梯度爆炸的问题,导致模型难以训练。
难以调试和优化:层数过多的网络往往更加难以调试,训练时更容易出现问题,需要更多的技术和经验去优化。
03
新知讲解
3.全连接神经网络
全连接神经网络是一种由多层感知机构成的基本网络结构,可以处理更复杂的问题。例如身高推断模型,如果把“每天锻炼身体的时间”“饮食健康程度”“父母身高”等因素都加入数据集,那么多项式回归算法无法完成这个任务,但全连接神经网络依然能出色完成任务。此外,全连接神经网络能同时适用于分类任务和回归任务,这就有点儿像“一招应万变”的必杀技。
03
新知讲解
机器学习中也有个算法叫做多层感知机,其实就是全连接神经网络。BaseNN(搭建简单神经网络的工具)和BaseML两个工具都提供了搭建多层神经网络模型的功能。以输入4个变量推断身高的回归模型训练为例,用这两个工具搭建全连接神经网络的参考代码分别如表 2.1.1所示。
03
新知讲解
表2.1.1所示两段代码都能搭建一个输入维度为4,输出维度为1,隐藏层数量为2的全连接神经网络,如图 2.1.5所示。
03
新知讲解
使用这一网络,能够实现对多个输入变量进行训练,并得到可预测结果的模型。但要搭建更加复杂的神经网络,只能用BaseNN。若使用这个神经网络来做分类任务,则需要将“model= nn('eg' )”修改为“model = nn('cls')”,并相应调整输出维度。其中“reg”指代回归任务,“cls”指代分类任务。
03
新知讲解
使用身高数据集训练这个神经网络,会得到神经网络的各个神经元之间连接的“权重”。我们通常说的“模型”,实际上包含神经网络的结构和训练得到的“权重”数据。为了更好地理解神经网络,下面我们结合图 2.1.5,对常见的专业名词做一下介绍。
神经元。图中的每一个圆圈表示一个神经元。
层。图中每一列都表示一层,除去输入层和输出层,这个图中有两个隐藏层。在 BaseNN 中,“model.add( )”用来增加层,“layer='Linear”表示线性层,后面我们还会学到更多的层。“size=(10,5 )”表示隐藏层的输入维度是 10,输出维度是5。
03
新知讲解
参数。所有神经元之间的连接线就是参数,参数中包含“权重”。模型搭建好后,参数是随机的,训练模型实际上是在“找”合适的参数。
激活函数。激活函数用来模拟神经元控制继续传递信号的方式,可以看成是一个if语句,若符合条件则向下一个神经元输出信号。常见的激活函数有 Sigmoid、Tanh、ReLU 和Sofmax等,对于分类模型来说,最后一层用的都是 Sofmax。
03
新知讲解
三、从浅层学习到深度学习
虽然辛顿等人提出的误差反向传播算法给神经网络研究注入了新的希望,但是没有直接促成联结主义研究的复兴。人们之所以不愿意研究具有更多隐藏层的神经网络,背后的重要原因之一依然是隐藏层数量增加会带来更高的训练难度和更大的训练数据需求。这种困局持续了 20 年才得到改变。
03
新知讲解
1.深度学习的提出
2006 年,辛顿等人发表了论文《通过神经网络进行数据降维处理》在论文中,辛顿提出了“深度学习”的概念,第一次清晰地说明了深度学习相对于传统浅层学习(指隐藏层少的神经网络)的价值和优势。深度学习是指利用深度神经网络技术进行机器学习的一种过程,而深度神经网络是指拥有多个隐藏层的神经网络,如多层感知机。
03
新知讲解
深度学习的最大优势是什么 简而言之,神经网络可以在学习过程中逐层自主提取数据特征。我们已经知道,在传统的机器学习中选取特征是关键。比如,训练身高推断模型时,选择了兴趣爱好、皮肤颜色、头发长短等特征,再好的算法也将束手无策。因此,机器学习能否成功依赖于人工分析是否准确。
03
新知讲解
如果要让机器分辨图像中的动物是猫还是狗呢 按照人工分析数据提取特征的老办法显然行不通,因为在图像中寻找特征(猫和狗的区别)非常困难。但是,深度神经网络可以在训练过程中自动提取图像、语音和文本中的有效特征,甚至效果比人工分析还要好。这一优势对于机器学习来说非常显著,如图 2.1.6 所示。
03
新知讲解
有了深度学习的理论基础之后,研究人员开始不断挖掘深度学习的价值。2012 年多伦多大学开发的 AlexNet 网络模型在著名的ImageNet 大规模视觉识别挑战赛中夺冠,仅仅8层就远超第二名,展现出了超越传统机器学习算法的性能。此后,基于深度学习的系统在图像分类上的错误率持续下降(见图 2.1.7),其识别能力已超越人类。
03
新知讲解
各种深度神经网络结构也不断涌现(如卷积神经网络、循环神经网络、残差网络等),深度学习能解决的任务也越来越多,在模式识别、自动控制、生物、医学、经济等领域成功解决了大量难题。在通用并行计算平台(如CUDA)的支持下,深度学习训练模型的速度也在加快。目前,深度学习已经成为人工智能最重要的研究方向。2014年,生成对抗网络(GAN)的出现开启了生成式人工智能的新时代。
03
新知讲解
探 索
深度学习的巨大优势背后,需要哪些技术的支持 请谈谈深度学习与大数据技术、机器高速运算能力的关系。
大数据技术:深度学习模型需要大量的训练数据来实现较高的准确率。大数据技术提供了有效存储、处理和管理海量数据的能力,支持深度学习训练。
机器高速运算能力:深度学习模型需要大量的计算资源来训练复杂的网络结构。GPU(图形处理单元)和TPU(张量处理单元)等硬件加速器提供了并行计算能力使得训练过程能够在合理的时间内完成。
03
新知讲解
探 索
深度学习的巨大优势背后,需要哪些技术的支持 请谈谈深度学习与大数据技术、机器高速运算能力的关系。
云计算:云计算技术能够提供弹性计算资源,支持深度学习模型的训练和部署,尤其是当数据和计算需求大时,云平台能够提供必要的资源支持。
优化算法:深度学习需要高效的优化算法,如反向传播算法及其变种(如Adam),以确保在大规模数据和参数空间中能够快速收敛。
03
新知讲解
探 索
深度学习的巨大优势背后,需要哪些技术的支持 请谈谈深度学习与大数据技术、机器高速运算能力的关系。
深度学习能够从大量数据中提取有效特征,表现出强大的学习能力,但这种能力依赖于海量的标注数据。没有大数据技术的支持,深度学习无法获得足够的数据来训练模型。
03
新知讲解
2.深度学习的开发工具
很多编程工具都支持深度学习开发。由于具有开源和易用的特点,Pyton语言成为人工智能编程的首选语言。它拥有多个人工智能开发框架和工具包,如 TensorFlow、Keras、PaddlePaddle和 PyTorch 等,如表2.1.2 所示。
03
新知讲解
TensorFlow 和 PyTorch 是迄今为止最受用户欢迎的两个 AI开发框架,都拥有丰富的编程接口、广阔的用户群体,目前广泛用于学术研究和商业应用。Keras 降低了 TensorFlow 的开发门槛,更适合初学者。PyTorch也支持 Keras,并且出现了 FastAI以及 OpenMMLab 等工具,同样拥有大量的用户。2022 年 12月,上海人工智能实验室浦育团队基于OpenMMLab 开发了 MMEdu,为初学者快速入门深度学习提供了低技术门槛的开发工具。
03
新知讲解
鸢尾花虽然常见但品种很多,只有资深的花农才能辨别。1936年英国统计学家、生物学家罗纳德·费希尔(Ronald Fisher)在加拿大加斯帕半岛上,测量了一批有三个种类的鸢尾花,形成了一个鸢尾花数据集。该数据集包含150个数据样本,分为3类(Iisversicolor、Inisselosa和Iis viginica ),每类有50个数据,每个数据包含4个属性(花萼长度、花萼宽度、花瓣长度和花瓣宽度),如图2.1.8所示。
挑战
03
新知讲解
请以小组为单位,使用多层种经网络训练模型,实现对鸢尾花的分类。核心实践内容包括:
(1)用 BaseNN搭建多层神经网络。
(2)载入数据集,训练模型并测试。
(3)进一步思考:使用类似的网络结构训练身高推断模型,能否得到不错的准确度
挑战
04
课堂练习
一、选择题
1、卷积神经网络(CNN)的核心优势在于:
A.具有较强的并行计算能力 B.能处理序列数据的时序关系
C.在图像数据上有很好的特征提取能力 D.不需要大量数据训练
2、以下哪种神经网络适合处理时间序列数据?
A.卷积神经网络(CNN) B.循环神经网络(RNN)
C.前馈神经网络(FNN) D.自编码器(Autoencoder)
3、在GAN(生成对抗网络)中,生成器的作用是:
A.生成真实数据 B.生成伪造数据并与真实数据进行对比
C.判断数据的真实性 D.提供标签给判别器
C
B
B
04
课堂练习
4、在深度学习中,反向传播算法主要用于:
A.优化模型的超参数 B.执行卷积操作
C.初始化神经网络的权重 D. 计算损失函数的梯度并更新权重
二、判断题
1、深度学习模型的训练过程中,通常需要大量的标注数据。( )
2、强化学习中的目标是最大化奖励,并通过探索与利用来获得最优策略。( )
3、卷积神经网络(CNN)不适用于处理图像数据。( )
4、激活函数的主要作用是引入非线性,使神经网络能够学习复杂的函数。( )
D


X

04
课堂练习
三、操作题
使用PyTorch实现一个简单的前馈神经网络,并在CIFAR-10数据集上进行训练。请提供代码示例。
05
拓展延伸
可解释性AI
可解释性AI(XAI)是指能够让人类理解和解释AI模型的决策过程的技术。这一领域的目标是使得复杂的黑箱模型(如深度学习、集成学习等)能够被解释和理解,增强人类对AI系统的信任和控制。
符合法规要求:某些行业(例如金融、医疗)有对决策过程透明性的要求。可解释性AI能够帮助这些领域满足监管和合规的要求,确保AI决策符合伦理标准。
增强对复杂问题的理解:在医学、法律等领域,通过可解释性AI,专家可以理解模型如何得出某个结论,有助于专家验证AI建议的有效性,从而做出更有根据的决策。
05
拓展延伸
生成对抗网络(GANs)
生成对抗网络(GANs,Generative Adversarial Networks)是一种深度学习模型,由两部分组成:生成器(Generator)和判别器(Discriminator)。这两者通过“对抗训练”互相竞争,不断优化以产生创新性内容。通过对抗训练生成创新性图像、音频等,推动创造性应用的开发。
05
拓展延伸
边缘计算与深度学习结合
边缘计算(Edge Computing)指的是数据在离数据来源设备更近的地方(即“边缘”)进行处理,而不是传送到远程的数据中心进行处理。这种方式减少了延迟、带宽压力和隐私泄露的风险,尤其在需要实时反应和快速决策的应用中非常有用。
深度学习是指通过神经网络等算法进行数据处理和模式识别的技术,广泛应用于图像识别、自然语言处理、语音识别等任务。
05
拓展延伸
边缘计算与深度学习结合案例
智能家居:在智能家居设备中,深度学习模型能够在本地边缘设备(如智能摄像头、门锁等)上进行图像识别和语音识别,无需将所有数据上传到云端。这不仅提升了处理效率,还保证了用户的隐私。
工业物联网(IIoT):在制造业中,边缘计算与深度学习结合可以实时分析设备的运行数据,预测设备故障并进行维护,从而减少停机时间并提升生产效率。
06
课堂总结
1
引入新知内容
神经网络与深度学习
2
进行需求分析和分工合作
3
完成规划实施和评价交流
4
完成课堂练习
5
进行知识拓展
1
2
3
4
5
07
板书设计
神经网络与深度学习
1、进行新知引入
2、进行需求分析和分工合作
3、完成规划实施和评价交流
4、完成课堂练习
5、进行知识拓展
课后作业。
1、深度学习板块的现实应用。
2、学习总结。
08
课后作业
1、选择一个深度学习框架(如TensorFlow或PyTorch),实现一个简单的循环神经网络,用于处理文本数据(如情感分析或文本生成),并撰写实验报告。
2、总结本课所学内容。
https://www.21cnjy.com/recruitment/home/fine

展开更多......

收起↑

资源列表