第四单元《人工智能初步》《第 2 课时 采集数据、建立模型、验证模型》教学设计 2023—2024学年沪科版(2019)高中信息技术必修1

资源下载
  1. 二一教育资源

第四单元《人工智能初步》《第 2 课时 采集数据、建立模型、验证模型》教学设计 2023—2024学年沪科版(2019)高中信息技术必修1

资源简介

高中新课程新教材优质课评选
项目九 了解手写数字识别——体验人工智能
采集数据、建立模型、验证模型
——机器学习的一般过程
【教材分析】
本节课内容是信息技术必修 1《数据与计算》第四单元《人工智能初步》中的项目九了解手写
数字识别——体验人工智能。本项目的教学目的是了解什么是人工智能,什么是机器学习、机器学
习的一般过程,计算机如何进行手写数字识别,人工智能发展对社会的作用及影响。本节课内容是
了解什么是机器学习、了解机器学习的一般过程,是整个项目的难点,尤其在数据采集、建立模型
部分,涉及到很多陌生的概念和代码。
【学情分析】
通过项目二的学习, 学生已经对数据编码有所了解。通过项目六的学习, 学生已经对 python 基
础知识有所掌握。在本单元上一节课中,学生知道了人工智能的含义,了解了人工智能的发展,对
人工智能技术的应用非常感兴趣,但是对人工智能技术本身仍缺乏了解。本节课理论知识较多,学
生理解起来会感觉到有些困难。
【核心素养】
信息意识:能够根据解决问题的需要,自觉、主动地寻求恰当的方式获取与处理信息。
计算思维:能够采用计算机领域的学科方法界定问题、抽象特征、建立结构模型、合理组织数据。
【教学目标】
1.通过分析数据采集及数据预处理的方法、分析 MNIST 数据集的组成,增强信息意识。
2.在使用 python 程序进行机器学习建立模型的过程中, 了解人工智能的思想方法, 促进计算思
维的形成与发展。
3.通过了解机器学习的概念、体验机器学习的一般过程,提升对人工智能技术作用的认识,发
展信息社会责任。
【教学重难点】
1.重点:了解机器学习的概念、体验机器学习的一般过程。
1
2.难点:理解采集数据的方法和作用、调试参数建立模型的过程。
【教学准备】
软硬件环境: 64 位操作系统的多媒体机房、 python IDLE、python 第三方库、 MNIST 数据集。
教学素材:读入 MNIST 数据集并将其中的二进制数据转换成图像格式文件的 python 代码、建
立手写数字识别模型的 python 代码、教学网页、教学应用游戏小程序。
【教学过程】
环节 教师活动 学生活动 设计意图
(一) 激趣导入, 引出课题 1.师:今天的课程从观看一个短视频开 始。 放播《2022 世界人工智能大会“鼎文识 别”技术》视频,了解人工智能在中国古代 文字识别中的应用。 2.师:这个视频是 2022 人工智能大会上 文字识别的最新应用,能够把弯曲的鼎上的 古代文字识别出来。从常用汉字识别到古代 文字识别,识别正确率从低到越来越高,这 是机器学习的结果。本节课我们一起来了解 机器学习,以及机器学习的一般过程的前三 个步骤:采集数据、建立模型、验证模型。 3.什么是机器学习呢?请同学们在课本 134 页找一找答案。 机器学习(machine learning)是一门 研究学习算法的学问,它利用已有的数据来 建立模型,再用模型去解决未知的问题。 1.认真观看。 2.了解本节课课 题。 3.学习机器学习的 概念。 通过视频, 激发学生学习兴 趣,了解人工智 能的最新成果, 感受中国文化的 魅力,引出本节 课的课题,明确 本课的内容—— 机器学习及其一 般过程的前三个 步骤。
2
(二) 课程主线: 机器学习的 一般过程 1.师:机器是怎么学习的?机器学习的 一般过程是什么呢?机器学习和人类学习类 似,我们先来看看人类学习的一般过程。 2.师:郑蒲港分校地处农村,学校周围 和校园内都有农田,不同的季节会有不同的 作物,老师为了认识它们,上网找了很多图 片,包括:花生、萝卜、南瓜……今天也想 让同学们也认识认识它们。老师制作了一个 游戏程序,我们一起来玩一玩。老师想请一 位同学上台来完成游戏。(请同学上台) 游戏规则:运行【游戏】识别作物,点 击【学习/下一次】生成图片,进行学习,每 次学习后点击【验证】测试正确率。学习完 成后,老师将通过大屏幕展示图片,进行测 试。 3.师:游戏时间到,我们一起来测试下 能识别几种吧。 4.师:结合大家的体验,整个人类学习 过程包括:准备图片、多次看图片、自我验 证、测试、实物识别。 机器学习的一般过程也类似包括:采集 数据、建立模型、验证模型、评估模型、应 用模型。即用采集到的数据进行训练,以建 立一个模型,再对模型进行验证和评估,然 后投入应用。 1.倾听。 2.认真听讲,玩游 戏。 3.参与测试。 4.回顾游戏过程, 了解人类学习的一 般过程,对比机器 学习的一般过程。 通过游戏, 更加有趣的让学 生了解人类学习 的一般过程,通 过人类学习的一 般过程和机器学 习的一般过程对 比,过渡到新知 识。学生游戏后 自我总结,再知 识讲解,更加有 利于学生理解。
;
(三) 进入主线: 数据采集及 预处理 【数据采集】 1.师:那每一个过程又具体做了什么 呢?下面我们就一起来详细了解一下。本节 课只了解机器学习的一般过程中前三个步 骤:采集数据、建立模型、验证模型。图片 的识别对于计算机来说难度有点大,我们以 最简单的识别手写数字 0-9 为案例。 机器学习的一般过程中,第一步数据采 集是机器学习的基础,采集到的数据将应用 到建立模型、验证模型、评估模型中。 2.师问:如果我们想让机器识别出 0-9 这 10 个数字,我们先要让机器知道什么? 3.师: 0 长什么样? 1 长什么样? ……针 对手写数字识别,人们开发了可用于机器学 习的 MNIST 数据集。 【MNIST 数据集的组成】 4.师:什么是 MNIST 数据集呢? MNIST 数据集来自美国国家标准与技术研 究所,我们可以从网站上下载到 MNIST 数据 集,包含四个部分,下载后如图: 解压后如图: 1.认真听讲。 2.思考、讨 论、回答。 3.倾听。 4.思考、认 真、仔细听讲。 下面的课程 内容以“机器学 习的一般过程” 为主线展开,以 手写数字识别为 案例。 数据采集是 机器学习的基 础,非常重要。 先请学生思考如 果要自己采集, 会采用什么样的 方法,引出 MNIST 数据集的 内容。 从 MNIST 数 据集的文件类型 开始,介绍其组 成,包括由来、 数量等。 再详细介绍 这些图片的分 类、数量和用 途,为后面机器 学习全过程中使 用数据集做铺 垫。
包含 包含 包含 包含 10,000 10,000 60,000 60,000 个样本 个标签 个样本 个标签
由 250 个人手写的不同数字构成。采集 了 70000 张从 0 到 9 这 10 个数字的样本图
4
片,所有图片由人工完成标注。 5.自学互学、 主动动手、积极思 考、尝试总结。 6.倾听,思 考。 为了更加形 象的看到数据集 的内容,设计了 [活动一],运行 课本的素材程序 “MNIST_img.py ”查看 MNIST 数 据集中的样本图 片,并在观看后 思考总结 MNIST 数据集中图片的 特征。 一方面熟悉 了 python 软件的 使用,另一方面 在思考总结的结 果中引出下一个 内容【数据预处 理】。 数据预处理 部分涉及到灰度 图像、图片向量 化等概念,结合 图示、 python 代 码进行讲解,帮 助学生理解, 一 些知识点放在 《导学网页》 中,根据学生的 理解程度,供学
55000 张 60000 张 (
70000

)5000 张 (
10000

)10000 张
70000 张图片进行了详细的划分,用到后 面的各个步骤中。首先分为训练样本和测试 样本。然后,训练样本分为 Train(训练)集 合用于建立模型, Validation(验证)集合 用于验证模型。测试样本分为 Test(测试) 集合用于评估模型。 5.师:那么 MNIST 数据集到底是什么样 的呢?我们完成【活动一】查看 MNIST 数据 集中的样本图片。 [活动一]利用 python 程序 [MNIST_img.py]查看 MNIST 数据集中的样本 图片 (1)用 python IDLE 打开 (2)运行程序,查看结果 (3)自我总结 请学生描述看到的结果: 0-9 十个文件 夹、每个文件夹里是对应的数字图片、数字 在图片正中间、图片很小…… 【数据的预处理】 6.师问:为什么不能直接用采集的图片 呢?
5
7.师:因为机器学习中输入的样本都是 要进行数值计算的。因此,需要将图片变成 数值向量,叫做图片的向量化。过程如下: 首先,图片被转换成 28*28 像素的灰度 图像,所以我们看到的图片很小。每个像素 点用一个灰度值表示, 0 表示白色, 1 表示黑 色,中间各个级别的灰色用 0-1 之间的小数 表示,比如数字 1 表示成右图。然后,把下 一行接在上一行的后面,形成了 784 个数的 数组,这样就完成了图片的向量化。 以数字 1 为例子: 在 python 语言中,通过代码可以方便地 读入 MNIST 数据集,并直接完成向量化。 input_data.read_data_set 函数会自动 将 MNIST 数据集划分为 Train、Validation 和 Test 三个集合。 MNIST_data 表示数据集的 位置。设置 one_hot=True,是将标注信息转 化成一种标准格式。有关 one_hot 的详细内 容,可以参考导学网页中的相关页面。 7.认真听讲。 生自学。
(四) 主线难点: 建立模型 1.师问:采集数据结束后,第二个步骤 是建立模型。 2.师:建立模型的过程就是对 Train 集 合进行训练的过程。首先要选择合适的学习 算法,然后利用学习算法对样本进行训练。 【学习算法】 3.师关于学习算法,我们需要简单的知 1.倾听。 2.认真听讲。 3.仔细听讲。 建立模型是 机器学习中的一 个难点。 首先,介绍 建立模型的概 念,引出深度学 习算法和卷积神
6
道两个概念, 一个是深度学习,它在提取特 征方面表现的很强大,另一个是卷积神经网 络,简写 CNN,在图像分类上表现出色。 通过前面的课程,我们已经知道了人工 智能、机器学习、深度学习、卷积神经网络 这些概念了,它们直接到底是什么关系呢? 我们可以用一个图示来表示。卷积神经网络 是深度学习的算法之一,深度学习是机器学 习的一个分支,机器学习是实现人工智能的 一种途径。 【建立模型】 4.师:我们可以使用 python 语言通过卷 积神经网络来建立和验证模型。具体步骤为 导入库、读取数据集、构建 CNN 网络结构、 训练、存储模型。 其中最重要的是训练过程,训练过程的 主要代码是这一部分: 第一行参数 10000 是设置训练次数为 10000 次,第二行参数 100 是设置每次进行训 练的图片数量,第三参数 200 是设置显示间 隔,显示出当前训练次数下的识别正确率。 最后一行进行训练,并且得出模型。 由于卷积神经网络模型训练过程中选取 4.认真观看、 听讲。 经网络算法。 接着,为了 让学生更加直观 的看到建立模型 中神经网络的构 建,打开课本的 素材程序 “CNN_MNIST.py” ,结合代码进行 讲解。 最后,同样 结合代码讲解训 练过程,通过修 改参数得到更加 准确的结果。 为了增强学 生对建立模型过 程的体验,加深 不同训练参数对 训练正确率的理 解,设计了[活动 二],修改课本的 素材程序 “MNIST_img.py ”中训练次数、 每次送入卷积神 经网络的图片数 量等参数,观察 训练过程和结 果,并尝试总结
7
高中新课程新教材优质课评选
训练样本的随机性,每次得到的结果不会完 全相同。训练结果如下: 5.师:下面,我们完成【活动二】体验 训练过程。通过修改 python 程序 [CNN_MNIST.py]中的参数,看看不同参数的 训练结果是什么样的。 [活动二] 利用 python 程序 [CNN_MNIST.py]体验训练过程 (1)用 python IDLE 打开 (2)运行程序,观看结果 (3)设置不同参数,多次观看结果 (4)自我总结 6.师:通过修改参数我们可以发现:训 练次数越多,正确率越高。每次送入训练的 图片数越多,正确率越高。 5.自学互学、 主动动手、积极思 考、尝试总结。 6.思考、倾 听。 其中的规律。
(五) 继续主线: 师:随着训练的不断继续,模型的识别 正确率也不断得到提升。当前训练次数下模 认真听讲。 验证模型也 是机器学习中的
8
高中新课程新教材优质课评选
验证模型 型的识别正确率是通过 Validation(验证) 集合计算得到的,这个过程就是验证模型。 一个环节,但不 是重点,因此简 单介绍。
(六) 课堂总结 1.师:通过本节课的学习,我们看到人 工智能的最新应用,明白了机器学习的概 念,了解了机器学习的一般过程及前三个步 骤:采集数据、建立模型、验证模型。在手 写数字识别案例中,分析了数据采集得到的 MNIST 数据集的组成,体验了建立模型的过 程,总结了对训练正确率的影响因素,知道 了验证模型的方法。 2.师:在下一节课中,我们讲继续学习 机器学习的剩余部分——评估模型和应用模 型。后面的内容更加精彩。 1.在教师引导 下,回顾总结所学 习的内容和所经历 的思考过程。 2.做好下一节 课继续学习的准 备。 通过总结整 理本节课的学习 脉络,使学生对 所学知识有清晰 的把握。 并且引出下 节课要学习的内 容。
【板书设计】
9

展开更多......

收起↑

资源预览