3.1.2机器学习算法类型:监督学习 课件(共28张PPT)-高中信息技术粤教版(2019)选择性必修4

资源下载
  1. 二一教育资源

3.1.2机器学习算法类型:监督学习 课件(共28张PPT)-高中信息技术粤教版(2019)选择性必修4

资源简介

(共28张PPT)
机器学习算法类型:监督学习
——K 近 邻 算 法 苹 果 柠 檬 分 类
机器学习算法类型:
机器学习算法类型
监督学习
K近邻算法
决策树
线性回归
朴素贝叶斯
无监督学习
聚类算法
主题模型
推荐系统
思考:如何来区分苹果和柠檬?
颜色
大小
形状
表皮
特 征
苹果和柠檬都有那些外部特征?
标签 长 宽
苹果 7.0 7.1
标签 长 宽
柠檬 6.0 8.2




采集苹果和柠檬长宽特征:
标签 长 宽
柠檬 7.23 5.51
柠檬 6.69 5.97
柠檬 6.63 5.56
柠檬 5.67 5.82
柠檬 6.37 4.68
柠檬 5.59 5.75
柠檬 6.58 4.43
柠檬 5.44 5.92
柠檬 5.11 4.37
柠檬 5.07 4.21
苹果 8.41 7.00
苹果 8.11 7.30
苹果 8.79 6.12
苹果 8.07 7.55
苹果 8.93 7.24
苹果 8.73 7.60
苹果 9.47 6.15
苹果 9.50 6.18
苹果 9.72 6.17
苹果 9.32 7.79
任务一:将 数 据 处 理 成 散 点 图。
探究活动——数据可视化
请同学们打开实践活动表格,跟老师一起完成散点图描绘任务。
探究活动——发现数据特征探究分类算法
柠檬
苹果


探究活动——发现数据特征探究分类算法

柠檬
苹果

C
A
B
A 为苹果
B C为柠檬
问 题
分别预测A、B、C三个点属于什么水果,为什么?
探究活动——发现数据特征探究分类算法
柠檬
苹果


C
A
B
方法一:同区域范围属于同一类
“物以类聚”
探究活动——发现数据特征探究分类算法
柠檬
苹果


探究活动——发现数据特征探究分类算法

柠檬
苹果

a
a直线:
直线上方是苹果
直线下方是柠檬
探究活动——发现数据特征探究分类算法

柠檬
苹果

a1
a2
a3
an-1
an
问题:下列哪条直线分类更合理?请同学思考并回答。
a1


b1
c1
柠檬
苹果
探究活动——发现数据特征探究分类算法
问题:下列哪条直线分类更合理?
b1


a1
c1
A
B
柠檬
苹果
探究活动——发现数据特征探究分类算法


b2
a2
c2
柠檬
苹果
探究活动——发现数据特征探究分类算法
问题:下列哪条直线分类更合理?请同学思考并回答。
看这张图:A2 ,B2,C2 3条直线中,哪一条直线分类更合理?请同学们思考。


a2
b2
c2
柠檬
苹果
A
B
问题:下列哪条直线分类更合理?
探究活动——发现数据特征探究分类算法


a3
b3
c3
柠檬
苹果
探究活动——发现数据特征探究分类算法
从刚才和学生一起的探究过程中,我们会发现:C3分类更合理,分类更合理的这条直线都有哪些特征?
柠檬
苹果


a4
b4
c4
A
B
β
β
分类间隔2β
最优分类直线具备两个特征:
1.它夹在两类样本之间。
2.对样本中最近两个点A、B分类间隔β最大,分类间隔和2β最大。
用直线将两类水果分开,这属于分类算法中的支持向量机算法。
方法二:划直线区分两个区域
探究活动——发现数据特征探究分类算法
分类最合理的直线,它有这两个特征,首先这条直线夹在两个样本之间。并且两类样本中最近的两个点A点和B点。他们的分类间隔最大。用直线将两类水果分开,这属于分类算法中的支持向量积算法
C
A
B
问题:分别预测
A、B、C三个未知
水果属于什么水
果,为什么?
柠檬
苹果


A 苹果
B 柠檬
离谁近就属于哪一类
探究活动——发现数据特征探究分类算法
取预测对象最近的K个点,哪个类别的点占比多,它就属于哪一类。概括为:“观其邻,而识其类”。
离C最近的3个邻居中,有2个是苹果,有1个是柠檬,所以C可能是苹果。
离C最近的1个邻居中,是柠檬,所以C可能是柠檬。
柠 檬
苹果

C
A
B

K 近 邻 算 法
方法三:离谁近就属于哪一类
探究活动——发现数据特征探究分类算法
实践活动:利用电子表格探究K近邻算法
第一步:计算距离,利用欧式距离公式计算未知水果到各个样本之间的距离。
第二步:给距离排序。
第三步:选取K值。
第四步:投票分类,找到K个“最近邻居”类别占比情况,确定未知水果的种类。
拓展实践:利用电子表格探究K近邻算法
利用电子表格实现K近邻算法对苹果和柠檬的预测。
拓展实践:利用电子表格探究K近邻算法
小说分类
男女生判断
朋友选择
糖尿病诊断
拓展实践:利用电子表格探究K近邻算法
小说分类
男女生判断
朋友选择
两种数据特征(二维)
三种数据特征(三维)
多分类
K近邻算法不仅能解决二维特征分类,也能解决多维特征分类。也解决多分类问题。
拓展实践:利用电子表格探究K近邻算法
数据特征多
样本多
计算复杂
课后探索
尝试将本节课的实践任务用编程的方式呈现,并且对未知样本进行预测。
课堂总结:机器学习算法类型:
监督学习
训练数据:苹果柠檬长宽特征
探究分类算法
(K近邻算法)
利用K近邻算法
构建分类器
未知样本
预测结果

展开更多......

收起↑

资源预览