资源简介 (共28张PPT)机器学习算法类型:监督学习——K 近 邻 算 法 苹 果 柠 檬 分 类机器学习算法类型:机器学习算法类型监督学习K近邻算法决策树线性回归朴素贝叶斯无监督学习聚类算法主题模型推荐系统思考:如何来区分苹果和柠檬?颜色大小形状表皮特 征苹果和柠檬都有那些外部特征?标签 长 宽苹果 7.0 7.1标签 长 宽柠檬 6.0 8.2长宽长宽采集苹果和柠檬长宽特征:标签 长 宽柠檬 7.23 5.51柠檬 6.69 5.97柠檬 6.63 5.56柠檬 5.67 5.82柠檬 6.37 4.68柠檬 5.59 5.75柠檬 6.58 4.43柠檬 5.44 5.92柠檬 5.11 4.37柠檬 5.07 4.21苹果 8.41 7.00苹果 8.11 7.30苹果 8.79 6.12苹果 8.07 7.55苹果 8.93 7.24苹果 8.73 7.60苹果 9.47 6.15苹果 9.50 6.18苹果 9.72 6.17苹果 9.32 7.79任务一:将 数 据 处 理 成 散 点 图。探究活动——数据可视化请同学们打开实践活动表格,跟老师一起完成散点图描绘任务。探究活动——发现数据特征探究分类算法柠檬苹果长宽探究活动——发现数据特征探究分类算法长柠檬苹果宽CABA 为苹果B C为柠檬问 题分别预测A、B、C三个点属于什么水果,为什么?探究活动——发现数据特征探究分类算法柠檬苹果长宽CAB方法一:同区域范围属于同一类“物以类聚”探究活动——发现数据特征探究分类算法柠檬苹果长宽探究活动——发现数据特征探究分类算法长柠檬苹果宽aa直线:直线上方是苹果直线下方是柠檬探究活动——发现数据特征探究分类算法长柠檬苹果宽a1a2a3an-1an问题:下列哪条直线分类更合理?请同学思考并回答。a1长宽b1c1柠檬苹果探究活动——发现数据特征探究分类算法问题:下列哪条直线分类更合理?b1长宽a1c1AB柠檬苹果探究活动——发现数据特征探究分类算法长宽b2a2c2柠檬苹果探究活动——发现数据特征探究分类算法问题:下列哪条直线分类更合理?请同学思考并回答。看这张图:A2 ,B2,C2 3条直线中,哪一条直线分类更合理?请同学们思考。长宽a2b2c2柠檬苹果AB问题:下列哪条直线分类更合理?探究活动——发现数据特征探究分类算法长宽a3b3c3柠檬苹果探究活动——发现数据特征探究分类算法从刚才和学生一起的探究过程中,我们会发现:C3分类更合理,分类更合理的这条直线都有哪些特征?柠檬苹果长宽a4b4c4ABββ分类间隔2β最优分类直线具备两个特征:1.它夹在两类样本之间。2.对样本中最近两个点A、B分类间隔β最大,分类间隔和2β最大。用直线将两类水果分开,这属于分类算法中的支持向量机算法。方法二:划直线区分两个区域探究活动——发现数据特征探究分类算法分类最合理的直线,它有这两个特征,首先这条直线夹在两个样本之间。并且两类样本中最近的两个点A点和B点。他们的分类间隔最大。用直线将两类水果分开,这属于分类算法中的支持向量积算法CAB问题:分别预测A、B、C三个未知水果属于什么水果,为什么?柠檬苹果长宽A 苹果B 柠檬离谁近就属于哪一类探究活动——发现数据特征探究分类算法取预测对象最近的K个点,哪个类别的点占比多,它就属于哪一类。概括为:“观其邻,而识其类”。离C最近的3个邻居中,有2个是苹果,有1个是柠檬,所以C可能是苹果。离C最近的1个邻居中,是柠檬,所以C可能是柠檬。柠 檬苹果宽CAB长K 近 邻 算 法方法三:离谁近就属于哪一类探究活动——发现数据特征探究分类算法实践活动:利用电子表格探究K近邻算法第一步:计算距离,利用欧式距离公式计算未知水果到各个样本之间的距离。第二步:给距离排序。第三步:选取K值。第四步:投票分类,找到K个“最近邻居”类别占比情况,确定未知水果的种类。拓展实践:利用电子表格探究K近邻算法利用电子表格实现K近邻算法对苹果和柠檬的预测。拓展实践:利用电子表格探究K近邻算法小说分类男女生判断朋友选择糖尿病诊断拓展实践:利用电子表格探究K近邻算法小说分类男女生判断朋友选择两种数据特征(二维)三种数据特征(三维)多分类K近邻算法不仅能解决二维特征分类,也能解决多维特征分类。也解决多分类问题。拓展实践:利用电子表格探究K近邻算法数据特征多样本多计算复杂课后探索尝试将本节课的实践任务用编程的方式呈现,并且对未知样本进行预测。课堂总结:机器学习算法类型:监督学习训练数据:苹果柠檬长宽特征探究分类算法(K近邻算法)利用K近邻算法构建分类器未知样本预测结果 展开更多...... 收起↑ 资源预览