资源简介 (共18张PPT)2.3食谱的推荐电子工业版九年级下册教学目标一、了解K-measns算法的原理通过本章节的学习,你应该掌握以下内容:二、基于K-measns算法的食谱推荐三、探究不同K值的结果新知导入聚类是按照某种特定的规则(如距离),将数据样本划分为不同的类(簇),使得同类中的数据尽可能相似,不同类中的数据尽可能不同。聚类分析是无监督分析中重要的算法之一。在无标注的数据中,规律是未知的,通过聚类分析发现数据本身的结构或特性,实现物以类聚。聚类分析的应用十分广泛。例如,信息类App可以聚合相同标签的文章,电商平台根据用户消费特性进行聚类分析实现个性化推荐。本节课我们将学习使用K-means 算法将我们日常所吃的食物按照其所含的营养成分进行聚类分析,实现为用户推荐营养均衡食物的功能。新知讲解1、了解K-measns算法的原理K-means算法(亦称K均值算法)是基于距离的一种无监督聚类方法,以距离作为相似性的评价指标,即两个数据点距离越近,其相似性越大,反之距离越远,相似性越小。其基本思想如下:1.)确定需要分类的数目k。2.)从数据集中随机选择k个点作为初始聚类的中心点。3.) 计算每个数据点到k个中心点的距离,选择与共距离最近的中心点作为自己的类别。4.)当所有数据点聚类完毕后,调整中心点,计算每一类中的样本平均值作为新的聚类中心点。5.)重复3~4步,直到没有样本被重新分配到不同的类中,或聚类中心点的值不变,即聚类完成。新知讲解2、基于K-measns算法的食谱推荐我们将计算机学习手写数字的过程分为3个步骤。“食谱推荐”程序根据食物中包含的蛋白质和碳水化合物含量的不同,使用 K- means ; 算法进行聚类分析,并根据聚类结果为用户推荐营养均衡的食物。具体步骤如下:新知讲解1.)打开“食谱推荐”程序,界面如图2.3.1 所示。程序中的“食物”列表中 存储了50 种常见食物,“蛋白质”列表与“碳水化合物”列表分别存储了每100克对应食物中蛋白质和碳水化合物的含量数据(单位为克)。变量k值保存的是食物被分为几类的参数值,变量pass保存的是聚类次数。新知讲解2.)单击“运行”按钮◎,程序会提示用户输入k值,如图2.3.2所示。 这里我们输入4,即k=4,将50种食物根据蛋白质和碳水化合物含量不同分为4类。新知讲解3.)初始化聚类时,程序会随机选择4个数据点作为中心点,此时status (状态) 变量会显示程序运行状态,如图2.3.3 所示。新知讲解4.)完成初始化聚类后,同学们可以根据提示,按空格键进行第二次聚类。还可以按键盘上的H键隐藏运行界面的部分数据,更清晰地观察聚类过程,如图2.3.4所示。(如果想恢复界面数据,可以按键盘上的S键。)新知讲解5.)通过按空格键可以观察每次聚类的过程,也可以单击界面上的“快进”按钮◎,选择自动聚类。当所有食物均没有被聚类到新的类别中时,聚类完成,同时程序会显示“推荐”按钮,如图2.3.5所示。新知讲解6.)单击“推荐”按钮,程序会根据聚类结果从每一类食物中选择一种推荐给用户,如图2.3.6所示。新知讲解三、探究不同K值的结果“食谱推荐”程序中保存的50种食物包含谷类(面、米、杂粮等)、薯类(甘薯、马铃薯等)、肉蛋奶类(鸡肉、鸭肉、鸡蛋、鲫鱼等)、蔬菜类(油菜、菠菜、黄瓜等)、水果类(苹果、香蕉),等等。请同学们取不同的k值,运行程序并根据程序聚类结果,完成表2.3.2中的聚类分析总结,可参考表2.3.2中k=4时的食物聚类结果。新知讲解不同K值聚类分析表课堂练习1、影响K-means算法聚类结果的因素包括_______ 和_______。2、K- means算法完成聚类的条件是_______。3、 在实际应用中,k通常按需取值。例如,游戏公司根据顶级、高级、中级、菜乌4类将所有玩家进行聚类分析,则k取4;房地产公司将商品房分为高、中、低了档进行聚类分析,则k取3。请同学们搜索资料,了解在K-means算法中k值的选择对最终结果有什么影响,应该怎样选k值。课堂总结请同学们回顾本周所学知识进行总结,看看自己是否掌握了以下知识。一、了解K-measns算法的原理二、基于K-measns算法的食谱推荐三、K值为多少时,推荐的食谱最合理作业布置1、分组讨论并总结K-measns算法的逻辑。2、想想手写聚类分析在日常生活中的应用,对照本章节学习的知识,思考K值为多少时候,推荐的食谱最为合理。谢谢21世纪教育网(www.21cnjy.com)中小学教育资源网站兼职招聘:https://www.21cnjy.com/recruitment/home/admin 展开更多...... 收起↑ 资源预览