首页 聚类分析(C均值-K均值)

聚类分析(C均值-K均值)

举报
开通vip

聚类分析(C均值-K均值)聚类分析1.简介 聚类分析是基于对象集客观存在着若干个自然类、每个自然类中个体的某些属性都具有较强的相似性而建立的一种数据描述方法。从原理上讲,它是将给定的一些模式分成若干组,对于所选定的属性和特征,每组的各模式是相似的,而与其他组的模式差别很大。2应用 聚类算法虽然总的讲比较简单,但是应用却是十分广泛,应用领域如下: (1)用于数据压缩。 (2)用于数据挖掘,知识发现。 (3)用作后续较复杂分析算法的预处理 3聚类的算法(1)根据相似性阈值和最小距离原则的简单聚类方法(2)按最小距离原则不断进行两类合并的...

聚类分析(C均值-K均值)
聚类分析1.简介 聚类分析是基于对象集客观存在着若干个自然类、每个自然类中个体的某些属性都具有较强的相似性而建立的一种数据描述方法。从原理上讲,它是将给定的一些模式分成若干组,对于所选定的属性和特征,每组的各模式是相似的,而与其他组的模式差别很大。2应用 聚类算法虽然总的讲比较简单,但是应用却是十分广泛,应用领域如下: (1)用于数据压缩。 (2)用于数据挖掘,知识发现。 (3)用作后续较复杂分析算法的预处理 3聚类的算法(1)根据相似性阈值和最小距离原则的简单聚类方法(2)按最小距离原则不断进行两类合并的原则(谱系聚类法)(3)依据准则函数动态聚类法(C-均值法、ISODATA法)算法比较 在(1)和(2)的算法中它们一个共同特点是:某个模式一旦分划到某一类中之后,在后续的算法中就不会改变。在(2)中,类心一旦选定,在后续算法中也不会改变。基于这些特点使得算法(1)(2)效果不会太理想。动态聚类法动态聚类法技术要点1.确定模式和聚类的距离测度。2.确定评估聚类质量的准则函数。3.确定模式分划及聚类合并或分裂的规则。基本步骤1.建立初始聚类中心,进行初始聚类;2.计算模式和类的距离,调整模式的类别;3.计算各聚类的参数,删除、合并或分裂一些聚类;4.从初始聚类开始,运用迭代算法动态地改变模式的类别和聚类的中心使准则函数取得极值或设定的参数达到设计要求时停止。C-均值法1.算法简介C-均值是一种得到最广泛使用的聚类算法。它是将各个聚类子集内的所有数据样本的均值作为该聚类的代表点,算法的主要思想是通过迭代过程把数据集划分为不同的类别,使得评价聚类性能的准则函数达到最优,从而使生成的每个聚类内紧凑,类间独立。这一算法不适合处理离散型属性,但是对于连续型具有较好的聚类效果。案例随着电子商务的普及以及数据挖掘技术的成熟,推荐系统应运而生。它能够根据用户的喜好,推荐符合用户兴趣的商品,能够在不断提高用户满意度的前提下帮助商家完成销售。本文案例是一种基于C均值聚类的推荐技术的研究。 基于MATLAB的强大数学处理分析能力,采用MATLAB来完成C均值算法程序的实现。 C均值算法的工作过程说明如下:首先从n个数据对象选择k个对象作为初始聚类中心;而对于所剩下其它对象,则根据它们与这些聚类中心的相似度,分别将它们分配给与其最相似的聚类;然后再计算每个所获新聚类的聚类中心,即聚类中所有对象的均值;不断重复这一过程直到 标准 excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载 测度函数开始收敛为止。算法描述1.初始化中心向量c1,c2,…2.分组:将样本分配给距离其最近的中心向量,由这些样本构造不相交(non-overlapping)的聚类3.确定中心:用各个聚类的中心向量作为新的中心4.重复分组和确定中心的步骤,直至算法收敛算法步骤1.为每个聚类确定一个初始聚类中心,这样就有C个初始聚类中心。2.将样本集中的样本按照最小距离原则分配到最邻近聚类3.使用每个聚类中的样本均值作为新的聚类中心。4.重复步骤2.3直到聚类中心不再变化。5.结束,得到C个聚类为了聚类方便,上表1中图书号分别用1、2、3、4、5、6、7、8、9表示。取12组样本进行分析,每组样本有3个属性。取C=4,随机取初始中心,经过MATLAB分类处理后得到分类如右图(其中第4列代表类别号)C-均值法的缺点与改进算法的结果受到聚类中心的个数以及初始聚类中心的选择的影响,也受到样品的几何性质及排列次序影响,结果只是局部最优。 改进: (1)类数C的调整 (2)初始聚类中心的选取 (3)用类核代替类心 取C=4,随机取初始中心,经过MATLAB分类处理后得到分类如右图(其中第4列代表类别号)
本文档为【聚类分析(C均值-K均值)】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: ¥11.9 已有0 人下载
最新资料
资料动态
专题动态
个人认证用户
真诚文档交流
本人从事临床麻醉五年有余,工作兢兢业业,拥有丰富的临床麻醉经验及临床医学资料,并取得了助理医师资格。
格式:ppt
大小:281KB
软件:PowerPoint
页数:0
分类:高中其他
上传时间:2020-02-18
浏览量:16