首页 聚类分析步骤

聚类分析步骤

举报
开通vip

聚类分析步骤临沂大学建筑学院房地产系聚类分析步骤以教材第五章习题8的数据为例,演示并说明聚类分析的详细步骤:一.原始数据的输入:1临沂大学建筑学院房地产系二.选项操作:打开SPSS的“分析”→“分类”→“系统聚类”,打开“系统聚类”对话框。把“食品”、“衣着”等6变量输入待分析变量框;把“地区”输入“标注个案”;“分群”选中“个案”;“输出”选中“统计量”和“图”。(如下图)相关说明:1)系统聚类法是最常用的方法,其他的方法较少使用。2)“标注个案”里输入“地区”,在输出结果的距离方阵和聚类树状图里会显示出“北京”、“天津”等...

聚类分析步骤
临沂大学建筑学院房地产系聚类 分析 定性数据统计分析pdf销售业绩分析模板建筑结构震害分析销售进度分析表京东商城竞争战略分析 步骤以教材第五章习 快递公司问题件快递公司问题件货款处理关于圆的周长面积重点题型关于解方程组的题及答案关于南海问题 8的数据为例,演示并说明聚类分析的详细步骤:一.原始数据的输入:1临沂大学建筑学院房地产系二.选项操作:打开SPSS的“分析”→“分类”→“系统聚类”,打开“系统聚类”对话框。把“食品”、“衣着”等6变量输入待分析变量框;把“地区”输入“标注个案”;“分群”选中“个案”;“输出”选中“统计量”和“图”。(如下图)相关说明:1)系统聚类法是最常用的方法,其他的方法较少使用。2)“标注个案”里输入“地区”,在输出结果的距离方阵和聚类树状图里会显示出“北京”、“天津”等,否则SPSS自动用“1”、“2”等代替。3)“分群”选中“个案”,也就是对北京等16个样本进行分类,而不是对食品等6个变量分类。4)必须选中“输出”中的“统计量”和“图”。在该例中会输出16个地区的欧氏距离方阵和聚类树状图。2临沂大学建筑学院房地产系设置分析的统计量打开最右上角的“统计量”对话框,选中“合并进程 关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf ”和“相似性矩阵”,“聚类成员”选中“无”。然后点击“继续”。打开第二个“绘制”对话框,必须选中“树状图”,其他的默认即可。3临沂大学建筑学院房地产系打开第三个对话框“方法”:聚类方法选中“最邻近元素”;“度量 标准 excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载 ”选中“区间”的“欧氏距离”;“转换值”选中“标准化”的“Z得分”,并且是“按照变量”。打开第四个对话框“保存”,“聚类成员”选默认的“无”即可。三.分析结果的解读:按照SPSS输出结果的先后顺序逐个介绍:欧氏距离矩阵:是16个地区两两之间欧氏距离大小的方阵,该方阵是应用各种聚类方法进行聚类的基础。4临沂大学建筑学院房地产系ProximityMatrixEuclideanDistanceCase1:北京2:天津3:河北4:山西5:内蒙古6:辽宁7:吉林8:黑龙江9:上海10:江苏11:浙江12:安徽13:福建14:江西15:山东16:河南1:北京.0003.8396.2896.2235.8314.7344.6914.7933.1314.3003.4045.2515.3395.9814.6815.8212:天津3.839.0002.9113.1082.3902.1902.8922.5814.1531.8811.4733.4003.6313.7011.2802.8883:河北6.2892.911.0001.1341.3243.4933.7892.5156.5442.3283.4202.9923.3042.9791.961.9604:山西6.2233.1081.134.0001.3184.0514.0402.6066.8032.6203.6383.2763.6653.4202.482.9895:内蒙古5.8312.3901.3241.318.0003.0503.3262.5586.0922.5132.8913.1783.4323.0911.8401.6526:辽宁4.7342.1903.4934.0513.050.0001.8002.7644.7002.6771.9843.0602.9552.9021.8813.6627:吉林4.6912.8923.7894.0403.3261.800.0002.0525.2472.6192.2152.1462.0882.1102.5653.6068:黑龙江4.7932.5812.5152.6062.5582.7642.052.0005.7971.2902.4701.4061.8432.0411.8871.9729:上海3.1314.1536.5446.8036.0924.7005.2475.797.0004.9363.5195.8345.8266.1914.9866.40210:江苏4.3001.8812.3282.6202.5132.6772.6191.2904.936.0001.9171.9222.3212.5671.3301.88011:浙江3.4041.4733.4203.6382.8911.9842.2152.4703.5191.917.0002.7432.8263.0711.8573.22112:安徽5.2513.4002.9923.2763.1783.0602.1461.4065.8341.9222.743.000.6501.0862.6132.50813:福建5.3393.6313.3043.6653.4322.9552.0881.8435.8262.3212.826.650.0001.0252.8242.91314:江西5.9813.7012.9793.4203.0912.9022.1102.0416.1912.5673.0711.0861.025.0002.8052.79815:山东4.6811.2801.9612.4821.8401.8812.5651.8874.9861.3301.8572.6132.8242.805.0002.04116:河南5.8212.888.960.9891.6523.6623.6061.9726.4021.8803.2212.5082.9132.7982.041.000Thisisadissimilaritymatrix5临沂大学建筑学院房地产系2.合并进程表:主要看前四列,现在以前三个步骤为例说明合并过程:第一步,样本12和样本13合并,此时系数为0.650;第二步,样本3和样本16合并,此时系数为0.960;第三步,样本3(实际上是第二步样本3和16组成的新类)和样本4合并,此时系数为0.989;以此类推。AgglomerationScheduleClusterCombinedStageClusterFirstAppearsStageCluster1Cluster2CoefficientsCluster1Cluster2NextStage11213.6500042316.960003334.989207412141.02510952151.28000868101.2900087351.31830128281.33056992121.4068410102111.473901211671.800001312231.8401071313261.88112111514193.131001515123.404141306临沂大学建筑学院房地产系冰柱:左侧是分组数目,上侧是被分组的样本,样本之间由等距的间隔分开,间隔被填充的,说明相邻两样本合并为一组,没有被填充就不被合并。按照此 规则 编码规则下载淘宝规则下载天猫规则下载麻将竞赛规则pdf麻将竞赛规则pdf ,首先从下往上看,当分为15类时,只有样本13和12合并了,其余的各自是一类;当分为10类时,从左到右依次是(7),(6),(5),(4,16,3),(11),(14,13,12),(10,8),(15,2),(9),(1);其他的分组数目时以此类推。(该冰柱的分组数目有2.5、7.5、12.5等含有半组的情况,不需要掌握。)7临沂大学建筑学院房地产系树状图:这是分类结果最后的树状图,把整个分类情况一目了然地呈现出来了。最上面的是标尺,数字0-25是大致按照距离比例重新标定的数值,不影响对分类结果的观察与结论。解读此图的方法是:每个样本的右侧都是虚线,虚线的端点处是“+”,说明该样本在此和另一个样本或者组(它也有上下相对齐的“+”)合并为一类。如:安徽和福建在对应标尺1附近时合并为一类,之后与江西在标尺数值4附近合并为一类。天津、山东、黑龙江、江苏四个样本的“+”看起来好像是统一对齐的,其实不是,实际情况是:天津和山东在1.280(欧氏距离)处对齐,黑龙江和江苏在1.290(欧氏距离)处对齐。8临沂大学建筑学院房地产系总说明:聚类分析从数学上讲不是很严谨,所以采用不同的统计量和采取不同的聚类方法,聚类结果可能有较大的差异。但是只要整个分析过程没有错误就是完整正确的,聚类结果都是认可的。(本例中,原始数据首先进行标准差标准化,再求欧氏距离方阵,聚类方法采取的是最短距离法。)聚类分析的最终结果自然是分类,除了SPSS输出的树状图,最好自己再做出Word格式的分类表,具体分为几类,自己看情况而定。譬如该例子就可以分为4类或5类。聚类分析只是分类,并不能进行评判(如发展水平高低等),如要评判各样本应结合主成分分析、因子分析等方法共同进行。其分类结果也不一定按照聚类分析的结果为准,可以结合主成分分析、因子分析的结果进行修正。最短距离法具体计算方法及步骤在系统聚类法中,最短距离法应用比较广泛。计算过程一般是首先对原始数据进行标准化处理,再计算初始欧氏距离矩阵,然后应用最短距离法聚类。假设有6个样本的初始欧氏距离矩阵如下:G1G2G3G4G5G600.37500.4830.7760D(0)=1.5961.92601.7491.5161.3361.6620.50101.9721.7432.1540.6930.5890(系统聚类法在聚类之前把每个样本看成一组,用G1,G2,⋯.代替。在该矩阵中,第i行和第i列都代表第i组,在左侧括号的外面应该自上到下依次是G1,G2,⋯,G6,因为word中不好输入,所以省略了。)9临沂大学建筑学院房地产系在初始距离系数矩阵的基础上,用最短距离法分类的具体步骤是:在初始距离系数矩阵D(0)中,选出距离数值最小者,即d12=0.375,把第一类G1和第二类G2合并为一个新类G7,记为G7={G1,G2}。再利用最短距离法计算新类G7与其他各类G3,G4,G5,G6的距离,得d73=min{d13,d23}=min{0.483,0.776}=0.483d74=min{d14,d24}=min{1.749,1.596}=1.596d75=min{d15,d25}=min{1.516,1.336}=1.336d76=min{d16,d26}=min{1.972,1.743}=1.743形成距离系数矩阵D(1)G7G3G4G5G600.4830D(1)1.5961.92601.3361.6620.50101.7432.1540.6930.58902.在矩阵D(1)中,选出距离数值最小者,即d73,这时G7和G3合并=0.483为一个新类G8,记为G8={G7,G3}。再利用最短距离法计算新类G8与其他各类G4,G5,G6的距离,得D84=min{d34,d74}=min{1.926,1.596}=1.596D85=min{d35,d75}=min{1.662,1.336}=1.336D86=min{d36,d76}=min{2.154,1.743}=1.743形成距离系数矩阵D(2)。DG8G4G5G60(2)1.59601.3360.50101.7430.6930.58903.在矩阵D(2)中,选出距离数值最小者,即d45,这时G4和G5合并=0.501为一个新类G9,记为G9={G4,G5}。再利用最短距离法计算新类G9与其他各类G8,G6的距离,得D98=min{d4858,d}=min{1.596,1.336}=1.336D96=min{d4656,d}=min{0.693,0.589}=0.589形成距离系数矩阵D(3)。G8G9G60D(3)1.33601.7430.589010临沂大学建筑学院房地产系4.在矩阵D(3)中,选出距离数值最小者,即d69,这时G6和G9合并=0.589为一个新类G10,记为G10={G6,G9}。再利用最短距离法计算新类G10与G8的距离,得D10,,8=min{d68,d98}=min{1.743,1.336}=1.336形成距离系数矩阵D(4)。DG8G10(4)01.3360由矩阵D(4)可以看出,G8和G10在距离系数为1.336时合并成一类G11类。记为G11={G8,G10},至此聚类完毕。最后绘出分类谱系图(草图):(左侧竖线是距离标尺,每格数值0.2,因不好标注,所以未标出。谱系图中的短横线自下而上依次表示G7,G8,G9,G10,G11聚类时的数值,也应该标出。)11
本文档为【聚类分析步骤】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: ¥19.0 已有0 人下载
最新资料
资料动态
专题动态
个人认证用户
ibookss
暂无简介~
格式:doc
大小:741KB
软件:Word
页数:14
分类:生活休闲
上传时间:2022-03-03
浏览量:1