首页 案例聚类分析

案例聚类分析

举报
开通vip

案例聚类分析案例聚类分析 我国各地区城镇居民消费性支出的聚类分析 刘肖 A31114042 一、问题的背景 下表列出了1999年全国31个省、直辖市和自治区(港、澳、台不在其中)的城镇居民 家庭平均每人全年消费性支出的八个主要变量数据。这八个变量是 :食品 :交通和通讯 xx15 :衣着 :娱乐教育文化服务 xx26 :家庭设备用品及服务 :居住 xx37 :医疗保健 :杂项商品和服务 xx48 消费性支出数据 单位:元 xxxxxxxx地区 12345678北京 2959.19 730.79 749.41 513...

案例聚类分析
案例 全员育人导师制案例信息技术应用案例心得信息技术教学案例综合实践活动案例我余额宝案例 聚类 分析 定性数据统计分析pdf销售业绩分析模板建筑结构震害分析销售进度分析表京东商城竞争战略分析 我国各地区城镇居民消费性支出的聚类分析 刘肖 A31114042 一、问题的背景 下 关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf 列出了1999年全国31个省、直辖市和自治区(港、澳、台不在其中)的城镇居民 家庭平均每人全年消费性支出的八个主要变量数据。这八个变量是 :食品 :交通和通讯 xx15 :衣着 :娱乐教育文化服务 xx26 :家庭设备用品及服务 :居住 xx37 :医疗保健 :杂项商品和服务 xx48 消费性支出数据 单位:元 xxxxxxxx地区 12345678北京 2959.19 730.79 749.41 513.34 467.87 1141.82 478.42 457.64 天津 2459.77 495.47 697.33 302.87 284.19 735.97 570.84 305.08 河北 1495.63 515.90 362.37 285.32 272.95 540.58 364.91 188.63 山西 1406.33 477.77 290.15 208.57 201.50 414.72 281.84 212.10 内蒙古 1303.97 524.29 254.83 192.17 249.81 463.09 287.87 192.96 辽宁 1730.84 553.90 246.91 279.81 239.18 445.20 330.24 163.86 吉林 1561.86 492.42 200.49 218.36 220.69 459.62 360.48 147.76 黑龙江 1410.11 510.71 211.88 277.11 224.65 376.82 317.61 152.85 上海 3712.31 550.74 893.37 346.93 527.00 1034.98 720.33 462.03 江苏 2207.58 449.37 572.40 211.92 302.09 585.23 429.77 252.54 浙江 2629.16 557.32 689.73 435.69 514.66 795.87 575.76 323.36 安徽 1844.78 430.29 271.28 126.33 250.56 513.18 314.00 151.39 福建 2709.46 428.11 334.12 160.77 405.14 461.67 535.13 232.29 江西 1563.78 303.65 233.81 107.90 209.70 393.99 509.39 160.12 山东 1675.75 613.32 550.71 219.79 272.59 599.43 371.62 211.84 河南 1427.65 431.79 288.55 208.14 217.00 337.76 421.31 165.32 湖北 1783.43 511.88 282.84 201.01 237.60 617.74 523.52 182.52 湖南 1942.23 512.27 401.39 206.06 321.29 697.22 492.60 226.45 广东 3055.17 353.23 564.56 356.27 811.88 873.06 1082.82 420.81 广西 2033.87 300.82 338.65 157.78 329.06 621.74 587.02 218.27 1 海南 2057.86 186.44 202.72 171.79 329.65 477.17 312.93 279.19 重庆 2303.29 589.99 516.21 236.55 403.92 730.05 438.41 225.80 四川 1974.28 507.76 344.79 203.21 240.24 575.10 430.36 223.46 贵州 1673.82 437.75 461.61 153.32 254.66 445.59 346.11 191.48 云南 2194.25 537.01 369.07 249.54 290.84 561.91 407.70 330.95 西藏 2646.61 839.70 204.44 209.11 379.30 371.04 269.59 389.33 陕西 1472.95 390.89 447.95 259.51 230.61 490.90 469.10 191.34 甘肃 1525.57 472.98 328.90 219.86 206.65 449.69 249.66 228.19 青海 1654.69 437.77 258.78 303.00 244.93 479.53 288.56 236.51 宁夏 1375.46 480.89 273.84 317.32 251.08 424.75 228.73 195.93 新疆 1608.82 536.05 432.46 235.82 250.28 541.30 344.85 214.40 资料来源:2000年《中国统计年鉴》 我们希望根据上述八个指标对各地区进行聚类。 通过SPSS软件进行聚类分析得: 描述统计量 N 极小值 极大值 均值 标准 excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载 差 X1 31 1303.9700 3712.3100 1980.660323 586.8861630 X2 31 186.4400 839.7000 489.073226 120.4565793 X3 31 200.4900 893.3700 395.985484 179.9287151 X4 31 107.9000 513.3400 244.360323 86.3531009 X5 31 201.5000 811.8800 311.018387 128.1287843 X6 31 337.7600 1141.8200 569.571613 189.5094636 X7 31 228.7300 1082.8200 430.370323 168.1435201 X8 31 147.7600 462.0300 243.045161 88.0562187 有效的 N :列表状态: 31 对变量进行描述性统计的上图。 a,b案例处理汇总 案例 有效 缺失 总计 N 百分比 N 百分比 N 百分比 31 100.0 0 .0 31 100.0 a. 平方 Euclidean 距离 已使用 b. 单个联结 2 观测量的概述表。 聚类表 阶 群集组合 系数 首次出现阶群集 下一阶 群集 1 群集 2 群集 1 群集 2 1 4 28 .212 0 0 2 2 4 5 .510 1 0 8 3 6 8 .630 0 0 7 4 3 31 .677 0 0 10 5 17 23 .800 0 0 11 6 29 30 .814 0 0 9 7 6 7 .817 3 0 8 8 4 6 .948 2 7 9 9 4 29 1.025 8 6 12 10 3 15 1.041 4 0 12 11 17 18 1.058 5 0 13 12 3 4 1.120 10 9 13 13 3 17 1.130 12 11 14 14 3 16 1.144 13 0 16 15 12 24 1.677 0 0 17 16 3 22 1.877 14 0 17 17 3 12 1.931 16 15 18 18 3 27 1.957 17 0 19 19 3 10 1.984 18 0 20 20 3 25 2.175 19 0 21 21 3 14 2.995 20 0 23 22 13 20 3.630 0 0 24 23 2 3 3.635 0 21 24 24 2 13 4.026 23 22 25 25 2 21 5.218 24 0 26 26 2 11 6.094 25 0 27 27 1 2 9.435 0 26 28 28 1 9 10.567 27 0 29 29 1 26 10.570 28 0 30 30 1 19 17.834 29 0 0 3 聚类进度表,上图显示了变量的聚类过程。在步骤一,将观测量4与观测量28进行聚类距离测量系数为0.212,这一类的下次聚类合并是在步骤二。在首次出现阶群集中,0表示非类聚类,1表示同类聚类。 4 上图为树状图。从以上图中可得分为两类或三类最为合适。 以下用matlab软件进行聚类分析 1:数据的读取与标准化 5 首先将数据保存至excel文件中 [data,textdata]=xlsread(‘book1.xls’); data=zscore(data) 2:一步聚类 直接利用clusterdata函数进行一步聚类,其命令与结果如下 obslabel=textdata(2:end,1); Taverage=clusterdata(data,'linkage','average','maxclust',3); obslabel(Taverage==1) obslabel(Taverage==2) obslabel(Taverage==3) 从上面可知,我们可以利用函数直接对样本进行聚类 3:分步聚类 利用pdist函数计算距离,利用linkage函数创建系统聚类树,最后做出聚类树形图,命令与结果如下 y=pdist(data); Z=linkage(y,'average') obslabel=textdata(2:end,1); H=dendrogram(Z,0,'orientation','right','labels',obslabel); 6 set(H,'Linewidth',2,'color','k'); 广东浙江 天津上海 北京广西 江西福建山东 湖南湖北 江苏安徽 河南河北吉林 黑龙江辽宁 内蒙古山西 0.511.522.533.544.555.5 4:确定分类个数 在系统聚类中,下面计算不一致系数,通过不一致系数来确定最终分类个数 inconsistent0=inconsistent(Z,40) 7 根据不一致系数可得,不一致系数较上一次增加量越大,则上一次聚类效果越好,则由上图可得,在最后三次聚类过程中,不一致系数的变化,增量依次为0.7612,0.5439,1.249的,说明倒数第二次聚类较好,我们则认为分为两类最合适 8
本文档为【案例聚类分析】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_882336
暂无简介~
格式:doc
大小:97KB
软件:Word
页数:8
分类:
上传时间:2017-10-13
浏览量:46