首页 主成分、因子分析步骤

主成分、因子分析步骤

举报
开通vip

主成分、因子分析步骤主成分、因子分析步骤 主成分分析、因子分析步骤 不同点 主成分分析 因子分析 概念 具有相关关系的p个变量,经过将原数据中多个可能相关的变量综合成少数几 线性组合后成为k个不相关的新个不相关的可反映原始变量的绝大多数信息的 变量 综合变量 主要 减少变量个数,以较少的主成分找寻变量间的内部相关性及潜在的共同因素,目标 来解释原有变量间的大部分变适合做数据结构检测 异,适合于数据简化 强调 强调的是解释数据变异的能力,强调的是变量之间的相关性,以协方差为导向,重点 以方差为导向,使方差达到最大 关心每个变量...

主成分、因子分析步骤
主成分、因子分析步骤 主成分分析、因子分析步骤 不同点 主成分分析 因子分析 概念 具有相关关系的p个变量,经过将原数据中多个可能相关的变量综合成少数几 线性组合后成为k个不相关的新个不相关的可反映原始变量的绝大多数信息的 变量 综合变量 主要 减少变量个数,以较少的主成分找寻变量间的内部相关性及潜在的共同因素,目标 来解释原有变量间的大部分变适合做数据结构检测 异,适合于数据简化 强调 强调的是解释数据变异的能力,强调的是变量之间的相关性,以协方差为导向,重点 以方差为导向,使方差达到最大 关心每个变量与其他变量共同享有部分的大小 最终结形成一个或数个总指标变量 反映变量间潜在或观察不到的因素 果应用 变异解它将所有的变量的变异都考虑只考虑每一题与其他题目共同享有的变异,因释程度 在内,因而没有误差项 而有误差项,叫独特因素 是否需主成分分析作综合指标用, 因子分析需要经过旋转才能对因子作命名与解要旋转 不需要旋转 释 是否有只是对数据作变换,故不需要假因子分析对资料要求需符合许多假设,如果假假设 设 设条件不符,则因子分析的结果将受到质疑 因子分析 1 【分析】?【降维】?【因子分析】 (1)描述性统计量(Descriptives)对话框设置 KMO和Bartlett的球形度检验(检验多变量正态性和原始变量是否适合作因子分析)。 (2)因子抽取(Extraction)对话框设置 方法:默认主成分法。主成分分析一定要选主成分法 分析:主成分分析:相关性矩阵。 输出:为旋转的因子图 抽取:默认选1. 最大收敛性迭代次数:默认25. (3)因子旋转(Rotation)对话框设置 因子旋转的方法,常选择“最大方差法”。“输出”框中的“旋转解”。 (4)因子得分(Scores)对话框设置 “保存为变量”,则可将新建立的因子得分储存至数据文件中,并产生新的变量名称。 (5)选项(Options)对话框设置 2 结果分析 (1)KMO及Bartlett’s检验 KMO 和 Bartlett 的检验 取样足够度的 Kaiser-Meyer-Olkin 度量。 .515 Bartlett 的球形度检验 近似卡方 3.784 df 6 Sig. .706 当KMO值愈大时, 关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf 示变量间的共同因子愈多,愈适合作因子分析。根据Kaiser的观 点,当KMO,0.9(很棒)、KMO,0.8(很好)、KMO,0.7(中等)、KMO,0.6(普通)、 KMO,0.5(粗劣)、KMO,0.5(不能接受)。 (2)公因子方差 公因子方差 起始 撷取 卫生 1.000 .855 饭量 1.000 .846 等待时间 1.000 .819 味道 1.000 .919 亲切 1.000 .608 撷取方法:主体元件分析。 Communalities(称共同度)表示公因子对各个变量能说明的程度,每个变量的初始公因子 方差都为1,共同度越大,公因子对该变量说明的程度越大,也就是该变量对公因子的依赖 程度越大。共同度低说明在因子中的重要度低。一般的基准是<0.4就可以认为是比较低, 这时变量在分析中去掉比较好。 (3)解释的总方差 说明的变异数总计 各因子的特征值 因子贡献率 因子累积贡献率 元件 总计 变异的 % 累加 % 总计 变异的 % 累加 % 总计 变异的 % 累加 % 1 2.451 49.024 49.024 2.451 49.024 49.024 2.042 40.843 40.843 2 1.595 31.899 80.923 1.595 31.899 80.923 2.004 40.079 80.923 3 .662 13.246 94.168 4 .191 3.823 97.992 5 .100 2.008 100.000 撷取方法:主体元件分析。 第二列:各因子的统计值 第三列:各因子特征值与全体特征值总和之比的百分比。也称因子贡献率。 第四列:累积百分比也称因子累积贡献率 第二列统计的值是各因子的特征值,即各因子能解释的方差,一般的,特征值在1以上就 是重要的因子;第三列%是各因子的特征值与所有因子的特征值总和的比,也称因子贡献 率;第四列是因子累计贡献率。 如因子1的特征值为2.451,因子2的特征值为1.595,因子3,4,5的特征值在1以下。因子 1的贡献率为49.0%,因子2的贡献率为31.899%,这两个因子贡献率累积达80.9%,即这 两个因子可解释原有变量80.9%的信息,因而因子取二维比较显著。 至此已经将5个问项降维到两个因子,在数据文件中可以看到增加了2个变量,fac1_1、fac2_1,即为因子得分。 (4)成分矩阵与旋转成分矩阵 成分矩阵是未旋转前的因子矩阵,从该表中并无法清楚地看出每个变量到底应归属于哪个因子。旋转后的因子矩阵,从该表中可清楚地看出每个变量到底应归属于哪个因子。此表显示旋转后原始的所有变量与新生的2个公因子之间的相关程度。 一般的,因子负荷量的绝对值0.4以上,认为是显著的变量,超过0.5时可以说是非常重要的变量。如味道与饭量关于因子1的负荷量高,所以聚成因子1,称为饮食因子;等待时间、卫生、亲切关于因子2的负荷量高,所以聚成因子2,又可以称为服务因子。 (5)因子得分系数矩阵 元件评分系数矩阵 元件 1 2 卫生 -.010 .447 饭量 .425 -.036 等待时间 -.038 .424 味道 .480 .059 亲切 -.316 -.371 撷取方法:主体元件分析。 转轴方法:具有 Kaiser 正规化的最 大变异法。 元件评分。 因子得分系数矩阵给出了因子与各变量的线性组合系数。 因子1的分数=-0.010*X1+0.425*X2-0.038*X3+0.408*X4-0.316*X5 因子2的分数=0.447*X1-0.036*X2+0.424*X3+0.059*X4-0.371*X5 (6)因子转换矩阵 元件转换矩阵 元件 1 2 1 .723 -.691 2 .691 .723 撷取方法:主体元件分析。 转轴方法:具有 Kaiser 正规化 的最大变异法。 因子转换矩阵是主成分形式的系数。 (7)因子得分协方差矩阵 元件评分共变异数矩阵 元件 1 2 1 1.000 .000 2 .000 1.000 撷取方法:主体元件分析。 转轴方法:具有 Kaiser 正规化 的最大变异法。 元件评分。 看各因子间的相关系数,若很小,则因子间基本是两两独立的,说明这样的分类是较合理的。 主成分分析 1 【分析】——【降维】——【因子分析】 (1)设计分析的统计量 【相关性矩阵】中的“系数”:会显示相关系数矩阵; 【KMO和Bartlett的球形度检验】:检验原始变量是否适合作主成分分析。 【方法】里选取“主成分”。 【旋转】:选取第一个选项“无”。 【得分】:“保存为变量” 【方法】:“回归”;再选中“显示因子得分系数矩阵”。 2 结果分析 (1)相关系数矩阵 相关性矩阵 食品 衣着 燃料 住房 交通和通讯 娱乐教育文化 相关 食品 1.000 .692 .319 .760 .738 .556 衣着 .692 1.000 -.081 .663 .902 .389 燃料 .319 -.081 1.000 -.089 -.061 .267 住房 .760 .663 -.089 1.000 .831 .387 交通和通讯 .738 .902 -.061 .831 1.000 .326 娱乐教育文化 .556 .389 .267 .387 .326 1.000 两两之间的相关系数大小的方阵。通过相关系数可以看到各个变量之间的相关,进而了解各个变量之间的关系。由表中可知许多变量之间直接的相关性比较强,证明他们存在信息上的重叠。 (2)KMO及Bartlett’s检验 KMO 与 Bartlett 检定 Kaiser-Meyer-Olkin 测量取样适当性。 .602 Bartlett 的球形检定 大约 卡方 62.216 df 15 显著性 .000 根据Kaiser的观点,当KMO,0.9(很棒)、KMO,0.8(很好)、KMO,0.7(中等)、KMO,0.6(普通)、KMO,0.5(粗劣)、KMO,0.5(不能接受)。 (3)公因子方差 Communalities 起始 擷取 食品 1.000 .878 衣着 1.000 .825 燃料 1.000 .841 住房 1.000 .810 交通和通讯 1.000 .919 娱乐教育文化 1.000 .584 擷取方法:主體元件分析。 Communalities(称共同度)表示公因子对各个变量能说明的程度,每个变量的初始公因子方差都为1,共同度越大,公因子对该变量说明的程度越大,也就是该变量对公因子的依赖程度越大。共同度低说明在因子中的重要度低。一般的基准是<0.4就可以认为是比较低,这时变量在分析中去掉比较好。 (4)解释的总方差: 说明的变异数总计 起始特征值 撷取平方和载入 元件 总计 变异的 % 累加 % 总计 变异的 % 累加 % 1 3.568 59.474 59.474 3.568 59.474 59.474 2 1.288 21.466 80.939 1.288 21.466 80.939 3 .600 10.001 90.941 4 .358 5.975 96.916 5 .142 2.372 99.288 6 .043 .712 100.000 撷取方法:主体元件分析。 因子1的贡献率为49.0%,因子2的贡献率为31.899%,这两个因子贡献率累积达80.9%,即这两个因子可解释原有变量80.9%的信息,因而因子取二维比较显著。 (5)成分矩阵(因子载荷矩阵) a元件矩阵 元件 1 2 食品 .902 .255 衣着 .880 -.224 燃料 .093 .912 住房 .878 -.195 交通和通讯 .925 -.252 娱乐教育文化 .588 .488 撷取方法:主体元件分析。 a. 撷取 2 个元件。 该矩阵并不是主成分1和主成分2的系数。 主成分系数的求法:各自主成分载荷向量除以主成分方差的算数平方根。则第1主成分的各 3.568个系数是向量(0.925,0.902,0.880,0.878,0.588,0.093)除以后才得到的,即(0.490,0.478,0.466,0.465,0.311,0.049)才是主成分1的特征向量。 第1主成分的函数表达式: Y1=0.490*Z交+0.478*Z食+0.466*Z衣+0.465*Z住+0.311*Z娱+0.049*Z燃 (6)因子得分 因子得分显示在SPSS的数据窗口里。通过因子得分计算主成分得分。 (7)主成分得分 主成分的得分是相应的因子得分乘以相应方差的算数平方根。 即:主成分1得分=因子1得分乘以3.568的算数平方根 主成分2得分=因子2得分乘以1.288的算数平方根 【转换】—【计算变量】 (8)综合得分及排序 综合得分是按照下列公式计算: 综合得分Y为: 【数据】——【排序个案】
本文档为【主成分、因子分析步骤】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_418164
暂无简介~
格式:doc
大小:424KB
软件:Word
页数:17
分类:
上传时间:2017-09-29
浏览量:188