多选
题
快递公司问题件快递公司问题件货款处理关于圆的周长面积重点题型关于解方程组的题及答案关于南海问题
分析方法初探
本文的分析方法适合于所有类型多选题,但是针对那些选项数比较多的多选题可能更加
使用。
本文最后的分析结果以图形界面的方式显示出来,这是因为本人对图形的偏好,同时我
也认为很少有人对数字有什么感觉。特别地,当题目的选项数超过 10以上时,如果想从这
些题项间看出端倪,恐怕得有一定的修行。
在开始介绍本文的分析方法之前,我简单介绍一下我们常用的多选题的分析方法以及这
种分析方法不足的地方。
以前采用的方法:
如果常常使用 SPSS,我们知道 SPSS中提供了两套程式来解决多选题的问题:
第一种是在Multiple Response菜单下先定义多选题 Set, 定义好 Sets之后,Frequencies
和 Crosstabs 菜单就会变量,我们就可以使用 Frequencies 和 Crosstable 程序就行相关的分
析(不是相关分析,呵呵)。这类分析相关的图解如下:
第二种分析方法是基于 SPSS 的 tables 模块。在 Tables 模块里至少有两个子程序支持
Multiple Responses (MR, 以下没有特别说明,MR代表多选题,并不代表Mental Retardation).
General Table & Multiple Responses Table 模块都支持MR分析,另外在Multiple Responses
Sets里面可以定义 Sets,这个功能和第一种方法里面介绍的一样。图解如下:
这两种方法基本上是等效的,但如果你装有 Tables 模块,
建议
关于小区增设电动车充电建议给教师的建议PDF智慧城市建议书pdf给教师的36条建议下载税则修订调整建议表下载
使用第二种,因为不要
钱的东西自然会要打些折扣。Multiple Responses 是 Basic 模块,不需要另外付钱。第一种
方法定义的集合在重启之后会全部消失,你需要重来一次,嘿嘿,这个工作量不轻松,不信
自己试试看。另外,这个方法提供的交叉表功能有限,不能做很复杂的表格。更为重要的一
点是,SPSS13.0之前的版本第一种方法不能直接产生表格,而是 TXT的 log文件,这个玩
意儿弄到
ppt
关于艾滋病ppt课件精益管理ppt下载地图下载ppt可编辑假如ppt教学课件下载triz基础知识ppt
或者Word里面去,有的事情做了,有点像 SAS。似乎不太适合批量生产表格
的市场研究人员。因此强烈建议使用第二种方法,如果你的 SPSS程序装有 Tables模块。
我们现在使用的方法:
在漫长的等待之后,我开始介绍今天要做的方法,我们前面的铺垫还是很有帮助的。我
们开始介绍一下我们的数据。我们的数据是假设是基于一个媒体调查,这些数据并不具有真
实性,没有实际意义,这些数据只服务于这篇文章的介绍,不用于任何实际的参考,即使这
些数据看起来可能有一些实际意义,由此引起的任何版权纠纷和经济损失作者不承担任何责
任。
Variable(Set) Label Level Values
Sort 人群 3 1 上班族 2 学生 3 司机
Radio 广播节目 10 1 流行音乐 2 娱乐 10 资讯
TV 电视节目 10 1 音乐 2时尚 10 体育
Out 外出交通工具 9 1 单位配车 2 出租车 9 步行
其中,sort是单选题,Radio 和 TV、out是多选题集合。
在 SPSS 中我们有两种定义多选题的方式:Count和 Category,我采用第一种。我们假
设这些数据已经录好在数据库中(你可以采用很多数据录入软件,不要试图在 SPSS里面录
入数据)。
分析准备:
第一步:我们首先要得到各多选题的频数分布或者说交叉分布,这是必须的,因为我们
后续的分析是基于各题项之间的分布的。实质上,在第一部分中我们得到的频数分布表就为
我们提供了这样的数据,问题是我们的分析不能仅仅止于此。因为我们很少会把频数分析结
果作为最终结果,其中的原因是这种数据提供的大量信息被繁杂的选项所覆盖,同时我们也
不能得到多选题和其他题项之间的关系。
第二步:从得到的频数数据(频数分布表或者交叉表)中,我们把多选题的结果作为单
选题来处理。这是可行的,因为我们在做频数分析的时候,也没有另外区分单选题和多选题。
实质上,多选题也可以手工来做的,就是把各个选项的选择情况画“正”字累加,但这个功
能太繁就交给电脑去做的。电脑能做的就只有这么多了,这是因为包括 SPSS在内的大软件
处理的都是单项题,对于多项题则无能为力了。我们的这一步至观重要,如果有人证明了这
种方法的荒谬性,那下面所有的处理都是非法的。
第三步:把表格中的数据(知道了开始的时候提示使用第二种方法的好处了吧,我们只
要阿 export到 excel中去了),我们的数据需要先转到 excel中去,如果直接向 SPSS里面 copy,
保证是自讨苦吃。
第四步:在 Excel中把数据处理成 SPSS能接受的数据格式,即标准的变量格式,最后
记得保存。
第五步:在 SPSS中打开刚才保存的 excel数据,不要说打不开。另存为 SPSS数据。
第六步:数据分析前的最后第二步。利用 Data菜单下面的 Restructure命令,把数据转
化成 Long格式。另存为 SPSS数据。
第七步:Data菜单下面的 weight cases,把你刚才转变后的数据加权,这表示一条数据代
表几条数据。好,分析前的准备工作都做好了。
演示:
定义变量集
这是定义后的结果:
产生交叉表:
这就是产生的交叉表:
开始 copy或者 export,随你的便,这是粘贴后的结果:
整理后的结果:
注意到标记的那个地方是我自己加上去的,其中的那些英文是我自己该过的,为的是让 SPSS
能够认出这些变量。
转到 SPSS中是这个样:
记得另存为,开始转化称 Long Data:
这是点击之后的结果:
这是转化好之后的结果:
记得Weight:
完工了。
注意要把字符型变量转化成数字变量,这不用我教吧。保存好之后,你就会发现这样的数据
你一定认识。下面知道怎么分析了吗,继续往下看吗!
分析:
做个对应分析:
这是对应分析的界面:
这是 Biplot的图形:
能不能从图形上看出点什么呢?
还是可以看出点的吗:
电视台的体育节目和广播的体育是很相似的;
两个新闻节目也是类似的;
咨询、教育、生活咨询、电视购物都是相似的,因为这些垃圾节目压根儿没人看,
或者是些垃圾想看(骂了你别生气);
看见了音乐、电影、娱乐、时尚那一块没有,不用我解释了吧;
看见了财经和旅游了吗,知道那是属于什么人看得节目吗,有钱人哪。
看见了吗,这就是我们的方法所能带给你的好处,你能清楚地分辨出 TV和 Radio两个
变量之间的关系。这应当很难从 Cross Table里看出来的吧。当然如果你得到这张图之后,
去审视你的交叉表,你会会心微笑一下,原来还真有这么回事呢。
当我们得到了“单变量”的数据之后,我们可以做很多事情,例如,Categorical Regression,
Categorical Principal Analysis,这些都属于 Optimal Scaling 范围里的,如果你进行一些 Chi
Square分析当然是没有问题的。
个人认为还可以进行主成分分析,探索多选题自身变量自己的关系,对修改问卷提供一
些意见。
你还可以据此做聚类分析,把一些对象进行合适的分类。
以上所列举的各种统计分析方法是指限于单变量的,但通过我们使用多变量到单变量的
转化,我们能做的事情就很多了,可以充分挖掘多选题提供的信息。
谢谢你的阅览。
声明:
以上方法完全是本人经验,未经任何数学方法的严格证明,我是搞不清楚 Optimal
Scaling 的计算方法的,我这辈子估计也算不通,如果算通了,我绝对开家公司赚钱卖它。
所以,其正确性由你个人决定,作者不对由你得使用造成的任何后果负责,同时我也不承担
任何技术证明。
作者不对上述数据的准确性做任何担保,数据只为本文服务。本文数据不得作为商业参
考,由此引起的任何商业损失和商业纠纷,本文和作者不承担任何责任。
作者保留一切权利,尽管你可以用任何形式的复制和传播。包括以下,但不至于以下行
为是对作者行为的触犯:
未经作者允许,修改原文;
篡改原文后传播;
使用本文进行商业诈骗;
应用本文从事任何政治活动;
写不来了,不要伤害我。
如果你对本文有任何的建议或者意见,请 email至:xiawinter@gmail.com.