SPSS分析作业
刘塑 2005210548
SPSS 1.
第一步,通过选取A1量
表
关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf
中的引领潮流、追随潮流、中国制造、欧美品牌、保修条款、优
惠券、昂贵商品、四处打听、便宜货、羡慕眼光等变量,即消费者的购物频度、多少和购物
风格,分析出消费者可以分为几个类别和这些类别的特点,相当于市场营销市场细分的第一
步:Segmentation。好!
第二步,选取人口学变量,如年龄、职业、家庭收入、个人可支配收入、文化程度等,来了
解各个类别消费者的主要特征,从而通过对消费者个人特征的了解,来判断他们属于那一个
类别。好! 这个判别模型将有利于Targeting.
2.
在整个问卷中,没有连续型变量的存在(有两个即消费次数和餐饮次数)。进行市场细分时,因为我事先不知道消费者可以分为几类,而我依据的变量是分类变量(消费次数、餐饮次数、
追随潮流、中国制造、欧美品牌、保修条款、优惠券、昂贵商品、四处打听、便宜货、羡慕
眼光),而且是对
样本
保单样本pdf木马病毒样本下载上虞风机样本下载直线导轨样本下载电脑病毒样本下载
聚类,样本数据也比较大,因此我选取了两步骤聚类(Two-Step Cluster)的方法。好. 不过注意两步法既可以用于分类也可以用于连续变量! 在市场细分的基础上,我将消费者的分类情况作为一个新的变量TSC_7449,因为这个变量是一个三水平的分类变量,所以用了多峰逻辑回归的模型,来看人口学特征对消费者分类情
况的预测准确度。好!
3.
事前,可靠度分析的结果表明,A1量表中,“产地品牌”和“投诉”两个变量会影响分
析结果,删除更好,所以,只对剩下的10个变量进行分析。好, 交待很清楚
根据变量的特点,我进行了两种描述性分析:Frequency和Cross Tables。分析的结果如下:交叉表格可以不要. 用频率分布就可以. 另外最好用一两句话
总结
初级经济法重点总结下载党员个人总结TXt高中句型全总结.doc高中句型全总结.doc理论力学知识点总结pdf
每个表格比较好
- 1 -
刘塑 2005210548
- 2 -
刘塑 2005210548
- 3 -
刘塑 2005210548
- 4 -
刘塑 2005210548
- 5 -
刘塑 2005210548
- 6 -
刘塑 2005210548
- 7 -
刘塑 2005210548
- 8 -
刘塑 2005210548
4. 输出结果的说明
(1) 两步骤聚类:
Cluster Distribution
% of
N Combined % of Total Cluster 1 199 40.0% 39.3%
2 164 33.0% 32.3%
3 134 27.0% 26.4%
Combined 497 100.0% 98.0% Excluded Cases 10 2.0% Total 507 100.0%
从表中可以看出,消费者可以分为三类,每一类的人数差别不是很大,但是第一类的人数最
多,占到40%。
因为变量都是分类型,所以没有Centroids表格,选取几个重要的变量的Frequencies表格:好!
- 9 -
刘塑 2005210548
从以上的图表可以看出,第一类是倾向于喜欢引领潮流,对中国制造的品牌没有“歧视性”
- 10 -
刘塑 2005210548 眼光,购物后不喜欢四处打听价格,也不在意别人的羡慕眼光;第二类喜欢引领潮流,不喜
欢中国制造品牌,购物后喜欢四处打听商品价格,比较在意别人的羡慕眼光;第三类对潮流
不太敏感,对中国品牌也没有“歧视”,购物后不喜欢四处打听价格,很不在意别人羡慕的
眼光。因此,我将第一类消费者命名为时尚理性型、第二类为虚荣敏感型、第三类为购物冷
感型。你的第一类是指第一丛吗? 如果是的话第一丛并没有第二丛那样喜欢引领潮流啊!
把非常同意和比较同意两类综合起来看可以知道!
从Categorical Variablewise Importance图表中可以看出,所有的变量的test statistic都超过
了Critical Value,说明变量比较显著,对聚类的贡献比较大。然而,变量的test statistic值从
第一个开始递减,说明前面的变量的贡献大于后面的变量。 不错. 但是可以引用一两个图在此比较好.
(2)多峰逻辑回归
Model Fitting Information
-2 Log
Model Likelihood Chi-Square df Sig. Intercept Only 602.180 Final 508.592 93.588 36 .000
显著程度为0,说明无效假设不成立,样本比较适合作多峰逻辑回归。什么无效假设啊? 这
里是测验所有自变量是否都为0. 不是检验是否适合作多峰逻辑回归问题.
Goodness-of-Fit
Chi-Square df Sig.
Pearson 293.446 276 .225
Deviance 302.541 276 .131
同样,表中的显著度都远远大于0.05,说明模型的适合度很好。说明观察频率和模型预测频
率无显著差异.
Likelihood Ratio Tests
-2 Log
Likelihood of
Reduced
Effect Model Chi-Square df Sig. Intercept 508.592(a) .000 0 . b6 517.092 8.500 2 .014 inc 558.305 49.713 18 .000 b4 546.425 37.833 16 .002 The chi-square statistic is the difference in -2 log-likelihoods between the final model and a reduced model. The
reduced model is formed by omitting an effect from the final model. The null hypothesis is that all parameters of
that effect are 0.
- 11 -
刘塑 2005210548 a This reduced model is equivalent to the final model because omitting the effect does not increase the degrees of
freedom.
上表说明b6(文化程度)、inc(可支配收入)、b4(家庭收入),这三个变量都比较显著,对
模型的贡献明显。
Classification
Predicted
Percent
Observed 1 2 3 Correct
1 126 49 24 63.3%
2 66 83 14 50.9%
3 69 25 40 29.9%
Overall Percentage 52.6% 31.7% 15.7% 50.2%
从表中看出,对第一类消费者(时尚理性型)的预测准确度最高,达到63.3%;对第三类(购
物冷感型)的预测准确度稍差,只有29.2%。但是总的准确度为50.2%,还比较能令人满意。
用第三类做
标准
excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载
,第一类和第二类消费者的参数估计表如下:
Parameter Estimates
95% Confidence Interval
for Exp(B) TwoStep Cluster Std. Lower Upper Number(a) B Error Wald df Sig. Exp(B) Bound Bound 1 Intercept -1.702 .676 6.338 1 .012
b6 .287 .113 6.417 1 .011 1.333 1.067 1.665
[inc=1] .062 1.043 .004 1 .952 1.064 .138 8.218
[inc=2] -.612 .899 .464 1 .496 .542 .093 3.156
[inc=3] -.722 .935 .596 1 .440 .486 .078 3.035
[inc=4] .430 .853 .254 1 .614 1.537 .289 8.171
[inc=5] -.177 .821 .047 1 .829 .838 .168 4.184
[inc=6] .531 .808 .432 1 .511 1.701 .349 8.291
[inc=7] -.212 .745 .081 1 .776 .809 .188 3.483
[inc=8] -.524 .764 .470 1 .493 .592 .133 2.646
[inc=9] -.067 .649 .011 1 .917 .935 .262 3.336
[inc=10] 0(b) . . 0 . . . .
[b4=1] .774 1.326 .340 1 .560 2.167 .161 29.169
[b4=2] -.620 1.420 .191 1 .662 .538 .033 8.700
[b4=3] 1.468 .907 2.616 1 .106 4.338 .733 25.682
[b4=4] 1.079 .829 1.694 1 .193 2.943 .579 14.956
[b4=5] 1.239 .794 2.439 1 .118 3.453 .729 16.357
[b4=6] .940 .775 1.470 1 .225 2.559 .560 11.696
- 12 -
刘塑 2005210548
[b4=7] 1.081 .740 2.134 1 .144 2.947 .691 12.566
[b4=8] .548 .608 .813 1 .367 1.730 .525 5.697
[b4=9] 0(b) . . 0 . . . . 2 Intercept -2.681 .805 11.103 1 .001
b6 .307 .119 6.646 1 .010 1.360 1.076 1.717
[inc=1] 3.921 1.206 10.576 1 .001 50.447 4.748 535.939
[inc=2] 2.787 1.060 6.910 1 .009 16.237 2.032 129.752
[inc=3] 3.181 1.068 8.866 1 .003 24.066 2.965 195.314
[inc=4] 2.907 1.035 7.885 1 .005 18.307 2.406 139.283
[inc=5] 2.241 1.002 5.004 1 .025 9.407 1.320 67.051
[inc=6] 2.288 .999 5.246 1 .022 9.855 1.391 69.809
[inc=7] 1.257 .932 1.819 1 .177 3.513 .566 21.819
[inc=8] .194 1.021 .036 1 .849 1.214 .164 8.980
[inc=9] .410 .889 .213 1 .645 1.506 .264 8.597
[inc=10] 0(b) . . 0 . . . .
[b4=1] -1.485 1.401 1.123 1 .289 .227 .015 3.528
[b4=2] -3.466 1.499 5.346 1 .021 .031 .002 .590
[b4=3] -2.025 1.066 3.610 1 .057 .132 .016 1.066
[b4=4] -1.385 .944 2.151 1 .142 .250 .039 1.593
[b4=5] -.177 .903 .038 1 .844 .838 .143 4.913
[b4=6] -.017 .882 .000 1 .984 .983 .175 5.535
[b4=7] -.036 .860 .002 1 .967 .965 .179 5.207
[b4=8] -.301 .781 .149 1 .700 .740 .160 3.422
[b4=9] 0(b) . . 0 . . . . a. The reference category is: 3.
b. This parameter is set to zero because it is redundant.
参数估计值表示自变量的某一类别和其参考组相比可以使得因变量某一类别出现的概率大
于该因变量参考组的概率。在这里,参考组为第三类消费者(购物冷感型),从实际研究的
角度,该参数就表示杭州数据中消费者属于第一类/第二类的概率大于消费者属于第三类的
概率。这些解释都是正确的! 虽然变量中有的水平不显著,但是intercept的值都是显著的,
说明,变量(家庭收入,可支配收入,文化程度)能区分消费者类型(某一类相对于参考组)
的程度大于临界水平。你这里所用的自变量类别比较多, 此时可以把它们当成连续变量处理. 上表中每个类别效应几乎都不显著, 仅仅是截距显著, 那个意义不大, 所以可以跑另外一个
模型试试看.
5. 总结
通过对杭州数据的分析发现,根据消费者对购物的看法和态度(A1)两表中选取的10个变量对样本进行两步骤聚类,将消费者分为:时尚理性型、虚荣敏感型和购物冷感型三类。然
后,选取家庭收入 、可支配收入和文化程度三个变量,对样本消费者的类型进行多峰逻辑
回归。最后,结果显示,模型可以准确预测50.2%的消费者的类型。好格式!
- 13 -