二分类变量相关性分析spss_SPSS学习笔记13:处理分类变量的利器,对应分析

两个分类变量间的关系,无法直接使用常见的皮尔逊相关系数来表述,多采用频数统计、交叉表卡方检验等过程进行处理,当分类变量的取值较多时,列联表频数的形式就变得更为复杂,很难从中归纳出变量间的关系。

对应分析,则是解决分类变量间关系这个复杂问题的有力武器。也称为相应分析,是一种多元统计分析方法,目的是在同时描述各变量分类间关系时,在一个低维度空间中对对应表中的两个分类变量进行关系的描述。

常见应用领域如市场研究分析、竞争分析等。

一、先看一个案例

对于男性而言,个人职位是否与吸烟有关,假设有人收集了这样的一组数据,如下:

数字表示人数,仅从交叉表内数据大小按照热度区分的话,效果大概是这个样子,红色越深的格子表示人数越多:

我们发现初级雇员普遍吸烟,中度最多,其他的表现并不明显,总体上很难发现什么规律。

除了热图之外,还可以考虑常见的条形图,效果如下:

可视化的效果要比前面热图好很多,给人的直观感觉是,职位较高的男性,重度吸烟的比例较低,多数从不吸烟。

经过以上两种图示化方法的预处理,我们能从其中总结职位和吸烟关系的把握并不大。

二、SPSS交叉表卡方检验

熟悉SPSS统计分析的人可能还会想到,是否可以先采用交叉表卡方检验来观察职位和吸烟之间的关系呢?


版权声明:本文为weixin_32926649原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。