二分类变量相关性分析spss_【2026.】RC列联表(分类数据)的统计分析方法选择与SPSS实现...

8b61ee6cec85e882c983fd132b3bdfd1.gif

关注本号后,回复软件名称,即可拿到软件下载链接哦!

    分类资料在医学统计中很常见,有些统计学书上称为计数资料,比如(有效、无效),(发病、不发病),(男、女),血型(A、B、O、AB)等等。    分类资料一般根据频数整理成列联表的形式,一般的列联表多是二维的(也称行列表,或R×C列联表,高维列联表下次讨论),列联表根据变量是否有序可以分为双向无序、单项有序、双向有序列联表,统计方法是不同的,分析如下:

一、双向无序列联表

(一)成组四格表

    是指行、列变量均为无序的列联表,例如要研究吸烟和肺癌之间的关系,行变量为是否吸烟:吸烟、不吸烟,列变量为肺癌发病:发病,不发病,如下表:

发生肺癌未发生肺癌
吸烟ab
不吸烟cd

    对于这种数据,我们的统计目的是分析行列变量的独立性,即:肺癌发病是否与吸烟有关,可选用的方法有以下两种:

1、Pearson卡方检验:

    基于卡方分布,H0为行、列变量相互独立,SPSS中“分析->描述性统计->交叉表”可实现。 四格表使用条件:专用公式①样本总数大于40;②各个单元格理论值均大于5。校正公式:①样本总数大于40;②理论值1①样本总数小于40,或T<1,无需选择,软件自动计算成组四格表Fisher。

2、Fisher精确概率:

    基于超几何分布,当数据不满足Pearson卡方检验时使用。SPSS中“分析->描述性统计->交叉表”可实现。注意SPSS仅提供了2×2表的精确概率,需要计算R×C列联表的精确概率,可以选择精确按钮中的蒙特卡罗近似法实现。

(二)成组R×C表(双向无序)

A型B型O型AB型
A地区abcd
B地区efjh
C地区ijkl
1.Pearson卡方检验     条件:不能有任何一个格子的理论频数T<1,同时1 如若不符合:可以增加研究样本量(通常少用);对理论频数较小的行或者列进行合并或者删除;采用R×C表的Fisher确切概率法(通常采用蒙特卡洛近似法) 2.R×C表Fisher确切概率法    操作:分析—描述—交叉表—设置好行列变量—点击精确—选择蒙特卡洛。

二、单项有序列联表

    常见的情况是结果变量有序,而原因变量无序。比如要比较AB两种药物的治疗效果,药物分组(AB)是无序的,而结果变量是有序的(无效,显效,治愈),可以整理成如下的表格:
无效显效治愈
A药abc
B药def
可以选择的统计方法主要有: 1、Mann–WhitneyU 检验 基于卡方分布,H0为两组总体分布一致,SPSS中“分析->非参数检验->独立样本”中可实现。 注意:在SPSS中,如果是整理成了列联表资料,需要用频数进行数据加权。变量编码为:①药物(名义):A=1,B=2,②疗效(度量):无效=1,有效=2,治愈=3,③频数(度量)。 2、Kruskal-Wallis H检验 用于分组数大于2的情况,比如要比较3种或以上药物的疗效。实现方法与Mann–Whitney U 类似。     注意:当行变量为有序时,通常当作无序处理。但若行变量为有序,列变量为二分类率时,根据研究目的,也可以选择趋势性卡方检验。

三、双向有序列联表

1、双向有序属性不同

    比如这个例子:要比较某种药物对某种疾病的治疗效果,按年龄段的分组,要考察治疗效果是否与年龄段相关,整理成下表:
无效有效治愈
20-30岁abc
30-40岁def
40-50岁hij
50-60岁klm
60岁以上nop
    行、列都是有序的,这是我们主要关心的:行列变量之间是否有相关性,如果有相关性,是线性相关还是曲线关系。可以选择的方法如下: (1)Spearman等级相关: 检验有无相关性,基于卡方检验,在SPSS中“分析->相关->双样本”中可实现。 (2)线性趋势卡方检验: 检验有无线性关系,基于卡方检验,SPSS“分析->交叉表”卡方结果表格中的“线性和线性组合”就是。

2、双向有序属性相同

(1)行列变量独立     通常是为了检验一致性。比如用两台仪器对同一样本进行检验,结果分为阴性、阳性,现在要比较两台仪器的结果是否据有一致性。整理成下表:
阴性阳性
阴性ab
阳性cd
常用的方法为: Kappa一致性检验: H0为行列变量无一致性。在SPSS中“分析->描述性统计->交叉表”中可实现。 (2)配对行列表     行列变量为配对资料,比如有某种药物可以缓解某种疾病的某种症状,在同一个患者身上比较用药前后的症状,评价药物的资料效果,列成下表:
治疗前有症状治疗前无症状
治疗后有症状ab
治疗后无症状cd
可以选用的统计方法: 1)McNemar检验: 仅用于2×2列联表。基于卡方分布。在SPSS中“分析->描述性统计->交叉表”中可实现。本检验与Pearson卡方检验具有同一性,使用条件必须满足Pearson卡方检验的条件。如果条件不能满足,需要进行Yate校正。 2)Bowker检验: 是McNemar检验的扩展,用于分类数目大于2的配对列联表分析。在SPSS中“分析->描述性统计->交叉表”中可实现。SPSS中依然选择的是Mcnemar,结果输出的是Mcnemar-Bowker结果。

松哥统计说

说了这么多,肯定有人问,松哥“到底何为行变量、何为列变量呢”,设置原则一般为:实验设计三要素中的干预因素为行变量,实验效应指标为列变量,何为实验设计三要素,请查阅公众号(data973)相关内容。OK,今天聊到这里,赠人玫瑰,手留余香,点亮或分享就是对我们的最大支持!!

整理不易,欢迎点亮再看!

---SPSS实战与疑难杂症系列---

【2024.】生存分析截断值自动识别软件,超级棒哦!

【2023.】层次分析法帮你选股票

【2022.】简单效应的SPSS实现

【2021.】广义估计方程SPSS实战

【2020.】这种主成分得分图SPSS能够实现吗?

【2019.】卡方分割无需手动,SPSS自动可实现啦!

【2018.】重复测量资料SPSS实战篇

【2017.】SPSS输出结果统计表与统计图的专业性编辑及三线表定制格式赠送!

【2016.】卡方检验之SPSS实现简约版(视频)

【2015.】t检验之SPSS实现简约版(视频)

【2013.】SPSS中如何设置哑变量

【2012.】分层回归之SPSS实践

【2011.】SPSS直接物理拆分为两个文件

【2010.】倾向性评分(PSM)的SPSS24.0实战

【2009.】如何SPSS实现随机分组

【2008.】趋势性卡方检验专题讨论

【2007.】2个因素均为重复测量数据方差分析

【2006.】为什么配对样本t检验,SPSS结果默认输出相关性

【2005.】SPSS软件作图如何去除顶部与右边边框

【2004.】如何让SPSS自动按照四分位数间距分组某变量【技巧】

【2003.】SPSS两独立样本t检验的简易算法(无需原始数据)

【2002.】太伤自尊了,自以为学会了,现在用SPSS连两独立样本t检验都做不好

【2001.】SPSS作图坐标轴不过原点的解决办法

【2000.】临床预测模型SPSS验证实战

------------------------------


25db9ef4433a8318134a8b2331159e6d.png

15f2adeaf65aebd58eab4f67f9c9fa7f.png


版权声明:本文为weixin_28366353原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。