戏说卡方检验系列(二)
虫眼看统计系列之----戏说卡方检验(一)
戏说卡方检验(一)
戏说卡方检验系列(二)
戏说卡方检验(二)
戏说卡方检验(三)
戏说卡方检验(三)
戏说卡方检验(四)
戏说卡方检验(四)
.
第三期内容:目前已经在微信平台更新 微信搜索关注 AME科研时间 在历史里面查找
4卡-方检验解读三步法
卡方检验解读三步法:对于卡方检验,有的朋友最关心的就是P值大小,一旦P<0.05就大笑三声扬长而去,其实卡方检验结果解读要分为三步,第一步是统计学解读,看P值,如果统计学解读没有意义,通常专业解读意义就不大。而在统计学有意义的情况下就要进一步看看专业上是否有意义。因为在卡方检验中P值的最根本的意义就是试验组上的差别把它推广到整体其仍然成立的概率。即使差别很小,如果实验组的样本量够大也能得出有统计学意义的P值。所以当统计学有意义后,我们更要注意这个结果在专业上有没有什么意义。第二步:专业上如何选择分组变量和指标变量。因为四格卡方检验,从统计上横向解读和纵向解读都是可以的,而且它们共享同一个卡方值和P值,但不同方向专业含义不同。我们要从研究目的出发选择哪一组作为分组变量哪一组作为指标变量。比如本例(表2)
表2:某药物在男性组和女性组治疗效果的差别
效果![]() 组别 | 有效 | 无效 |
| 男性组 | a=99 (实际频数) | b=5 (实际值频数) |
| 女性组 | c=75 (实际频数) | d=21 (实际频数) |
在横向上你可以解读成男性组和女性组治疗的有效率(或者无效率)有没有区别,因此分组变量男性组和女性组,指标变量为有效、无效。在纵向你可以解读成不同治疗效果之间男女的构成比有没有差别,因此分组变量有效组和无效组,指标变量为男性、女性构成比。当然,后一种试验设计思路是比较少用的,但不等于不能用。举个例子。苹果公司生产白色和黑色两种iPad,研究者随机选择购买白色和黑色各100例用户,想看看男性和女性两种用户对这两个颜色的选择是否有差异,那是不是就要用后面一种设计方案。第三步,专业意义的解读。比如一种新药对某种疾病治愈率81%,而对照的老药治愈率80%,即使这个时候P值<0.05,在专业上也是没有什么意义的。
5 普通四格表和配对四格表一样吗?
表3:
两种方法检测乙肝表面抗原的配对四格表
![]() B法 | 阳性 | 阴性 |
| 阳性 | 99(a) | 5(b) |
| 阴性 | 75(c) | 21(d) |
表4:两种方法检测乙肝表面抗原的还原成普通四格表
![]() 组别 | 阳性 | 阴性 |
| A方法 | 174(a) | 26(b) |
| B方法 | 104(c) | 96(d) |
讲到四格表,就不得不提四格表的另外一种形式——配对四格表。配对四格表和我们普通四格表最本质的区别在哪里?我们还是通过一道例题来说明。如表2,某研究用将受试者同一管血液标本用A方法和B方法测乙肝表面抗原,阴性和阳性人数如下表所示,问这两个方法有没有区别?
这个数字和表1完全相同,有些朋友脑筋转的很快,这个太简单了,不用电脑软件,我手工就可以计算,就用前面公式x2=(ac-bd)2n/(a+b)(b+c)(c+d)(a+d) 得x2=12.86 自由度=1,查表P<0.01。不好意思,错了。注意看这种四格表体现不出分组变量和指标变量关系,它们纵、横属性是一样的,都是对同一样本的评价结果。我们把它还原成经典四格卡方检验四格表(如表,4):A阳性不是99例,因为A(阳性)B(阳性)和A(阳性)B(阴性),都属于A阳性,这样看来A方法阳性应该是99+75=174例。同理A阴性26例,B阳性104例,B阴性96。经过这样还原纵横之间属性就不一样,就可以分解成分组变量和指标变量,这样才能用公式x2=(ac-bd)2n/(a+b)(b+c)(c+d)(a+d) 得x2=57.79 自由度=1,查表P<0.01。当然用这种方法可以做,但是配对四格表有专门针对他的简化公式x2=(b-c)2/(b+c),注意这时b和c就是表2指配对四格表中的b和c。结果为(5-75)2/(5+75) =61.25,咦,两个计算结果卡方值不一样,我们前面说过了卡方值越大越好,因为P值越小。看来用配对的方法做要高效一些,更容易出结果,因为配对后同一个人的血查两次,减少了误差。如果按不配对做法所以实际样本数是400,翻一倍。注意:配对设计的你可以用普通卡方去算,只是降低你的检验效率;但是不是配对设计,因为达不到达不到配对检验的条件,就不能用配对公式。
6 kapa分析与配对卡方检验----看似矛盾的两种方法
图4:
阳性率相同情况下,kapa分析不同组合结果不同的示意图
说到配对四格表,也就不得不说配对四格表另一种作用Kapa分析,也就是一致性检验。有一些朋友在这里可能拐不过弯。比如我用配对四格表卡方检验,P<0.01,说明两个方法差别有明显统计学意义,不就是说明它们不一致吗?为什么还要用Kapa分析?用同样,如果我做出来P=0.90 说明两种方法区别没有统计学意义,说明它们挺一致的,为什么再Kapa分析?下面我们用简单一道例子解释这个问题。抽取20个人血清,用A方法检查有10个乙肝抗原阳性,用B方法检查也有10个乙肝抗原阳性,问这两种方法检出乙肝阳性率区别有没统计学意义,再问这两种方法一致性有没区别?对于第一问题二者检出率都是50%,这中情况不用做卡方检验都知道检出阳性率肯定没区别。对于第二个问题我们不能因为卡方检验没区别,就认为一致性就很好,我们看图3,同样阳性率为50%,在(1)中两种方法完全一致,kapa系数=1;在(2)中完全不一致,kapa系数=-1;在(3)中一半一致一半不一致,kapa系数=0;在(4)大部分一致,kapa系数=0.6。这样大家就理解配对卡方和kapa分析说的是两码事,卡方说的是率的差别,kapa说的是一致不一致,即使率相同,从图3可以看出kapa分析的结果还有很多的可能,要看配对四格表具体数值。抽象一点的数理上的理解,配对四格表计算x2=(b-c)2/(b+c),它更关注b、c两个格子的结果,而b、c两个格子代表两种方法结果不一致。kapa系数的计算公式为 (Po-Pe)/(1-Pe),其中Po=(a+d)/n, Pe=[(a+b) (a+c)+(c+d)(b+d)]/n2,它更关注a、d两个格子的结果,而a、d两个格子代表两种方法结果一致性。
图5:卡方检验statistics 下的不同选项示意图
这样看来,同样相同的四格表数值,可以理解成普通四格表,配对四格表,kapa分析,其结果各不相同。如果录入完丢给SPSS软件,软件肯定蒙圈了,它不明白你要他干什么。如果软件把三个结果都统统输出来,我们也会蒙圈了,因为结果太多了。所以录入好四格表后肯定要告诉SPSS软件我们要干什么,如图5所示。但是这个我们不能乱钩选,把普通四格表钩选成配对、或把配对钩选成普通四格表或kapa分析,其结果都是错的,我们要从表格所代表的专业意义出发来选择。
7四格卡方检验的几个注意事项
最后谈一谈四格表卡方检验注意事项:
1、对于总样本量小于40的一定要用Fisher精确检验。
2、对于P在0.05左右的一定要改用Fisher精确检验。
3、对于出现某一格理论频数(T)小于1的一定要改用Fisher精确检验。
4、对于出现1≤T<5时用校正卡方检验。
Fisher精确检验和校正卡方检验我们不必去记它的公式,只要懂得适用情况就行。这些统计量在SPSS结果部分都有显示,将在下一节做介绍。
介绍完四格卡方检验,我们要进一步介绍R×C列表的卡方检验。R×C列表的卡方检验的卡方检验往往争论比较多,主要是因为它的形式比较多样,容易混淆和错用。
















































