dxy logo
首页丁香园病例库全部版块
搜索
登录

戏说卡方检验(三)

心血管内科医师 · 发布于 2016-01-21 · IP 福建福建
1.6 万 浏览
icon推荐
这个帖子发布于 9 年零 307 天前,其中的信息可能已发生改变或有所发展。

虫眼看统计系列之----戏说卡方检验(一)
戏说卡方检验(一)

戏说卡方检验系列(二)
戏说卡方检验(二)
戏说卡方检验(三)
戏说卡方检验(三)
戏说卡方检验(四)
戏说卡方检验(四)
戏说卡方检验(三)(四)已经在AME科研时间上连载完了,由于前一段时间较忙一直忘了发到论坛,今天一起发出,大家看完1-4期的连载相信会对卡方检验有一个不一样的了解。
1初识R×C列表卡方检验:
R×C列表卡方检验中的R代表横向有多少行,C代表纵向有多少列。比如前面所说的四格卡方检验应该是2×2列表的卡方检验。那么如果表格继续往横向或纵向增加就会有2×3、2×4、2×5、3×3、3×4、3×5等等,都统称为R×C列表卡方检验,这种表格有3种典型的形式,我们来一起认识一下:
表1:不同人种亚甲基四氢叶酸还原酶三种基因型分布是否有差异









img
血型
组别    


黑人白人黄种人
CC型342838
CT型462232
TT型205030


表2:三种减肥药疗效是否有差别



img
疗效
组别    


A药组342838
B药组462232
C药组205030


表3:2种评价方法评定评价某药物的疗效是否有差异



img
评价方法A
评价方法B    


963312
385618
253352


  如表1,R×C卡方列表在纵横两个方向都是无序的,叫双向无序R×C列表;
②   如表2,横向上是有序的,纵向上是无序的;(或者相反,横向上是无序的,纵向上是有序的),叫单向有序R×C列表。
③   如表3,纵横两个方向上都是有序的,叫双向有序R×C列表。


这三种情况统计学的思路和侧重点是不一样的,这就是我们以后要讨论的重点。但这里我们首先要了解为什么要这样划分?因为有它的专业道理。在四格卡方检验中阴性组和阳性组谁摆在前面关系都不大,但一旦超过2格,排列在顺序上是不能乱颠倒,比如好、中、差可以接受,排列成差、中、好也可以接受,但是要排列成中、好、差或者好、差、中专业上就说不通了,就是说专业意义不允许顺序乱颠倒。
但问题恰恰出在这里,因为卡方检验有个重要数理特征,它必须可以让各个组随意颠倒顺序而不影响x2值,也就是说专业要求和数理结果有时会出现不**的情况,怎么办?我们对这三种情况逐一讨论。
2双向无序的R×C列表卡方检验可以做什么?
如表1,既然是双向无序R×C列表,那么你把白人、黑人、黄种人三个位置随意调换,或者把CC型、CT型、TT型三个位置随意调换专业上都是说的过去的,也就说它的数理特点和专业要求没有矛盾,这种情况最简单。
对于双向无序的R×C列表卡方检验,我们根据公式计算或输入SPSS得出的卡方值是整体卡方值,得出的P值也是整体P值。什么意思?通俗一点说,如果这个P值<0.05,它只是告诉你这几组中至少有一组和其他组不同,但是具体是哪一组目前它还不知道,怎么办?要进一步做两两检验。这个思路几乎贯穿于所有多组比较统计学方法中,比如①对于符合正态等方差的连续型变量多组比较采用方差分析(Annove分析),而后两两检验;②对于率的多组比较,先采用卡方检验,而后两两检验;③对于非正态,方差不齐或不符合某种函数分布的多组数据比较可以采用非参数检验而后而后两两检验。大家看到了----“两两检验”这个关键词反复出现。下面要进一步告诉大家两两检验方法有很多种,大家是否还记得方差分析之后两两检验有SNK-q检验、LSD-t检验、Dunnett-t检验、Tukey检验,Scheffe检验等等多种,R×C卡方检验和多组非参数检验也有很多种两两检验方法,真头痛,怎么这么多两两检验方法?有没有一种傻瓜化的,放之四海而皆准的,通用的两两检验?下面是好消息——有的: Bonferroni校正法。这个名字听起来很高大上,大家不要被它吓到,它只是把预设的验前比a进行拆分。比如有4组样本我们想要知道哪两组有区别,那就要要两两比较6次,要保证总的错误概率不超过预设的验前比概率0.05,那么每两组之间错误概率就不能超过0.05/6=0.0833。如果有k组,那么要把预设的a值除以k(k-1)/2。注意,试验设计时如果不是两两比较,是每一组都和第一组比较,那么k组只要除以k-1即可,比如总共4组,其它都和第一组比,只要比较3次,那么为0.05/(4-1)=0.0167,更保守稳妥的公式是把这个概率再除以2,也就是它是除2(k-1)。
3单向有序的R×C列表就一定不能用卡方检验?
对于单向有序的R×C列表我们要做的的第一个事情是我们究竟要把哪一组作为分组变量,哪一组作为指标变量,这是由我们的研究目的决定的。两个相同数据的表格,从不同的专业研究目的出发就可以产生不同解读方式(表1、表2)
表1:三种减肥药疗效是否有差别











img
疗效
组别    


A药组342838
B药组462232
C药组205030



表2:
不同疗效组的人选择减肥药是否有差别



img
疗效组
选择药物  


疗效好的组疗效中等组疗效差的组
A药342838
B药462232
C药205030


表1,我们可以解读成A、B、C三种不同的减肥药物作用效果是否有区别,如果有区别,那么我们可以进一步对这三个效果做个两两比较。我们研究的是治疗效果,治疗效果有好、中、差之分是个等级资料,三个档次不能互换,不满足卡方检验前提,只能用非参数检验,两两检验可以用非参数检验的两两比较检验,也可以用Bonferroni校正。
表2,它的设计方案是这样的,市面上有三种减肥药,我根据减肥的效果分3组,即治疗效果好的组、中等的组、较差的组,每组入选100人。我想看看这三组病人在选择用药上有什么区别,如果这三组病人选择药物上没区别,很可能它们不同效果是由其它原因引起来的,比如饮食、锻炼或减肥的决心等等,这也是一个研究思路,这个研究思路在专业上是说得通的,比较是三组治疗不同效果的病人选择药物是否不同,治疗效果虽然是等级资料,但我们这里研究的落点是选择3种药物的构成比有没差异,而这三种药物没有等级关系,是可以用卡方检验来做的,如果有区别那两两检验做的是三个药物品种A、B、C而不是疗效好、中、差。两两检验用卡方检验的Bonferroni校正。
这两个例子一正一反,告诉大家单项有序的R×C表首先要根据实验目的选择好分组变量和指标变量,如果指标变量是有序变量要用非参数检验,如果指标变量是无序变量仍然可以用卡方检验,不能看到单项有序就下结论都不能用卡方检验。
当指标变量是有序变量不满足卡方检验前提条件,不能用卡方检验,要改用用非参数检验,那么它该怎么做,虽然这个已经不属于卡方检验范畴,当我们还是简单的提一下,它的录入格式和卡方检验一样(在下一节中讲解),录入完毕后,操作过程如图1。
图1:单向有序的R×C列表采用非参数检验操作示意图

img






24 248 33

全部讨论(0)

默认最新
avatar
24
分享帖子
share-weibo分享到微博
share-weibo分享到微信
认证
返回顶部