循证方法专题总结之分层数据合并问题解决方法
推荐在做观察性研究中我们常常碰见一个问题就是分层数据合并问题,合并此类数据我也比较纠结,不知道才用那种方式较好。在此以smoking为例子,提供几种方法。最常见的比较是ever vs. never,但是我们常常发现我们检索的文献只提供current vs. never和past/former vs. never, 此时我们就会想如何将这两层合并成一层数据当做ever vs.never或者说这样的数据我们该怎么处理。方法较多,一一列举如下(注:他们都是使用相同的对照组):
方法1.把他们当中每一层数据都当做独立研究,直接参与合并。下面是jama发表的一篇文章,就是这样的处理。附上链接:. http://jama.jamanetwork.com/article.aspx?articleid=183086。此种方法,个人觉得有些不妥,在对照中对照组重复利用问题值得商榷。至于是不是错误,不甘妄下定论,期待高手来拍砖。
方法2:先将同一篇文献中分层数据用固定效应模型合并成一个数据,然后再与别的文献合并。附两篇文献采用此种方法处理数据: http://www.ncbi.nlm.nih.gov/pubmed/21920268 , http://www.ncbi.nlm.nih.gov/pubmed/17011690 。此种方法运用似乎被较多作者采用,但是这种方法学上面到底有没有问题,期待论坛的统计牛人来探讨。
方法3:先将同一篇文献中分层数据用随机效应模型合并成一个数据,然后再与别的文献合并。附参考文献2篇: http://www.ncbi.nlm.nih.gov/pubmed/22020036 , http://www.ncbi.nlm.nih.gov/pubmed/23224270 。此种方法也被较多的作者采用,同样问题如上,期待大家进一步讨论。
方法4: 此种方法稍微复杂一些,要经过转换。附2片文章使用此方法: http://www.ncbi.nlm.nih.gov/pubmed/21536659 , http://www.ncbi.nlm.nih.gov/pubmed/21307158 。这种方法学的使用见统计部分的参考文献,并不难(作者提供了一个excel表格填入数据即可计算)。此种方法使用的作者也较多,由于本人不是学统计学,具体方法不怎么懂,但似乎觉得跟合理一些,期待统计大家来解析。
方法5:此种方法最简单,就是根据原始文献提供的暴露分布,计算一个粗的or或者rr及95%的区间。采用这种方法的文献随处可见,不在列举参考文献。
总结:每次碰见此类数据的时候我都很犹豫,到底应该采用哪一种呢,每一种方法都有很多人采用,到底谁更合理?















































