dxy logo
首页丁香园病例库全部版块
搜索
登录

关于二元logistic在探索危险因素中的问题若干

产科医师 · 发布于 2016-07-06 · IP 浙江浙江
1.2 万 浏览
这个帖子发布于 9 年零 133 天前,其中的信息可能已发生改变或有所发展。

首先介绍一下我的临床资料背景

病例对照研究,人群是患有某种肾病的患者,病例n=50(在确诊后5年内进展至尿毒症),对照n=100(确诊5年以上未进展至尿毒症)

因变量 ,尿毒症(1),未进入尿毒症(0)

自变量,诊断初期病理检查结果x1,x2,x3,诊断初期临床指标 x4,x5,x6,随访期间临床指标的平均值x7,x8,x9(分别与x4,x5,x6对应相同的临床指标,如血红蛋白),还有其他各种指标x10,x11, x...等等等,收集了很多数据

选用logistic回归:依据:1,因变量是二分类变量;2,x和各自lo git(p)经计算,作图,是有线性关系的。3,logistic回归在病例对照研究中应用十分广泛,较适合

已知类似研究已经有很多,大部分研究都是评价病理检查结果和诊断初期临床指标对预后的预测价值。当然各个研究的结果还是有差异的,但比较公认的是x1,x3,x4,x10与患者进入尿毒症(1)显著相关。

此次我们主要想探索随访期间临床指标是否是独立危险因素,也就是想验证,其实诊断后的后期治疗对结果也是相当重要的。所以我们收集了相对比较多的随访指标。

现在问题来了:

1,指标这么多,将近20个,依据每个因素起码对应有5-10个例子(10个为宜)的标准,这么多扔进去自由度增加,方程结果会不会非常不可靠。看了丁香园上好多帖子,有建议单因素分析有意义的结果纳入多因素的(据说是典型错误,见胡良平老师的书)。有建议减少变量的,比如前进法或者后退法的(初稿我也是这么写的,被审稿人喷了一顿,说是stepwise是一个horriable idea,让我把所以变量 all enter )。也有建议直接enter的(在国际期刊中比较普遍,我们统计学老师也表示enter在专业上用的比较普遍,能减少一类错误)。到底有没有权威定论,哪一种才是对的呢。考虑到样本量问题,把我收集到的全部变量enter也不实际吧。除非我后台先把所有变量筛一遍,然后只在文章中列出后台筛选出比较有意义的,然后说我只收集了这几个,然后进行分析吗????,这个方法有没有太瞎。

2,共线性诊断问题,logistic回归要求各个变量间独立,但是临床资料间相关在所难免啊。“多重共线性的诊断(SPSS中的指标):a容许度:越近似于0,共线性越强;b特征根:越近似于0,共线性越强;c条件指数:越大,共线性越强;”到底数值达到哪一种程度才算有共线性呢?0.5?0.7?0.9?。有共线性又该怎么办呢,剔除?剔除标准?

3,接着为了减少关注的因素,我把分析的目标重点转向了已经被研究烂的病理指标x1,x2,x3。进行多种模型的multivariable logistic回归分析。model1,只纳入病理指标x1,x2,x3. model2, 病理指标+诊断初期临床指标,探索被矫正后的病理指标的预后评估价值,model3,病理指标+随访期间临床指标,探索被随访指标校正后病理指标的预后评估价值。最好的预期是校正随访指标后,病理指标的预测效果降低,证明随访指标的重要性。不知我这样的统计分析方案是否合理。model4为了不被审稿人喷,所有指标all enter,查看独立危险因素。其实这样做也有弊端,我到底该拿哪一次的or结果做为最后的结果呢。

主要我是统计小白,最近恶补统计学内容,却还是无法理解透彻,一头雾水。

还请各位老师帮忙答疑解惑!对我使用的统计方法有错误的地方还请多多指点,感激不尽!

22 73 5

全部讨论(0)

默认最新
avatar
22
分享帖子
share-weibo分享到微博
share-weibo分享到微信
认证
返回顶部