Logistic回归95%CI特别宽:用惩罚Logistic回归

对于分析二元类型响应变量,通常使用Logistic回归。Logistic 回归使研究人员能够在调整其他潜在混杂变量的影响后估计暴露变量的影响。但在传统Logistic回归中估计 OR 的一个常见问题是最大似然估计未能收敛 [OR: >999.999; 95% CI:<0.001,>999.999],或95%CI范围非常大。这主要发生在中小型数据集,其中至少一个协变量值的回归系数变得无限大。当响应变量被单个协变量或变量的线性组合完全分离时,就会出现稀疏数据或分离数据。传统的logistic回归模型存在不足,主要表现为变量不具有稀疏性和过拟合。
在存在分离/稀疏数据的Logistic回归分析中,可以采用Penalized Logistic Regression(PLR)即惩罚逻辑回归分析方法。
PLR 可以使用 SAS、STATA 和 R 统计软件完成。
最后编辑于 2022-10-09 · 浏览 2097