• 论坛首页
  • 我的丁香客
  • 找人
    查找好友
  • 更多
    丁香园
    丁香通
    丁香人才
    丁香会议
    丁香搜索
    丁香医生
    丁香无线
    丁香导航
    丁当铺
    文献求助
    医药数据库
    丁香诊所
    来问医生
登录 注册

医学和生物统计

关注今日:13 | 主题:295261
论坛首页  >  医学统计和生物统计讨论版   >  课件、书刊
  • 发帖
    每发1个新帖
    可以获得0.5个丁当奖励
  • 回帖

分享到:

  • 微信

    微信扫一扫

  • 微博
  • 丁香客
  • 复制网址

ROC曲线、多指标ROC曲线做法,附带logistics回归简单道理

  • 查看全部
  • 页码直达:
  • 直达末页
楼主 四叶虫
四叶虫
心血管内科

丁香园荣誉版主

  • 263
    积分
  • 1.2万
    得票
  • 3758
    丁当
  • 1楼
这个帖子发布于5年零363天前,其中的信息可能已发生改变或有所发展。
有战友问:我知道单个指标ROC曲线怎么做,那么多个指标ROC曲线怎么用logistics回归做,这里虫哥专门开一贴说明,走过路过不要错过。
根据战友的建议和消息反馈,可能有部分战友对单个指标ROC来龙去脉还不太清楚,看来要专门开一贴说一下--拟定题目为 “黄豆和绿豆 ROC曲线的来龙去脉” 作为这篇文章的姊妹篇,这样大家读起来就比较有条理------就这么愉快的决定了,不过虫哥手头还有些杂活,得过一段出上篇,一定不会让亲们失望。

第一:你要知道如何对 一个指标做ROC曲线---过程如下:
做法:spss菜单栏----分析 ---roc---把这个指标放入检验变量----把金标准的阳性阴性结果放入检验变量---指定0还是1 是状态变量值---生成结果----这个如果不会的话后面我讲起来比较费劲。

第二:做多变量,假设是3个吧----大家肯定想我把这三个都放入检验变量不就完了吗----呵呵,错!---那会生成3条ROC这不是你想要的结果,-----当存在多个指标时,要做ROC曲线,就要找到一个指标将这三个指标综合起来。
第三:那怎么办----用logistics回归来综合是个通用的方法,为了便于亲们理解logistics回归 先说一个极其简单小例子--

假设以冠脉造影做冠心病金标准没有=0,有=1
第一个家伙----冠心病=0 , x1(糖尿病)=是,x2(胆固醇)=10.2 ,x3(高压值)=180
第二个家伙----冠心病=1, x1(糖尿病)=否,x2(胆固醇)=2.1,x3(高压值)=126
.......
第N个家伙----冠心病=1 , x1(糖尿病)=是,x2(胆固醇)=8.1,x3(高压值)=166
假设你先看到第1、2个家伙,你会觉得这个世界很悲催,你看第一个有糖尿病、血压也控制不好,还高血脂,但人家就是不得冠心病,第二个家伙什么都很好,卧槽,就是得了冠心病....但是如果你研究了300病例个你会发现这个世界还是很公平的,好人大多数时候是有好报的,------经过logistics回归我们得出公式
Y(冠心病)=3.66+1.67糖尿病+1.32高血脂+0.36高血压 ,Y的含义是ln(p/1-P),代表冠心病发生的概率自然对数的相对风险比值(下面会进一步说明),ln含义是自然数e的对数。
----这个公式啥意思,你看不懂,没关系,虫哥解释给你听:

我们知道自然数e=2.718 e的1.67次方=4 ,e的1.32次方=3 e的0.36次方=2 (这个我瞎算的,懒得去算了),啥意思---就是有糖尿病的人得冠心病概率是没有糖尿病人的4倍,血脂每增高1单位 冠心病概率增加3倍.....这下你明白了吧,其实第一个家伙在公平的世界你这样算下来他得冠心病概率很高,达到 0.86,但是在现实生活中只有得和不得两种情况----他这辈子烧了高香所以它运气好----不得,但并不是人人都有这么好的运气,公平的说他的概率就是0.86,而第二个人的概率 是0.16
说道这里----答案就要出来了---这个0.86,0,16......这些就是你要的综合值(也就是真实概率值)(注意其它情况下我们做logistics回归要的是β值也就是1.67、1.32、0.36,然后计算OR(相对风险率,也就是=eβ),再往下就是看看每一个β值的p有意义没有,如果有,说明这个OR真实存在可以推广到总体)而这里我们要的是各个家伙的概率怎么办?简单,在做logistics回归时,你勾选下图的概率在你的原来数值表格后会多出一行---每一个家伙的冠心病概率,然后你用它在做一次ROC曲线就行。


看到这里你是不是已经内牛满面,你不但又掌握了一门葵花宝典,而且还不用自宫,不要谢我,叫我雷锋就好。
  • 邀请讨论
  • 不知道邀请谁?试试他们

    换一换
2015-03-02 23:57 浏览 : 108321 回复 : 177
  • 投票 115
  • 收藏 999
  • 打赏 2
  • 引用
  • 分享
    • 微信扫一扫

    • 新浪微博
    • 丁香客
    • 复制网址
  • 举报
    • 广告宣传推广
    • 政治敏感、违法虚假信息
    • 恶意灌水、重复发帖
    • 违规侵权、站友争执
    • 附件异常、链接失效
    • 其他
四叶虫 编辑于 2015-03-03 19:26
  • • 中年男性,体检发现左肾占位,典型病例,送分题,已公布病理。
楼主 四叶虫
四叶虫
心血管内科

丁香园荣誉版主

  • 263
    积分
  • 1.2万
    得票
  • 3758
    丁当
  • 8楼
lukeys7
讨论一下:
个人感觉,其实问题没有说清楚——到底是谁要做ROC曲线?
如果能说清楚,这个问题就更容易明白了:
ROC曲线反映的是诊断试验界值变化与金标准的关系。
单个指标的界值做ROC曲线当然好理解,
多个指标的界值做ROC曲线就有问题了:
ROC曲线只能用一个指标的界值去和金标准做,
那么关键问题就在于,指标用谁?【这个关系到如何理解诊断的意义】
当存在多个指标时,要做ROC曲线,就要找到一个指标将这三个指标综合起来,
版主在这里用的是“发病概率”(由各指标对应的OR值综合而出,而非由各指标的具体值综合而出),
其实还可以用其他指标,只是算法就不同了。
lukeys7 战友说的很好,看来得先把单个诊断指标的ROC曲线来龙去脉讲清楚,然后大家才更容易理解多指标复合ROC曲线的理解,另外-----当存在多个指标时,要做ROC曲线,就要找到一个指标将这三个指标综合起来,这一句话很经典借用一下。
2015-03-03 13:12
  • 投票 8
  • 收藏 3
  • 打赏
  • 引用
  • 分享
    • 微信扫一扫

    • 新浪微博
    • 丁香客
    • 复制网址
  • 举报
    • 广告宣传推广
    • 政治敏感、违法虚假信息
    • 恶意灌水、重复发帖
    • 违规侵权、站友争执
    • 附件异常、链接失效
    • 其他
  • • 儿科夜班急诊
楼主 四叶虫
四叶虫
心血管内科

丁香园荣誉版主

  • 263
    积分
  • 1.2万
    得票
  • 3758
    丁当
    热
  • 11楼
smm1988
虫哥,我刚才试着用那个帖子里的数据依样画葫芦做一下,可是pred那一列都是1和0。这是什么情况?

是个勤于动手的好战友,赞一个。
有的战友在操作的过程中可能会出现下面的问题----这些家伙概率不是0,就是1,如下图,这是怎么回事?

这个问题涉及到对logistics回归的理解,要真看懂这篇除了要写上篇 黄豆和绿豆,估计还得写一篇logistics回归的帖子,简单的讲这是数据出现了奇异矩阵,他的表现就是方程不稳定,OR值有时会变得异常大。也就是说某一个指标占有绝对优势,几乎由他说了算,好比上图 B指标的OR是 1038,A指标OR是1.4,那A自然就没有发言权,都是B说了算。
为什么会这样
1、事实就是如此。
2、你的参数之间相关性超过了一定数值,这就导致方程不能容忍的共线性(共线性的容忍是有个度的,当然不是一点都不能容忍), 上面吧啦吧啦的文绉绉的讲了一大堆,如果你听的很晕,换一个简单的提法,你的因变量指标不能相似性太强,比如你选择一个高压,就不要选择低压,你选择了肌钙蛋白就不要选择 CKMB,哥几个干一样的活其实就是一个东西,它会导致方程的不稳定,我们要从专业角度尽量从不同侧面为回归找一些有代表的因变量。如果一个是指标A=肌钙蛋白,B指标是CKMB,实质都是心肌酶,对于心梗诊断A通过的 B也很容易通过,所以概率就一致了。
这也就提示我们----
1、做联合多指标的ROC---尽量不要用很相似的指标,比如心梗的联合诊断----我们可以挑 胸痛程度、心电图、肌钙蛋白----一定比单个指标要好。
2、如果两个指标发言权相差十分悬殊,那完全没有联合诊断的必要。
所以统计是一种思想,亲们不但要学会做,还要边做边想。
2015-03-03 17:30
  • 投票 25
  • 收藏 35
  • 打赏
  • 引用
  • 分享
    • 微信扫一扫

    • 新浪微博
    • 丁香客
    • 复制网址
  • 举报
    • 广告宣传推广
    • 政治敏感、违法虚假信息
    • 恶意灌水、重复发帖
    • 违规侵权、站友争执
    • 附件异常、链接失效
    • 其他
四叶虫 编辑于 2015-03-03 19:27
  • • 11岁女孩患水痘医院误开死亡证明
楼主 四叶虫
四叶虫
心血管内科

丁香园荣誉版主

  • 263
    积分
  • 1.2万
    得票
  • 3758
    丁当
  • 16楼
laolva
联合画ROC,检验变量是回归出来的P,状态变量仍然是金标准不变,是这样理解吧?

正确
2015-03-05 23:05
  • 投票
  • 收藏 2
  • 打赏
  • 引用
  • 分享
    • 微信扫一扫

    • 新浪微博
    • 丁香客
    • 复制网址
  • 举报
    • 广告宣传推广
    • 政治敏感、违法虚假信息
    • 恶意灌水、重复发帖
    • 违规侵权、站友争执
    • 附件异常、链接失效
    • 其他
  • • 逃离东北也许是我这辈子最正确的决定!

关闭提示

需要2个丁当

丁香园旗下网站

  • 丁香园
  • 用药助手
  • 丁香通
  • 文献求助
  • 丁香人才
  • 丁香医生
  • 丁香导航
  • 丁香会议
  • 手机丁香园
  • 医药数据库

关于丁香园

  • 关于我们
  • 丁香园标志
  • 友情链接
  • 联系我们
  • 加盟丁香园
  • 版权声明
  • 资格证书

官方链接

  • 丁香志
  • 丁香园新浪微博
引用回复