MIMIC数据库SCI论文分析(对MIMIC-IV数据库的回顾性分析)
在上一篇教程中,笔者已经教了大家如何过滤患者的年龄以及筛选患者的首次入院记录,
原文链接在:MIMI数据库SCI论文分析(获取特定年龄段的患者的首次入院记录)
在这一篇教程中,我会基于上一篇教程,教大家如何筛选符合条件的患者。
我们分析的是一篇利用MIMIC数据库发表的SCI论文,这是一篇2022年12月份发表在《Inflammation》期刊上的论文。
论文名为《Association between lactate-to-albumin ratio and 28-days all-cause mortality in patients with acute pancreatitis: A retrospective analysis of the MIMIC-IV database.》
中文名为《急性胰腺炎患者乳酸白蛋白比值与28天内全因死亡率的关系:对MIMIC-IV数据库的回顾性分析》
如果大家暂时没有安装MIMIC数据库,可以参考这篇教程直接使用MIMIC数据库:

该论文筛选患者的标准如下:

1,获取某种疾病的患者
患者的诊断记录都记录在mimiciv_hosp.diagnoses_icd表中,该表记录了患者的入院ID(hamd_id),以及诊断编码(icd_code)

icd_code与疾病的对应关系都记录在mimiciv_hosp.d_icd_diagnoses表中

因为mimic中的疾病只记录了英文,所以需要把英文翻译成中文,我比较喜欢使用Deel网站进行翻译,这个网站翻译医疗相关的词汇还是很不错的。

获取到疾病对应的英文之后,我们就可以根据英文查出icd_code了。

由上图所知,通过关键字“pancreatitis”会查出很多icd_code,那么如何确定哪个icd_code才是我们真正需要的呢,这里有一个很重要的原则,我们一般只研究患者数量多的疾病,所以我们可以根据某个icd_code的患者数量确定我们真正需要的icd_code,为此我单独生成了一张患者人数汇总表,通过这张表可以很方便的定位到我们需要的icd_code。

从上图可知,5770这个icd_code的患者总人数为4017人,是最多的,结合疾病描述可以知道,这个icd_code就是我们需要的疾病编码。
该汇总表对确定icd_code非常方便,官方数据库并没有这张表(教程末有获取方式)
有了icd_code之后,我们就可以根据这个编码获取“急性胰腺炎”患者了

同一个患者可能会有多个入院ID,但是我们分析的这篇SCI论文只取了患者的首次入ICU记录,我们可以结合官方的mimiciv_derived.icustay_detail表(这个表就是根据我上一篇教程计算出来的),获取这些患者的首次入icu对应的入院ID。

以上我们就找出了“急性胰腺炎”患者的首次入ICU的记录。
2,获取ICU停留时间
患者在ICU的停留时间也可以通过mimiciv_derived.icustay_detail直接获取。

以上我们就获取到了在ICU停留时间大于1天的患者。
3,获取入ICU24小时内的检查指标
首先获取检查指标对应的编码,实验室指标字典表为mimiciv_hosp.d_labitems

根据指标名称查询指标编码

从上图可知,根据指标查询指标编码,也会查出多个编码,这时我们就需要甄别哪个编码才是我们需要的编码,我们只需要遵循一个原则就可以,即相同指标名称的情况下,哪个指标患者的检查人数最多,那我们就取那个指标。
我专门生成了一张指标患者人数汇总表,根据这张表就可以直接确定我们需要的指标编码。(教程末有获取汇总表方式)

由上图可知,乳酸对应的itemid为50813,同理可以得出白蛋白对应的itemid为50862。

获取入ICU24小时内做过乳酸跟白蛋白检查的患者,官方给出的获取24小时检查指标的方法为,判断指标检查的时间是否在入ICU前6个小时,到入ICU后一天之间的范围,只要在这个时间范围内做过的检查,都可以算做是入ICU24小时内做的检查。
这时需要使用到官方提供的时间计算函数:mimiciv_derived.DATETIME_SUB跟mimiciv_derived.DATETIME_ADD

以上我们就可以筛选出来患“急性胰腺炎”患者并且入ICU时间大于一天,并且24小时内做过“乳酸”跟“白蛋白”检查的首次入ICU记录。
教程中使用到的代码及论文可在以下地址下载:
最后编辑于 2023-08-18 · 浏览 1627