dxy logo
首页丁香园病例库全部版块
搜索
登录

MIMIC-IV,重症医学数据库介绍和使用说明

发布于 2023-07-12 · 浏览 9422 · IP 江苏江苏
这个帖子发布于 1 年零 294 天前,其中的信息可能已发生改变或有所发展。
icon200750383、做科研的大师兄 2人推荐
icon200750383 +10丁当
img


mimic数据库使用介绍:

MIMIC-IV,重症医学数据库介绍和使用说明

MIMIC数据库下载权限申请保姆级教程(上)

MIMIC数据库下载权限申请保姆级教程(下)

CITI 课程考试补充答案

​CITI 课程考试补充答案(二)


MIMIC数据库安装保姆级教程(上)

MIMIC数据库安装保姆级教程(下)

安装常见问题(一)

安装常见问题(二)

MIMIC-IV数据库安装常见问题(三)


MIMIC数据库,常用查询指令SQL基础(一)

MIMIC数据库提取教程-提取某种疾病下的实验室指标

MIMIC数据库提取教程-提取某种疾病下的患者人口统计学指标

MIMIC数据库官方函数的安装与使用

手把手教会你认识跟安装MIMIC-IV物化视图

【重要】 MIMIC数据集直接下载!

Python连接MIMIC-IV数据库并图表可视化

MIMIC-IV数据库衍生表格mimic_derived配置和使用

MIMIC-IV 数据查询加速教程


一、MIMIC IV数据库简介

MIMIC数据库就是一个可为临床研究者提供临床数据的利器。该数据库于2003年在美国国立卫生研究院的资助下,由美国麻省理工学院计算生理学实验室、美国哈佛医学院贝斯以色列女执事医疗中心(Beth Israel Deaconess Medical Center,BIDMC)和飞利浦医疗公司共同建立。

研究者可根据一定的纳排标准筛选感兴趣患者的临床信息,利用这些信息可进行后续的数据分析然后撰写文章,通过数据收集与分析可作为发表sci论文的重要依据。另外,MIMIC是一个公开数据库,所有患者的信息都经过脱敏处理,发文不需要临床伦理审查。

以下各类疾病都有涉及:

img



二、数据库样本量

MIMIC 数据库目前已经产生了MIMIC Ⅱ、Ⅲ、Ⅳ三个版本 MIMIC数据库包含了BIDMC所有内外科ICU患者的数据,数据团队为保护患者隐私,对患者信息进行去标识化处理,向全世界的研究人员免费开放。

MIMIC Ⅲ数据库收集了BIDMC 2001年6月至2012年10月ICU收治的53423例成年患者数据和2001年至2008年收治的7870例新生儿重症患者数据。

img



MIMIC Ⅳ数据库在MIMIC Ⅲ的基础上做了一些改进,包括数据更新和部分表格重构,收集了 2008至2019年BIDMC收治的超过19万名患者、45万次住院记录的临床数据。数据库记录了患者的人口统计学信息、实验室检查、用药情况、生命体征、手术操作、疾病诊断、药物管理、随访生存状态等详细信息。

img



MIMIC Ⅳ数据库主要有三类数据:

第一类是从EHR中提取的临床数据,包括患者的人口统计学、疾病诊断、实验室检测、药物治疗、生命体征等。

第二类是ICU床旁监护设备采集的波形数据、生命体征、液体管理和事件记录,主要来自于IMDSoft MetaVision系统。

第三类是死亡随访数据,通过社会保险系统得到患者院外死亡的日期,作为MIMIC 数据库的组成部分,这部分数据对研究患者的预后很重要。

img



三、 基本字段表述

患者入院信息, 以每次入院为单位记录, 每条记录有一个单独的hadm_id, hospital_expire_flag只当次住院是否院内死亡, 部分院内死亡患者没有deathtime, 可能是数据库本身问题

img

病人定义:

subject_id 每个患者有唯一的subject_id

hadm_id 患者的每一次入院会有一个唯一的hadm_id

transfer_id 患者每一次更换病房会有一个唯一的transfer_id

stay_id 在相同类型病房内进行转移,则会更新一个transfer_id,但会有相同的stay_id,例如用ICU中的一个病房转移到另一个病房,则stay_id不变,transfer_id更新。 

所有id的分配都是随机的,与时间先后无关。

date and time

后缀为date的,分辨率最低为天;后缀为timed的字段,分辨率最低为分钟。

charttime and storetime:分别是测量的记录时间与储存时间。通常以charttime为准 d and icd 命名为d_开头,为编码表。d_icd开头,为icd编码表。icd结尾的表,为使用icd编码的记录表。

四、MIMIC-IV数据表说明

Tables

分为六个模块,Core、Hosp、ICU、ED、CXR、Note

Core

Core模块包含患者跟踪数据。这里描述了人口统计、入院信息和住院病房转院情况

admission 患者入院信息,以每次入院为单位记录,每条记录有一个单独的hadm_id

patient 患者信息

transfers 病房转移信息

Hosp

Hosp模块涵盖的信息包括实验室测量,微生物学,药物管理,和收费诊断等

d_icd_diagnoses 包含国际疾病分类(ICD)第9版和第10版的诊断代码。icd_code一定要读取为字符串,因为开头为0是有意义的,若读取为数值会有重复,如01622和1622代表不同疾病。

img


d_icd_diagnoses表

img


icd_code一定要读取为字符串,因为开头为0是有意义的,若读取为数值会有重复

diagnoses_icd 患者诊断信息表。seq_num代表诊断的优先级,序号越靠前越重要,而低优先级的排序有时并不准确

img



drgcodes 也是与诊断相关的表,使用DiagnosisRelatedGroup(DRG)code编码 与diagnose表中的主要诊断相对应。

img



d_icd_procedures

procedures_icd 患者住院期间的手术信息,包括在ICU期间的信息。

img



img



d_labitems 实验室检查定义表

img



labevents 病人实验室检查的记录

img



prescriptions 处方数据,药物数据

img



pharmacy 药房数据表,以pharmacy_id字段与prescriptions表相关联,相当于对prescriptions表中各处方信息的补充。此外,还有微生物培养、收费、订单等表格

img



ICU

包含从ICU内使用的临床信息系统收集的信息。记录在案的数据包括静脉给药、呼吸机设置和其他图表项目等。每个患者每次入院可能有多次icu,每次icu对应一个stay_id

d_items 包含ICU内发生的所有项目的编码,通过itemid字段与ICU模块内的其他表格关联。


img



ICU stays 入住ICU的时间信息

img



chartevents Chartevents包含了一个病人可用的所有图表数据,有些lab数据与labevents表中的数据重复。

img



ED

急诊信息,包含急诊诊断,病人体征等信息。通过subject_id和hadm_id与其他模块相连接。急诊的患者如有hadm_id,则说明该患者住院治疗。ed患者不一定住院,住院的患者也不一定从急诊入院。

diagnosis table 诊断表为患者提供诊断列表。从急诊科出院后确定诊断。

edstays table 急诊科来访的主要跟踪表。它提供了病人进入急诊科和离开急诊科的时间

medrecon table 在进入急诊室时,工作人员会询问病人目前正在服用什么药物。这个过程被称为药物协调,医疗检查表存储了护理人员的调查结果

pyxis table 提供了通过pyxis系统配制药物的信息。

triage table 包含病人在急诊室第一次分诊时生命体征信息

vitalsign table 急诊室收治的病人常规的生命体征需要1-4小时。这些生命体征保存在生命体征表中

vitalsign_hl7 table 急诊收治的病人可通过遥测技术进行监测。每分钟的生命体征都被传送到医院的中央服务器,这些生命体征都被记录在这里。

CXR

X光胸片文件,源数据是dicom格式,但也提供了jpg格式的下载。包含了胸片及影像学报告。值得注意的是,存在有影像的患者没有住院记录的情况。

cxr-record-list 影像列表

cxr-study-list 影响报告列表

mimic-cxr-2.0.0-chexpert 使用CheXpert labeler(基于影像学报告的非人工标注,斯坦福与麻省理工合作)标注了14个标签,标签如下表

mimic-cxr-2.0.0-split 提供了参考的训练集、验证集、测试集划分

Note

官方还未发布 (NOT PUBLICLY AVAILABLE): 所有文本报告,出院、超声、心电、影像等报告

五、官网及数据库下载网址

官方介绍见 MIMIC官方网站 : https://mimic.mit.edu/

MIMIC-IV 数据库下载见 MIMIC-IV发布页: https://physionet.org/content/mimiciv/1.0/

X光胸片dicom格式数据下载见 MMIC-CXR Database: https://physionet.org/content/mimic-cxr/2.0.0/

X光胸片JPG格式数据见 MIMIC-CXR-JPG:https://physionet.org/content/mimic-cxr-jpg/2.0.0/

急诊数据见 MIMIC-IV-ED : 

https://physionet.org/content/mimic-iv-ed/1.0/

参考

MIMIC-IV, a freely accessible electronic health record dataset:https://www.ncbi.nlm.nih.gov/pmc/articles/PMC9810617/

Python 系列 – MIMIC-IV Demo 描述性統計:https://www.ncbi.nlm.nih.gov/pmc/articles/PMC9810617/

最后编辑于 2023-11-29 · 浏览 9422

13 120 12

全部讨论0

默认最新
avatar
13
分享帖子
share-weibo分享到微博
share-weibo分享到微信
认证
返回顶部