巴拉巴

 找回密码
 立即注册

站内搜索

搜索
热搜: 活动 交友 discuz
查看: 10|回复: 0

MIMIC-IV,重症医学数据库介绍和使用说明

[复制链接]

4

主题

9

帖子

21

积分

新手上路

Rank: 1

积分
21
发表于 2023-7-14 11:58:50 | 显示全部楼层 |阅读模式
MIMIC数据库就是一个可为临床研究者提供临床数据的利器。该数据库于2003年在美国国立卫生研究院的资助下,由美国麻省理工学院计算生理学实验室、美国哈佛医学院贝斯以色列女执事医疗中心(Beth Israel Deaconess Medical Center,BIDMC)和飞利浦医疗公司共同建立。
研究者可根据一定的纳排标准筛选感兴趣患者的临床信息,利用这些信息可进行后续的数据分析然后撰写文章,通过数据收集与分析可作为发表sci论文的重要依据。另外,MIMIC是一个公开数据库,所有患者的信息都经过脱敏处理,发文不需要临床伦理审查。
以下各类疾病都有涉及:
MIMIC 数据库目前已经产生了MIMIC Ⅱ、Ⅲ、Ⅳ三个版本 MIMIC数据库包含了BIDMC所有内外科ICU患者的数据,数据团队为保护患者隐私,对患者信息进行去标识化处理,向全世界的研究人员免费开放。
MIMIC Ⅲ数据库收集了BIDMC 2001年6月至2012年10月ICU收治的53423例成年患者数据和2001年至2008年收治的7870例新生儿重症患者数据。
MIMIC Ⅳ数据库在MIMIC Ⅲ的基础上做了一些改进,包括数据更新和部分表格重构,收集了 2008至2019年BIDMC收治的超过19万名患者、45万次住院记录的临床数据。数据库记录了患者的人口统计学信息、实验室检查、用药情况、生命体征、手术操作、疾病诊断、药物管理、随访生存状态等详细信息。
MIMIC Ⅳ数据库主要有三类数据:
第一类是从EHR中提取的临床数据,包括患者的人口统计学、疾病诊断、实验室检测、药物治疗、生命体征等。
第二类是ICU床旁监护设备采集的波形数据、生命体征、液体管理和事件记录,主要来自于IMDSoft MetaVision系统。
第三类是死亡随访数据,通过社会保险系统得到患者院外死亡的日期,作为MIMIC 数据库的组成部分,这部分数据对研究患者的预后很重要。
患者入院信息, 以每次入院为单位记录, 每条记录有一个单独的hadm_id, hospital_expire_flag只当次住院是否院内死亡, 部分院内死亡患者没有deathtime, 可能是数据库本身问题
subject_id 每个患者有唯一的subject_id
hadm_id 患者的每一次入院会有一个唯一的hadm_id
transfer_id 患者每一次更换病房会有一个唯一的transfer_id
stay_id 在相同类型病房内进行转移,则会更新一个transfer_id,但会有相同的stay_id,例如用ICU中的一个病房转移到另一个病房,则stay_id不变,transfer_id更新。
所有id的分配都是随机的,与时间先后无关。
date and time
后缀为date的,分辨率最低为天;后缀为timed的字段,分辨率最低为分钟。
charttime and storetime:分别是测量的记录时间与储存时间。通常以charttime为准 d and icd 命名为d_开头,为编码表。d_icd开头,为icd编码表。icd结尾的表,为使用icd编码的记录表。
分为六个模块,Core、Hosp、ICU、ED、CXR、Note
Core模块包含患者跟踪数据。这里描述了人口统计、入院信息和住院病房转院情况
admission 患者入院信息,以每次入院为单位记录,每条记录有一个单独的hadm_id
patient 患者信息
transfers 病房转移信息
HospHosp模块涵盖的信息包括实验室测量,微生物学,药物管理,和收费诊断等
d_icd_diagnoses 包含国际疾病分类(ICD)第9版和第10版的诊断代码。icd_code一定要读取为字符串,因为开头为0是有意义的,若读取为数值会有重复,如01622和1622代表不同疾病。
d_icd_diagnoses表
icd_code一定要读取为字符串,因为开头为0是有意义的,若读取为数值会有重复
diagnoses_icd 患者诊断信息表。seq_num代表诊断的优先级,序号越靠前越重要,而低优先级的排序有时并不准确
drgcodes 也是与诊断相关的表,使用DiagnosisRelatedGroup(DRG)code编码 与diagnose表中的主要诊断相对应。
d_icd_procedures
procedures_icd 患者住院期间的手术信息,包括在ICU期间的信息。
d_labitems 实验室检查定义表
labevents 病人实验室检查的记录
prescriptions 处方数据,药物数据
pharmacy 药房数据表,以pharmacy_id字段与prescriptions表相关联,相当于对prescriptions表中各处方信息的补充。此外,还有微生物培养、收费、订单等表格
ICU包含从ICU内使用的临床信息系统收集的信息。记录在案的数据包括静脉给药、呼吸机设置和其他图表项目等。每个患者每次入院可能有多次icu,每次icu对应一个stay_id
d_items 包含ICU内发生的所有项目的编码,通过itemid字段与ICU模块内的其他表格关联。
ICU stays 入住ICU的时间信息
chartevents Chartevents包含了一个病人可用的所有图表数据,有些lab数据与labevents表中的数据重复。
ED急诊信息,包含急诊诊断,病人体征等信息。通过subject_id和hadm_id与其他模块相连接。急诊的患者如有hadm_id,则说明该患者住院治疗。ed患者不一定住院,住院的患者也不一定从急诊入院。
diagnosis table 诊断表为患者提供诊断列表。从急诊科出院后确定诊断。
edstays table 急诊科来访的主要跟踪表。它提供了病人进入急诊科和离开急诊科的时间
medrecon table 在进入急诊室时,工作人员会询问病人目前正在服用什么药物。这个过程被称为药物协调,医疗检查表存储了护理人员的调查结果
pyxis table 提供了通过pyxis系统配制药物的信息。
triage table 包含病人在急诊室第一次分诊时生命体征信息
vitalsign table 急诊室收治的病人常规的生命体征需要1-4小时。这些生命体征保存在生命体征表中
vitalsign_hl7 table 急诊收治的病人可通过遥测技术进行监测。每分钟的生命体征都被传送到医院的中央服务器,这些生命体征都被记录在这里。
CXRX光胸片文件,源数据是dicom格式,但也提供了jpg格式的下载。包含了胸片及影像学报告。值得注意的是,存在有影像的患者没有住院记录的情况。
cxr-record-list 影像列表
cxr-study-list 影响报告列表
mimic-cxr-2.0.0-chexpert 使用CheXpert labeler(基于影像学报告的非人工标注,斯坦福与麻省理工合作)标注了14个标签,标签如下表
mimic-cxr-2.0.0-split 提供了参考的训练集、验证集、测试集划分
Note官方还未发布 (NOT PUBLICLY AVAILABLE): 所有文本报告,出院、超声、心电、影像等报告
官方介绍见 MIMIC官方网站 : https://mimic.mit.edu/
MIMIC-IV 数据库下载见 MIMIC-IV发布页: https://physionet.org/content/mimiciv/1.0/
X光胸片dicom格式数据下载见 MMIC-CXR Database: https://physionet.org/content/mimic-cxr/2.0.0/
X光胸片JPG格式数据见 MIMIC-CXR-JPG:https://physionet.org/content/mimic-cxr-jpg/2.0.0/
急诊数据见 MIMIC-IV-ED :
参考

MIMIC-IV, a freely accessible electronic health record dataset:https://www.ncbi.nlm.nih.gov/pmc/articles/PMC9810617/
Python 系列 – MIMIC-IV Demo 描述性統計:https://www.ncbi.nlm.nih.gov/pmc/articles/PMC9810617/
临床数据库挖掘(MIMIC、NHANES),医学统计,医疗数据分析

来源:http://www.yidianzixun.com/article/0peynSSb
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

  • 返回顶部