여러 분야에서 공개 데이터셋이 있듯 의료분야에도 공개 데이터셋이 있다. 다른 도메인만큼 다양하진 않지만 가뭄의 콩나듯 있다..
가장 유명한 MIMIC도 있고, 수술중의 생체신호 데이터와 관련된 vitaldb도 있다.
오늘 소개해드릴 공개데이터셋은 eicu에 대한 데이터셋이다.
보통 eicu-crd라고 부르며 208개 센터의 약 20만명 환자들의 demo, lab, vital 등의 데이터가 담겨져 있다.
Overview of the eICU data
The eICU Collaborative Database is a collection of tables relating to patients who were treated as part of the Philips eICU program across intensive care units in the United States. The tables are linked by a set of identifiers, such as patientunitstayid which uniquely identifies a single ICU stay and hospitalid which uniquely identifies a hospital.
데이터 포맷은 .parquet 이므로 pd.read_parquet()와 pd.to_parquet()로 읽고 저장할 수 있다.
eicu-crd 사이트: https://eicu-crd.mit.edu/
반응형