코로나19 Data Lake

코로나19 Data Lake에는 다양한 출처의 코로나19 관련 데이터 세트가 포함되어 있습니다. 여기에는 테스트 및 환자 결과 추적 데이터, 사회적 거리두기 정책, 병원 수용 능력, 이동성 등이 포함됩니다.

참고 항목

Microsoft는 Azure Open Datasets를 “있는 그대로” 제공합니다. Microsoft는 귀하의 데이터 세트 사용과 관련하여 어떠한 명시적이거나 묵시적인 보증, 보장 또는 조건을 제공하지 않습니다. 귀하가 거주하는 지역의 법규가 허용하는 범위 내에서 Microsoft는 귀하의 데이터 세트 사용으로 인해 발생하는 일체의 직접적, 결과적, 특별, 간접적, 부수적 또는 징벌적 손해 또는 손실을 비롯한 모든 손해 또는 손실에 대한 모든 책임을 부인합니다.

이 데이터 세트는 Microsoft가 원본 데이터를 받은 원래 사용 약관에 따라 제공됩니다. 데이터 세트에는 Microsoft가 제공한 데이터가 포함될 수 있습니다.

코로나19 데이터 레이크는 미국 동부 지역의 Azure Data Lake Storage에서 호스트됩니다. 각 데이터 세트에 대해 csv, json, json-lines, parquet 형식으로 수정된 버전도 사용할 수 있습니다. 원시 데이터도 수집된 형태로 사용할 수 있습니다.

조인을 간소화하기 위해 원래 포함되지 않은 ISO 3166 하위 코드가 추가됩니다. 열 이름의 서식은 밑줄 구분 기호가 포함된 소문자로 다시 지정되었습니다. 데이터 세트는 매일 업데이트되며 수정된 원시 파일의 기록 복사본도 사용 가능합니다.

데이터 집합

데이터 집합 설명
Bing 코로나19 데이터 Bing 코로나19 데이터에는 모든 지역의 확진, 사망 및 완치 사례가 포함되며, 이 데이터는 매일 업데이트됩니다.
코로나 추적 프로젝트 COVID Tracking Project 데이터 세트는 미국 전 지역 및 영토의 최신 검사 수, 확인된 사례, 입원, 환자 결과를 제공합니다.
ECDC(European Center for Disease Prevention and Control) 코로나19 사례 ECDC(European Center for Disease Prevention and Control)에서 제공하는 전 세계 코로나19의 지역 전파에 대한 사용 가능한 최신 공개 데이터입니다. 각 행/항목에는 일별 및 국가 또는 지역별로 보고되는 신규 사례 건수가 포함되어 있습니다.
Oxford COVID-19 Government Response Tracker OxCGRT(Oxford Covid-19 Government Response Tracker) 데이터 세트는 어떤 정부가 어떤 조치를 언제 취했는지에 대한 체계적 정보를 포함합니다.

다음 단계

Open Datasets 카탈로그에서 나머지 데이터 세트를 봅니다.