Kasus COVID-19 Pusat Pencegahan dan Pengendalian Penyakit Eropa (ECDC)
Data publik terbaru yang tersedia tentang distribusi geografis kasus COVID-19 di seluruh dunia dari Pusat Pencegahan dan Pengendalian Penyakit Eropa (ECDC). Setiap baris/entri berisi jumlah kasus baru yang dilaporkan per hari dan per negara atau wilayah.
Catatan
Microsoft menyediakan Azure Open Datasets berdasarkan "apa adanya". Microsoft tidak memberikan jaminan, tersurat maupun tersirat, jaminan atau ketentuan sehubungan dengan penggunaan Anda atas himpunan data. Sejauh diizinkan menurut undang-undang setempat Anda, Microsoft melepaskan semua tanggung jawab atas segala kerusakan atau kerugian, termasuk langsung, konsekuensial, khusus, tidak langsung, insidental, atau hukuman, yang diakibatkan oleh penggunaan Anda atas kumpulan data.
Kumpulan data ini disediakan di bawah ketentuan asli yang diterima Microsoft data sumbernya. Himpunan data mungkin menyertakan data yang bersumber dari Microsoft.
Himpunan data
Versi himpunan data yang dimodifikasi tersedia di CSV, JSON, JSON-Lines, dan Parquet, diperbarui setiap hari:
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.csv
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.json
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.jsonl
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.parquet
Semua versi yang dimodifikasi memiliki kode iso_country_region dan waktu muat yang ditambahkan, serta menggunakan nama kolom berhuruf kecil dengan pemisah garis bawah.
Data mentah: https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/ecdc_cases/latest/ECDCCases.csv
Versi sebelumnya dari data yang dimodifikasi dan data mentah: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/ecdc_cases/
Volume data
Hingga 28 Mei 2020, himpunan data tersebut berisi 19.876 baris (CSV 1,5 MB, JSON 4,9 MB, JSONL 4,9 MB, Parquet 54,1 KB).
Sumber data
Data mentah diserap setiap hari dari file csv ECDC. Untuk informasi selengkapnya tentang himpunan data ini, termasuk asal-usulnya, lihat halaman kumpulan data ECDC.
Kualitas data
ECDC tidak menjamin keakuratan atau ketepatan waktu data. Baca pengelakannya.
Atribusi lisensi dan hak penggunaan
Data ini tersedia dan dapat digunakan sebagaimana diizinkan berdasarkan kebijakan hak cipta ECDC. Untuk dokumen apa pun di mana hak cipta ada pada pihak ketiga, izin untuk reproduksi harus diperoleh dari pemilik hak cipta.
ECDC harus selalu diakui sebagai sumber asli data ini. Pengakuan tersebut harus disertakan dalam setiap salinan materi.
Kontak
Untuk pertanyaan atau umpan balik tentang himpunan data ini atau himpunan data lainnya di Data Lake COVID-19, hubungi askcovid19dl@microsoft.com.
Kolom
Nama | Jenis data | Unik | Nilai (sampel) | Deskripsi |
---|---|---|---|---|
kasus | smallint | 5.515 | 1 2 | Jumlah kasus yang dilaporkan |
continent_exp | string | 6 | Eropa Afrika | Nama benua |
countries_and_territories | string | 214 | Kanada Belgia | Nama negara atau wilayah |
country_territory_code | string | 213 | KOR ISL | Negara atau kode wilayah tiga huruf |
date_rep | date | 350 | 11-12-2020 22-11-2020 | Tanggal laporan |
hari | smallint | 31 | 14 13 | Hari dalam sebulan |
kematian | smallint | 1.049 | 1 2 | Jumlah kematian yang dilaporkan |
geo_id | string | 214 | CA SE | Pengidentifikasi lokasi geografis |
iso_country | string | 214 | SE US | Kode negara atau kawasan ISO 3166 |
load_date | rentang waktu | 1 | 26-04-2021 00:06:22.123000 | Tanggal data dimuat ke Azure |
month | smallint | 12 | 10 8 | Jumlah bulan |
tahun | smallint | 2 | 2020 2019 | Tahun |
Pratinjau
date_rep | hari | month | tahun | kasus | kematian | countries_and_territories | geo_id | country_territory_code | continent_exp | load_date | iso_country |
---|---|---|---|---|---|---|---|---|---|---|---|
14-12-2020 | 14 | 12 | 2020 | 746 | 6 | Afganistan | AF | AFG | Asia | 26/4/2021 Pukul 12:06:22 | AF |
13-12-2020 | 13 | 12 | 2020 | 298 | 9 | Afganistan | AF | AFG | Asia | 26/4/2021 Pukul 12:06:22 | AF |
12-12-2020 | 12 | 12 | 2020 | 113 | 11 | Afganistan | AF | AFG | Asia | 26/4/2021 Pukul 12:06:22 | AF |
11-12-2020 | 11 | 12 | 2020 | 63 | 10 | Afganistan | AF | AFG | Asia | 26/4/2021 Pukul 12:06:22 | AF |
10-12-2020 | 10 | 12 | 2020 | 202 | 16 | Afganistan | AF | AFG | Asia | 26/4/2021 Pukul 12:06:22 | AF |
09-12-2020 | 9 | 12 | 2020 | 135 | 13 | Afganistan | AF | AFG | Asia | 26/4/2021 Pukul 12:06:22 | AF |
08-12-2020 | 8 | 12 | 2020 | 200 | 6 | Afganistan | AF | AFG | Asia | 26/4/2021 Pukul 12:06:22 | AF |
2020-12-07 | 7 | 12 | 2020 | 210 | 26 | Afganistan | AF | AFG | Asia | 26/4/2021 Pukul 12:06:22 | AF |
06-12-2020 | 6 | 12 | 2020 | 234 | 10 | Afganistan | AF | AFG | Asia | 26/4/2021 Pukul 12:06:22 | AF |
05-12-2020 | 5 | 12 | 2020 | 235 | 18 | Afganistan | AF | AFG | Asia | 26/4/2021 Pukul 12:06:22 | AF |
Akses data
Azure Notebooks
Buku catatan ini mendokumentasikan URL dan kode sampel untuk mengakses URL himpunan data Kasus Covid-19 Pusat Pencegahan dan Pengendalian Penyakit Eropa (ECDC) dari berbagai format file himpunan data yang dihost di Azure Blob Storage:ΒΆ CSV: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.csv
Mengunduh file himpunan data menggunakan kemampuan pengunduhan bawaan dari URL http di Pandas. Pandas memiliki pembaca untuk berbagai format file:
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_parquet.html
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html
import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt
df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.parquet")
df.head(10)
df.dtypes
df.groupby('countries_and_territories').first().filter(['continent_exp','cases', 'deaths','date_rep'])
df.groupby('continent_exp').agg({'countries_and_territories': 'count','cases': 'count','deaths': 'count'})
import plotly.graph_objects as go
import plotly.express as px
import matplotlib.pyplot as plt
df.loc[: , ['countries_and_territories', 'cases', 'deaths']].groupby(['countries_and_territories'
]).max().sort_values(by='cases',ascending=False).reset_index()[:15].style.background_gradient(cmap='rainbow')
df_Worldwide=df[df['countries_and_territories']=='United_States_of_America']
df.plot(kind='line',x='date_rep',y="cases",grid=True)
df.plot(kind='line',x='date_rep',y="deaths",grid=True)
#df_Worldwide.plot(kind='line',x='date_rep',y="confirmed_change",grid=True)
#df_Worldwide.plot(kind='line',x='date_rep',y="deaths_change",grid=True)
Azure Databricks
Sampel tidak tersedia untuk kombinasi platform/paket ini.
Azure Synapse
Sampel tidak tersedia untuk kombinasi platform/paket ini.
Contoh
Lihat contoh cara himpunan data ini digunakan:
- Analisis data COVID dengan titik akhir Synapse SQL tanpa server
- Analisis regresi linier pada data COVID menggunakan titik akhir SQL di Azure Synapse Analytics
Langkah berikutnya
Lihat himpunan data lainnya di katalog Open Datasets.