Bagikan melalui


Kasus COVID-19 Pusat Pencegahan dan Pengendalian Penyakit Eropa (ECDC)

Data publik terbaru yang tersedia tentang distribusi geografis kasus COVID-19 di seluruh dunia dari Pusat Pencegahan dan Pengendalian Penyakit Eropa (ECDC). Setiap baris/entri berisi jumlah kasus baru yang dilaporkan per hari dan per negara atau wilayah.

Catatan

Microsoft menyediakan Azure Open Datasets berdasarkan "apa adanya". Microsoft tidak memberikan jaminan, tersurat maupun tersirat, jaminan atau ketentuan sehubungan dengan penggunaan Anda atas himpunan data. Sejauh diizinkan menurut undang-undang setempat Anda, Microsoft melepaskan semua tanggung jawab atas segala kerusakan atau kerugian, termasuk langsung, konsekuensial, khusus, tidak langsung, insidental, atau hukuman, yang diakibatkan oleh penggunaan Anda atas kumpulan data.

Kumpulan data ini disediakan di bawah ketentuan asli yang diterima Microsoft data sumbernya. Himpunan data mungkin menyertakan data yang bersumber dari Microsoft.

Himpunan data

Versi himpunan data yang dimodifikasi tersedia di CSV, JSON, JSON-Lines, dan Parquet, diperbarui setiap hari:

Semua versi yang dimodifikasi memiliki kode iso_country_region dan waktu muat yang ditambahkan, serta menggunakan nama kolom berhuruf kecil dengan pemisah garis bawah.

Data mentah: https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/ecdc_cases/latest/ECDCCases.csv

Versi sebelumnya dari data yang dimodifikasi dan data mentah: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/ecdc_cases/

Volume data

Hingga 28 Mei 2020, himpunan data tersebut berisi 19.876 baris (CSV 1,5 MB, JSON 4,9 MB, JSONL 4,9 MB, Parquet 54,1 KB).

Sumber data

Data mentah diserap setiap hari dari file csv ECDC. Untuk informasi selengkapnya tentang himpunan data ini, termasuk asal-usulnya, lihat halaman kumpulan data ECDC.

Kualitas data

ECDC tidak menjamin keakuratan atau ketepatan waktu data. Baca pengelakannya.

Atribusi lisensi dan hak penggunaan

Data ini tersedia dan dapat digunakan sebagaimana diizinkan berdasarkan kebijakan hak cipta ECDC. Untuk dokumen apa pun di mana hak cipta ada pada pihak ketiga, izin untuk reproduksi harus diperoleh dari pemilik hak cipta.

ECDC harus selalu diakui sebagai sumber asli data ini. Pengakuan tersebut harus disertakan dalam setiap salinan materi.

Kontak

Untuk pertanyaan atau umpan balik tentang himpunan data ini atau himpunan data lainnya di Data Lake COVID-19, hubungi askcovid19dl@microsoft.com.

Kolom

Nama Jenis data Unik Nilai (sampel) Deskripsi
kasus smallint 5.515 1 2 Jumlah kasus yang dilaporkan
continent_exp string 6 Eropa Afrika Nama benua
countries_and_territories string 214 Kanada Belgia Nama negara atau wilayah
country_territory_code string 213 KOR ISL Negara atau kode wilayah tiga huruf
date_rep date 350 11-12-2020 22-11-2020 Tanggal laporan
hari smallint 31 14 13 Hari dalam sebulan
kematian smallint 1.049 1 2 Jumlah kematian yang dilaporkan
geo_id string 214 CA SE Pengidentifikasi lokasi geografis
iso_country string 214 SE US Kode negara atau kawasan ISO 3166
load_date rentang waktu 1 26-04-2021 00:06:22.123000 Tanggal data dimuat ke Azure
month smallint 12 10 8 Jumlah bulan
tahun smallint 2 2020 2019 Tahun

Pratinjau

date_rep hari month tahun kasus kematian countries_and_territories geo_id country_territory_code continent_exp load_date iso_country
14-12-2020 14 12 2020 746 6 Afganistan AF AFG Asia 26/4/2021 Pukul 12:06:22 AF
13-12-2020 13 12 2020 298 9 Afganistan AF AFG Asia 26/4/2021 Pukul 12:06:22 AF
12-12-2020 12 12 2020 113 11 Afganistan AF AFG Asia 26/4/2021 Pukul 12:06:22 AF
11-12-2020 11 12 2020 63 10 Afganistan AF AFG Asia 26/4/2021 Pukul 12:06:22 AF
10-12-2020 10 12 2020 202 16 Afganistan AF AFG Asia 26/4/2021 Pukul 12:06:22 AF
09-12-2020 9 12 2020 135 13 Afganistan AF AFG Asia 26/4/2021 Pukul 12:06:22 AF
08-12-2020 8 12 2020 200 6 Afganistan AF AFG Asia 26/4/2021 Pukul 12:06:22 AF
2020-12-07 7 12 2020 210 26 Afganistan AF AFG Asia 26/4/2021 Pukul 12:06:22 AF
06-12-2020 6 12 2020 234 10 Afganistan AF AFG Asia 26/4/2021 Pukul 12:06:22 AF
05-12-2020 5 12 2020 235 18 Afganistan AF AFG Asia 26/4/2021 Pukul 12:06:22 AF

Akses data

Azure Notebooks

Buku catatan ini mendokumentasikan URL dan kode sampel untuk mengakses URL himpunan data Kasus Covid-19 Pusat Pencegahan dan Pengendalian Penyakit Eropa (ECDC) dari berbagai format file himpunan data yang dihost di Azure Blob Storage:ΒΆ CSV: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.csv

JSON: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.json

JSONL: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.jsonl

Parquet: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.parquet

Mengunduh file himpunan data menggunakan kemampuan pengunduhan bawaan dari URL http di Pandas. Pandas memiliki pembaca untuk berbagai format file:

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_parquet.html

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html

import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt

df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.parquet")
df.head(10)

df.dtypes

df.groupby('countries_and_territories').first().filter(['continent_exp','cases', 'deaths','date_rep'])

df.groupby('continent_exp').agg({'countries_and_territories': 'count','cases': 'count','deaths': 'count'})

import plotly.graph_objects as go
import plotly.express as px
import matplotlib.pyplot as plt

df.loc[: , ['countries_and_territories', 'cases', 'deaths']].groupby(['countries_and_territories'
         ]).max().sort_values(by='cases',ascending=False).reset_index()[:15].style.background_gradient(cmap='rainbow')

df_Worldwide=df[df['countries_and_territories']=='United_States_of_America']

df.plot(kind='line',x='date_rep',y="cases",grid=True)
df.plot(kind='line',x='date_rep',y="deaths",grid=True)
#df_Worldwide.plot(kind='line',x='date_rep',y="confirmed_change",grid=True)
#df_Worldwide.plot(kind='line',x='date_rep',y="deaths_change",grid=True)

Azure Databricks

Sampel tidak tersedia untuk kombinasi platform/paket ini.

Azure Synapse

Sampel tidak tersedia untuk kombinasi platform/paket ini.

Contoh

Lihat contoh cara himpunan data ini digunakan:

Langkah berikutnya

Lihat himpunan data lainnya di katalog Open Datasets.