Europejskie Centrum Zapobiegania Chorobom i Kontroli (ECDC) Przypadki COVID-19

Najnowsze dostępne publiczne dane dotyczące dystrybucji geograficznej przypadków COVID-19 na całym świecie z Europejskiego Centrum Zapobiegania Chorobom i Kontroli (ECDC). Każdy wiersz/wpis zawiera liczbę nowych przypadków z podziałem na dzień i kraj lub region.

Uwaga

Firma Microsoft udostępnia zestawy danych Azure Open Datasets w zasadzie "tak jak to jest". Firma Microsoft nie udziela żadnych gwarancji, wyraźnych lub domniemanych, gwarancji ani warunków w odniesieniu do korzystania z zestawów danych. W zakresie dozwolonym na mocy prawa lokalnego firma Microsoft nie ponosi odpowiedzialności za wszelkie szkody lub straty, w tym bezpośrednie, wynikowe, specjalne, pośrednie, przypadkowe lub karne wynikające z korzystania z zestawów danych.

Zestaw danych jest udostępniany zgodnie z pierwotnymi warunkami, na jakich firma Microsoft otrzymała dane źródłowe. Zestaw danych może zawierać dane pozyskane z firmy Microsoft.

Zestawy danych

Zmodyfikowane wersje zestawu danych są dostępne w formatach CSV, JSON, JSON-Lines i Parquet (aktualizowane codziennie):

Wszystkie zmodyfikowane wersje mają dodane kody iso_country_region i czasy ładowania oraz używają nazw kolumn pisanych małymi literami z separatorami w postaci znaków podkreślenia.

Dane pierwotne: https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/ecdc_cases/latest/ECDCCases.csv

Poprzednie wersje zmodyfikowanych i pierwotnych danych: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/ecdc_cases/

Ilość danych

Na dzień 28 maja 2020 r. zawierały 19 876 wierszy (CSV 1,5 MB, JSON 4,9 MB, JSONL 4,9 MB, Parquet 54,1 KB).

Źródło danych

Dane pierwotne są pozyskiwane codziennie z pliku CSV ECDC. Aby uzyskać więcej informacji na temat tego zestawu danych, w tym jego pochodzenia, zobacz stronę zbierania danych ECDC.

Jakość danych

Europejskie Centrum ds. Zapobiegania i Kontroli Chorób nie gwarantuje dokładności ani stosowności danych. Przeczytaj zastrzeżenie.

Przypisywanie praw do licencji i użytkowania

Te dane są udostępniane i mogą być używane zgodnie z zasadami dotyczącymi praw autorskich Europejskiego Centrum ds. Zapobiegania i Kontroli Chorób, które można znaleźć tutaj. W przypadku wszelkich dokumentów, do których prawa autorskie mają strony trzecie, zgodę na powielanie należy uzyskać od posiadacza praw autorskich.

Zawsze należy powiadomić Europejskie Centrum ds. Zapobiegania i Kontroli Chorób, jako oryginalne źródło tych danych. Takie potwierdzenie musi być zawarte w każdej kopii materiału.

Kontakt

W razie jakichkolwiek pytań lub opinii dotyczących tego zestawu danych lub innych zestawów danych w usłudze COVID-19 Data Lake, skontaktuj się z askcovid19dl@microsoft.com.

Kolumny

Nazwa Typ danych Unikatowe Wartości (przykład) Opis
Przypadkach smallint 5,515 1 2 Liczba zgłoszonych przypadków
continent_exp ciąg 6 Europa Afryka Nazwa kontynentu
countries_and_territories ciąg 214 Kanada Belgia Nazwa kraju lub terytorium
country_territory_code ciąg 213 KOR ISL Trzyliterowy kod kraju lub terytorium
date_rep data 350 2020-12-11 2020-11-22 Data raportu
dzień smallint 31 14 13 Dzień miesiąca
Zgonów smallint 1,049 1 2 Liczba zgłoszonych zgonów
geo_id ciąg 214 URZĄD CERTYFIKACJI SE Identyfikator geograficzny
iso_country ciąg 214 SE US Kod kraju lub regionu w standardzie ISO 3166
load_date sygnatura czasowa 1 2021-04-26 00:06:22.123000 Data załadowania danych na platformę Azure
miesiąc smallint 12 10 8 Numer miesiąca
rok smallint 2 2020 2019 Year (Rok)

Wersja zapoznawcza

date_rep dzień miesiąc rok Przypadkach Zgonów countries_and_territories geo_id country_territory_code continent_exp load_date iso_country
2020-12-14 14 12 2020 746 6 Afganistan AF AFG Azja 26.04.2021 12:06:22 AF
2020-12-13 13 12 2020 298 9 Afganistan AF AFG Azja 26.04.2021 12:06:22 AF
2020-12-12 12 12 2020 113 11 Afganistan AF AFG Azja 26.04.2021 12:06:22 AF
2020-12-11 11 12 2020 63 10 Afganistan AF AFG Azja 26.04.2021 12:06:22 AF
2020-12-10 10 12 2020 202 16 Afganistan AF AFG Azja 26.04.2021 12:06:22 AF
2020-12-09 9 12 2020 135 13 Afganistan AF AFG Azja 26.04.2021 12:06:22 AF
2020-12-08 8 12 2020 200 6 Afganistan AF AFG Azja 26.04.2021 12:06:22 AF
2020-12-07 7 12 2020 210 26 Afganistan AF AFG Azja 26.04.2021 12:06:22 AF
2020-12-06 6 12 2020 234 10 Afganistan AF AFG Azja 26.04.2021 12:06:22 AF
2020-12-05 5 12 2020 235 18 Afganistan AF AFG Azja 26.04.2021 12:06:22 AF

Dostęp do danych

Azure Notebooks

Ten notes zawiera dokumenty adresów URL i przykładowego kodu umożliwiającego dostęp do europejskiego Centrum Zapobiegania Chorobom i Kontroli (ECDC) Adresy URL zestawu danych przypadków covid-19 różnych formatów plików zestawów danych hostowanych na Azure Blob Storage: CSV:https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.csv

JSON: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.json

JSONL: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.jsonl

Parkiet: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.parquet

Pobierz plik zestawu danych przy użyciu wbudowanej funkcji pobierania z adresu URL http w bibliotece Pandas. Biblioteka Pandas ma czytniki dla różnych formatów plików:

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_parquet.html

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html

import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt

df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.parquet")
df.head(10)

df.dtypes

df.groupby('countries_and_territories').first().filter(['continent_exp','cases', 'deaths','date_rep'])

df.groupby('continent_exp').agg({'countries_and_territories': 'count','cases': 'count','deaths': 'count'})

import plotly.graph_objects as go
import plotly.express as px
import matplotlib.pyplot as plt

df.loc[: , ['countries_and_territories', 'cases', 'deaths']].groupby(['countries_and_territories'
         ]).max().sort_values(by='cases',ascending=False).reset_index()[:15].style.background_gradient(cmap='rainbow')

df_Worldwide=df[df['countries_and_territories']=='United_States_of_America']

df.plot(kind='line',x='date_rep',y="cases",grid=True)
df.plot(kind='line',x='date_rep',y="deaths",grid=True)
#df_Worldwide.plot(kind='line',x='date_rep',y="confirmed_change",grid=True)
#df_Worldwide.plot(kind='line',x='date_rep',y="deaths_change",grid=True)

Azure Databricks

Przykład nie jest dostępny dla tej kombinacji platformy/pakietu.

Azure Synapse

Przykład nie jest dostępny dla tej kombinacji platformy/pakietu.

Przykłady

Zobacz przykłady użycia tego zestawu danych:

Następne kroki

Wyświetl resztę zestawów danych w katalogu Open Datasets (Otwarte zestawy danych).