COVID-19-Fälle des Europäischen Zentrums für die Prävention und die Kontrolle von Krankheiten l (ECDC)

Hier finden Sie die aktuell verfügbaren öffentlichen Daten zur geografischen Verbreitung der COVID-19-Fälle weltweit, die vom Europäischen Zentrum für die Prävention und die Kontrolle von Krankheiten (European Centre for Disease Prevention and Control, ECDC) stammen. Jede Zeile bzw. jeder Eintrag enthält die Anzahl der neu gemeldeten Fälle pro Tag und Land oder Region.

Hinweis

Microsoft stellt Datasets der Plattform Azure Open Datasets auf einer „As is“-Basis (d. h. ohne Mängelgewähr) zur Verfügung. Microsoft übernimmt weder ausdrücklich noch stillschweigend die Gewährleistung für Ihre Nutzung der Datasets und sichert keinerlei Garantien oder Bedingungen zu. Soweit nach örtlich anwendbarem Recht zulässig, lehnt Microsoft jegliche Haftung für Schäden oder Verluste ab. Dies schließt direkte, indirekte, besondere oder zufällige Schäden oder Verluste sowie Folge- und Strafschäden und damit verbundene Verluste ein, die sich aus Ihrer Nutzung der Datasets ergeben.

Für die Bereitstellung dieses Datasets gelten die ursprünglichen Nutzungsbedingungen, unter denen Microsoft die Quelldaten bezogen hat. Das Dataset kann Daten von Microsoft enthalten.

Datasets

Geänderte Versionen des Datasets sind im CSV-, JSON-, JSONL- und Parquet-Format verfügbar. Sie werden täglich aktualisiert:

Allen geänderten Datasets wurden iso_country_region-Codes und Ladezeiten hinzugefügt. Außerdem wurden die Spaltennamen in Kleinbuchstaben umformatiert und mit Unterstrichen versehen.

Rohdaten: https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/ecdc_cases/latest/ECDCCases.csv

Vorgängerversionen der geänderten Daten und Rohdaten: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/ecdc_cases/

Datenvolumen

Nach Stand des 28. Mai 2020 enthalten diese 19.876 Zeilen (CSV: 1,5 MB, JSON: 4,9 MB, JSONL: 4,9 MB, Parquet: 54,1 KB).

Datenquellen-

Die Rohdaten werden täglich aus der ECDC-CSV-Datei übernommen. Weitere Informationen zu diesem Dataset, einschließlich seiner Ursprünge, finden Sie auf der Seite derECDC-Datensammlungen.

Datenqualität

Das ECDC übernimmt keine Garantie für die Genauigkeit oder Aktualität der Daten. Lesen Sie den Haftungsausschluss.

Anerkennung der Lizenzbedingungen und Nutzungsrechte

Diese Daten wurden unter Einhaltung der hier einsehbaren ECDC-Urheberrechtrichtlinie veröffentlicht und dürfen nur in Übereinstimmung mit dieser verwendet werden. Wenn das Urheberrecht an einem Dokument bei einem Dritten liegt, müssen Sie die Erlaubnis zur Vervielfältigung beim Inhaber des Urheberrechts einholen.

Das ECDC muss immer als ursprüngliche Quelle dieser Daten angegeben werden. Diese Bestätigung muss in jeder Kopie dieser Materialien vorhanden sein.

Contact

Wenden Sie sich bei Fragen oder Feedback zu diesem Dataset oder anderen Datasets im Data Lake zu COVID-19 an askcovid19dl@microsoft.com.

Spalten

Name Datentyp Eindeutig Beispielwerte BESCHREIBUNG
cases SMALLINT 5,515 1 2 Anzahl gemeldeter Fälle
continent_exp Zeichenfolge 6 Europa, Afrika Name des Kontinents
countries_and_territories Zeichenfolge 214 Kanada, Belgien Name des Landes oder Gebiets
country_territory_code Zeichenfolge 213 KOR, ISL Aus drei Buchstaben bestehender Länder- oder Gebietscode
date_rep date 350 2020-12-11 2020-11-22 Datum der Meldung
day SMALLINT 31 14 13 Tag des Monats
Todesfälle SMALLINT 1,049 1 2 Anzahl gemeldeter Todesfälle
geo_id Zeichenfolge 214 CA SE Geografischer Bezeichner
iso_country Zeichenfolge 214 SE US Landes- oder Regionscode gemäß ISO 3166
load_date timestamp 1 2021-04-26 00:06:22.123000 Uploaddatum der Daten in Azure
month SMALLINT 12 10 8 Monatsnummer
year SMALLINT 2 2020 2019 Jahr

Vorschau

date_rep day month year cases Todesfälle countries_and_territories geo_id country_territory_code continent_exp load_date iso_country
2020-12-14 14 12 2020 746 6 Afghanistan AF AFG Asien 4/26/2021 00:06:22 Uhr AF
2020-12-13 13 12 2020 298 9 Afghanistan AF AFG Asien 4/26/2021 00:06:22 Uhr AF
2020-12-12 12 12 2020 113 11 Afghanistan AF AFG Asien 4/26/2021 00:06:22 Uhr AF
2020-12-11 11 12 2020 63 10 Afghanistan AF AFG Asien 4/26/2021 00:06:22 Uhr AF
2020-12-10 10 12 2020 202 16 Afghanistan AF AFG Asien 4/26/2021 00:06:22 Uhr AF
2020-12-09 9 12 2020 135 13 Afghanistan AF AFG Asien 4/26/2021 00:06:22 Uhr AF
2020-12-08 8 12 2020 200 6 Afghanistan AF AFG Asien 4/26/2021 00:06:22 Uhr AF
2020-12-07 7 12 2020 210 26 Afghanistan AF AFG Asien 4/26/2021 00:06:22 Uhr AF
2020-12-06 6 12 2020 234 10 Afghanistan AF AFG Asien 4/26/2021 00:06:22 Uhr AF
2020-12-05 5 12 2020 235 18 Afghanistan AF AFG Asien 4/26/2021 00:06:22 Uhr AF

Datenzugriff

Azure Notebooks

Dieses Notebook dokumentiert die URLs und den Beispielcode für den Zugriff auf die Dataset-URLs des Europäischen Zentrums für die Prävention und die Kontrolle von Krankheiten (ECDC) zu COVID-19-Fällen verschiedener Dataset-Dateiformate, die in Azure Blob Storage gehostet werden: CSV: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.csv

JSON: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.json

JSONL: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.jsonl

Parquet: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.parquet

Laden Sie die Dataset-Datei mithilfe des integrierten Funktionsdownloads in Pandas anhand der HTTP-URL herunter. Pandas verfügt über Reader für verschiedene Dateiformate:

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_parquet.html

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html

import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt

df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.parquet")
df.head(10)

df.dtypes

df.groupby('countries_and_territories').first().filter(['continent_exp','cases', 'deaths','date_rep'])

df.groupby('continent_exp').agg({'countries_and_territories': 'count','cases': 'count','deaths': 'count'})

import plotly.graph_objects as go
import plotly.express as px
import matplotlib.pyplot as plt

df.loc[: , ['countries_and_territories', 'cases', 'deaths']].groupby(['countries_and_territories'
         ]).max().sort_values(by='cases',ascending=False).reset_index()[:15].style.background_gradient(cmap='rainbow')

df_Worldwide=df[df['countries_and_territories']=='United_States_of_America']

df.plot(kind='line',x='date_rep',y="cases",grid=True)
df.plot(kind='line',x='date_rep',y="deaths",grid=True)
#df_Worldwide.plot(kind='line',x='date_rep',y="confirmed_change",grid=True)
#df_Worldwide.plot(kind='line',x='date_rep',y="deaths_change",grid=True)

Azure Databricks

Für diese Kombination aus Plattform und Paket ist kein Beispiel verfügbar.

Azure Synapse

Für diese Kombination aus Plattform und Paket ist kein Beispiel verfügbar.

Beispiele

Sehen Sie sich Beispiele für die Verwendung dieses Datasets an:

Nächste Schritte

Machen Sie sich mit den restlichen Datasets im Open Datasets-Katalog vertraut.