Europees Centrum voor ziektepreventie en -bestrijding (ECDC) COVID-19-gevallen

De meest recente openbare gegevens over de geografische spreiding van COVID-19-gevallen wereldwijd van het Europees Centrum voor ziektepreventie en -bestrijding (ECDC). Elke rij/vermelding bevat het aantal nieuwe gemelde gevallen per dag en per land of regio.

Notitie

Microsoft biedt Azure Open Datasets op een 'as is'-basis. Microsoft biedt geen garanties, expliciet of impliciet, garanties of voorwaarden met betrekking tot uw gebruik van de gegevenssets. Voor zover is toegestaan op grond van uw lokale wetgeving, wijst Microsoft alle aansprakelijkheid af voor schade of verliezen, met inbegrip van directe schade, gevolgschade, speciale, indirecte, incidentele of bestraffende schade als gevolg van uw gebruik van de gegevenssets.

Deze gegevensset wordt geleverd onder de oorspronkelijke voorwaarden dat Microsoft de brongegevens heeft ontvangen. De gegevensset kan gegevens bevatten die afkomstig zijn van Microsoft.

Gegevenssets

Gewijzigde versies van de gegevensset zijn beschikbaar als CSV, JSON, JSON-Lines en Parquet en worden dagelijks bijgewerkt:

Aan alle gewijzigde versies zijn iso_country_region-codes en laadtijden toegevoegd. Ook worden voor de gegevenssets kolomnamen in kleine letters gescheiden door onderstrepingstekens gebruikt.

Onbewerkte gegevens: https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/ecdc_cases/latest/ECDCCases.csv

Vorige versies van gewijzigde en onbewerkte gegevens: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/ecdc_cases/

Gegevensvolume

Vanaf 28 mei 2020 bevatten de gegevenssets 19876 rijen (CSV 1,5 MB, JSON 4,9 MB, JSONL 4,9 MB, Parquet 54,1 kB).

Gegevensbron

Onbewerkte gegevens worden dagelijks opgenomen uit het CSV-bestand van het ECDC. Zie de pagina voor het verzamelen van gegevens van het ECDC voor meer informatie over deze gegevensset, inclusief de oorsprong ervan.

Gegevenskwaliteit

Het Europees Centrum voor ziektepreventie en -bestrijding biedt geen garantie voor de nauwkeurigheid of tijdigheid van de gegevens. Lees de vrijwaring.

Licentie- en gebruiksrechten toewijzen

Deze gegevens worden beschikbaar gesteld en kunnen worden gebruikt zoals toegestaan ​​onder het auteursrecht van het ECDC dat hier wordt beschreven. Voor alle documenten waarvoor het auteursrecht bij een derde partij ligt, moet toestemming worden verkregen van de auteursrechthebbende.

ECDC moet altijd worden erkend als de oorspronkelijke bron van deze gegevens. Deze bevestiging moet in elk exemplaar van het materiaal worden opgenomen.

Contactpersoon

Neem contact op met askcovid19dl@microsoft.com voor vragen of feedback over deze of andere gegevenssets in de COVID-19 Data Lake.

Kolommen

Naam Gegevenstype Uniek Waarden (voorbeeld) Description
Gevallen smallint 5,515 1 2 Aantal gerapporteerde gevallen
continent_exp tekenreeks 6 Europa Afrika Naam continent
countries_and_territories tekenreeks 214 Canada België Naam van land/regio of gebied
country_territory_code tekenreeks 213 KOR ISL De code van drie letters voor land/regio of gebied
date_rep datum 350 2020-12-11 2020-11-22 De datum van het rapport
day smallint 31 14 13 Dag van maand
Sterfgevallen smallint 1,049 1 2 Aantal gerapporteerde sterfgevallen
geo_id tekenreeks 214 CA SE Id van geografisch gebied
iso_country tekenreeks 214 SE US ISO 3166-land- of regiocode
load_date tijdstempel 1 2021-04-26 00:06:22.123000 Datum waarop gegevens in Azure zijn geladen
maand smallint 12 10 8 Maandnummer
jaar smallint 2 2020 2019 Year

Preview

date_rep day maand jaar Gevallen Sterfgevallen countries_and_territories geo_id country_territory_code continent_exp load_date iso_country
2020-12-14 14 12 2020 746 6 Afghanistan AF AFG Azië 26-4-2021 12:06:22 uur AF
2020-12-13 13 12 2020 298 9 Afghanistan AF AFG Azië 26-4-2021 12:06:22 uur AF
2020-12-12 12 12 2020 113 11 Afghanistan AF AFG Azië 26-4-2021 12:06:22 uur AF
2020-12-11 11 12 2020 63 10 Afghanistan AF AFG Azië 26-4-2021 12:06:22 uur AF
2020-12-10 10 12 2020 202 16 Afghanistan AF AFG Azië 26-4-2021 12:06:22 uur AF
2020-12-09 9 12 2020 135 13 Afghanistan AF AFG Azië 26-4-2021 12:06:22 uur AF
2020-12-08 8 12 2020 200 6 Afghanistan AF AFG Azië 26-4-2021 12:06:22 uur AF
2020-12-07 7 12 2020 210 26 Afghanistan AF AFG Azië 26-4-2021 00:06:22 uur AF
2020-12-06 6 12 2020 234 10 Afghanistan AF AFG Azië 26-4-2021 00:06:22 uur AF
2020-12-05 5 12 2020 235 18 Afghanistan AF AFG Azië 26-4-2021 00:06:22 uur AF

Toegang tot gegevens

Azure Notebooks

Dit notebook documenteert de URL's en voorbeeldcode voor toegang tot de GEGEVENSSET-URL's van het European Centre for Disease Prevention and Control (ECDC) Covid-19 Cases van verschillende bestandsindelingen voor gegevenssets die worden gehost op Azure Blob Storage:¶ CSV:https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.csv

JSON: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.json

JSONL: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.jsonl

Parket: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.parquet

Download het gegevenssetbestand met behulp van de ingebouwde mogelijkheid om te downloaden vanaf een HTTP-URL in Pandas. Pandas heeft lezers voor verschillende bestandsindelingen:

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_parquet.html

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html

import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt

df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.parquet")
df.head(10)

df.dtypes

df.groupby('countries_and_territories').first().filter(['continent_exp','cases', 'deaths','date_rep'])

df.groupby('continent_exp').agg({'countries_and_territories': 'count','cases': 'count','deaths': 'count'})

import plotly.graph_objects as go
import plotly.express as px
import matplotlib.pyplot as plt

df.loc[: , ['countries_and_territories', 'cases', 'deaths']].groupby(['countries_and_territories'
         ]).max().sort_values(by='cases',ascending=False).reset_index()[:15].style.background_gradient(cmap='rainbow')

df_Worldwide=df[df['countries_and_territories']=='United_States_of_America']

df.plot(kind='line',x='date_rep',y="cases",grid=True)
df.plot(kind='line',x='date_rep',y="deaths",grid=True)
#df_Worldwide.plot(kind='line',x='date_rep',y="confirmed_change",grid=True)
#df_Worldwide.plot(kind='line',x='date_rep',y="deaths_change",grid=True)

Azure Databricks

Voorbeeld niet beschikbaar voor deze platform-/pakketcombinatie.

Azure Synapse

Voorbeeld niet beschikbaar voor deze platform-/pakketcombinatie.

Voorbeelden

Bekijk voorbeelden van hoe deze gegevensset kan worden gebruikt:

Volgende stappen

Bekijk de rest van de gegevenssets in de catalogus Open Datasets.