Europees Centrum voor ziektepreventie en -bestrijding (ECDC) COVID-19-gevallen
De meest recente openbare gegevens over de geografische spreiding van COVID-19-gevallen wereldwijd van het Europees Centrum voor ziektepreventie en -bestrijding (ECDC). Elke rij/vermelding bevat het aantal nieuwe gemelde gevallen per dag en per land of regio.
Notitie
Microsoft biedt Azure Open Datasets op een 'as is'-basis. Microsoft biedt geen garanties, expliciet of impliciet, garanties of voorwaarden met betrekking tot uw gebruik van de gegevenssets. Voor zover is toegestaan op grond van uw lokale wetgeving, wijst Microsoft alle aansprakelijkheid af voor schade of verliezen, met inbegrip van directe schade, gevolgschade, speciale, indirecte, incidentele of bestraffende schade als gevolg van uw gebruik van de gegevenssets.
Deze gegevensset wordt geleverd onder de oorspronkelijke voorwaarden dat Microsoft de brongegevens heeft ontvangen. De gegevensset kan gegevens bevatten die afkomstig zijn van Microsoft.
Gegevenssets
Gewijzigde versies van de gegevensset zijn beschikbaar als CSV, JSON, JSON-Lines en Parquet en worden dagelijks bijgewerkt:
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.csv
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.json
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.jsonl
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.parquet
Aan alle gewijzigde versies zijn iso_country_region-codes en laadtijden toegevoegd. Ook worden voor de gegevenssets kolomnamen in kleine letters gescheiden door onderstrepingstekens gebruikt.
Onbewerkte gegevens: https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/ecdc_cases/latest/ECDCCases.csv
Vorige versies van gewijzigde en onbewerkte gegevens: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/ecdc_cases/
Gegevensvolume
Vanaf 28 mei 2020 bevatten de gegevenssets 19876 rijen (CSV 1,5 MB, JSON 4,9 MB, JSONL 4,9 MB, Parquet 54,1 kB).
Gegevensbron
Onbewerkte gegevens worden dagelijks opgenomen uit het CSV-bestand van het ECDC. Zie de pagina voor het verzamelen van gegevens van het ECDC voor meer informatie over deze gegevensset, inclusief de oorsprong ervan.
Gegevenskwaliteit
Het Europees Centrum voor ziektepreventie en -bestrijding biedt geen garantie voor de nauwkeurigheid of tijdigheid van de gegevens. Lees de vrijwaring.
Licentie- en gebruiksrechten toewijzen
Deze gegevens worden beschikbaar gesteld en kunnen worden gebruikt zoals toegestaan onder het auteursrecht van het ECDC dat hier wordt beschreven. Voor alle documenten waarvoor het auteursrecht bij een derde partij ligt, moet toestemming worden verkregen van de auteursrechthebbende.
ECDC moet altijd worden erkend als de oorspronkelijke bron van deze gegevens. Deze bevestiging moet in elk exemplaar van het materiaal worden opgenomen.
Contactpersoon
Neem contact op met askcovid19dl@microsoft.com voor vragen of feedback over deze of andere gegevenssets in de COVID-19 Data Lake.
Kolommen
Naam | Gegevenstype | Uniek | Waarden (voorbeeld) | Description |
---|---|---|---|---|
Gevallen | smallint | 5,515 | 1 2 | Aantal gerapporteerde gevallen |
continent_exp | tekenreeks | 6 | Europa Afrika | Naam continent |
countries_and_territories | tekenreeks | 214 | Canada België | Naam van land/regio of gebied |
country_territory_code | tekenreeks | 213 | KOR ISL | De code van drie letters voor land/regio of gebied |
date_rep | datum | 350 | 2020-12-11 2020-11-22 | De datum van het rapport |
day | smallint | 31 | 14 13 | Dag van maand |
Sterfgevallen | smallint | 1,049 | 1 2 | Aantal gerapporteerde sterfgevallen |
geo_id | tekenreeks | 214 | CA SE | Id van geografisch gebied |
iso_country | tekenreeks | 214 | SE US | ISO 3166-land- of regiocode |
load_date | tijdstempel | 1 | 2021-04-26 00:06:22.123000 | Datum waarop gegevens in Azure zijn geladen |
maand | smallint | 12 | 10 8 | Maandnummer |
jaar | smallint | 2 | 2020 2019 | Year |
Preview
date_rep | day | maand | jaar | Gevallen | Sterfgevallen | countries_and_territories | geo_id | country_territory_code | continent_exp | load_date | iso_country |
---|---|---|---|---|---|---|---|---|---|---|---|
2020-12-14 | 14 | 12 | 2020 | 746 | 6 | Afghanistan | AF | AFG | Azië | 26-4-2021 12:06:22 uur | AF |
2020-12-13 | 13 | 12 | 2020 | 298 | 9 | Afghanistan | AF | AFG | Azië | 26-4-2021 12:06:22 uur | AF |
2020-12-12 | 12 | 12 | 2020 | 113 | 11 | Afghanistan | AF | AFG | Azië | 26-4-2021 12:06:22 uur | AF |
2020-12-11 | 11 | 12 | 2020 | 63 | 10 | Afghanistan | AF | AFG | Azië | 26-4-2021 12:06:22 uur | AF |
2020-12-10 | 10 | 12 | 2020 | 202 | 16 | Afghanistan | AF | AFG | Azië | 26-4-2021 12:06:22 uur | AF |
2020-12-09 | 9 | 12 | 2020 | 135 | 13 | Afghanistan | AF | AFG | Azië | 26-4-2021 12:06:22 uur | AF |
2020-12-08 | 8 | 12 | 2020 | 200 | 6 | Afghanistan | AF | AFG | Azië | 26-4-2021 12:06:22 uur | AF |
2020-12-07 | 7 | 12 | 2020 | 210 | 26 | Afghanistan | AF | AFG | Azië | 26-4-2021 00:06:22 uur | AF |
2020-12-06 | 6 | 12 | 2020 | 234 | 10 | Afghanistan | AF | AFG | Azië | 26-4-2021 00:06:22 uur | AF |
2020-12-05 | 5 | 12 | 2020 | 235 | 18 | Afghanistan | AF | AFG | Azië | 26-4-2021 00:06:22 uur | AF |
Toegang tot gegevens
Azure Notebooks
Dit notebook documenteert de URL's en voorbeeldcode voor toegang tot de GEGEVENSSET-URL's van het European Centre for Disease Prevention and Control (ECDC) Covid-19 Cases van verschillende bestandsindelingen voor gegevenssets die worden gehost op Azure Blob Storage:¶ CSV:https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.csv
Download het gegevenssetbestand met behulp van de ingebouwde mogelijkheid om te downloaden vanaf een HTTP-URL in Pandas. Pandas heeft lezers voor verschillende bestandsindelingen:
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_parquet.html
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html
import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt
df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.parquet")
df.head(10)
df.dtypes
df.groupby('countries_and_territories').first().filter(['continent_exp','cases', 'deaths','date_rep'])
df.groupby('continent_exp').agg({'countries_and_territories': 'count','cases': 'count','deaths': 'count'})
import plotly.graph_objects as go
import plotly.express as px
import matplotlib.pyplot as plt
df.loc[: , ['countries_and_territories', 'cases', 'deaths']].groupby(['countries_and_territories'
]).max().sort_values(by='cases',ascending=False).reset_index()[:15].style.background_gradient(cmap='rainbow')
df_Worldwide=df[df['countries_and_territories']=='United_States_of_America']
df.plot(kind='line',x='date_rep',y="cases",grid=True)
df.plot(kind='line',x='date_rep',y="deaths",grid=True)
#df_Worldwide.plot(kind='line',x='date_rep',y="confirmed_change",grid=True)
#df_Worldwide.plot(kind='line',x='date_rep',y="deaths_change",grid=True)
Azure Databricks
Voorbeeld niet beschikbaar voor deze platform-/pakketcombinatie.
Azure Synapse
Voorbeeld niet beschikbaar voor deze platform-/pakketcombinatie.
Voorbeelden
Bekijk voorbeelden van hoe deze gegevensset kan worden gebruikt:
- COVID-gegevens analyseren met een serverloos Synapse SQL-eindpunt
- Lineaire regressieanalyse van COVID-gegevens met behulp van SQL-eindpunt in Azure Synapse Analytics
Volgende stappen
Bekijk de rest van de gegevenssets in de catalogus Open Datasets.