Europeiska centrumet för förebyggande och kontroll av sjukdomar (ECDC) COVID-19 fall
De senaste tillgängliga offentliga uppgifterna om geografisk fördelning av COVID-19 fall över hela världen från European Center for Disease Prevention and Control (ECDC). Varje rad/post innehåller antalet nya rapporterade fall per dag och per land/region.
Kommentar
Microsoft tillhandahåller Azure Open Datasets i befintligt fall. Microsoft ger inga garantier, uttryckliga eller underförstådda garantier eller villkor för din användning av datauppsättningarna. I den utsträckning som tillåts enligt din lokala lag frånsäger sig Microsoft allt ansvar för eventuella skador eller förluster, inklusive direkt, följdriktig, särskild, indirekt, tillfällig eller straffbar, till följd av din användning av datauppsättningarna.
Datamängden tillhandahålls enligt de ursprungliga villkor som gällde när Microsoft tog emot källdatan. Datamängden kan innehålla data från Microsoft.
Datauppsättningar
Modifierade versioner av datamängden finns i formaten CSV, JSON, JSON-Lines och Parquet. De uppdateras dagligen:
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.csv
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.json
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.jsonl
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.parquet
För alla modifierade datauppsättningar har iso_country_region-delkoder och inläsningstider lagts till, och kolumnnamnen visas i gemener med understreck som avgränsare.
Rådata: https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/ecdc_cases/latest/ECDCCases.csv
Tidigare versioner av modifierade data och rådata: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/ecdc_cases/
Datavolym
Den 28 maj 2020 innehöll de 19 876 rader (1,5 MB i CSV-format, 4,9 MB i JSON-format, 4,9 MB i JSONL-format och 54,1 kB i Parquet-format).
Data source
Rådata matas in dagligen från CSV-filen ECDC. Mer information om den här datamängden, inklusive dess ursprung, finns på sidan ECDC-datainsamling.
Datakvalitet
ECDC utfärdar inga garantier gällande noggrannhet eller aktualitet för dessa data. Läs ansvarsfriskrivningen.
Tilldelning av licens- och användningsrättigheter
Dessa data görs tillgängliga och kan användas i enlighet med ECDC:s upphovsrättspolicy som du kan hitta här. Tillstånd att reproducera dokument där en tredje part äger upphovsrätten måste hämtas från direkt från upphovsrättsinnehavaren.
ECDC måste alltid namnges som den ursprungliga källan för dessa data. En sådan bekräftelse måste ingå i varje kopia av materialet.
Kontakt
Om du har frågor eller feedback om den här eller andra datauppsättningar i COVID-19-datasjön är du välkommen att kontakta askcovid19dl@microsoft.com.
Kolumner
Name | Datatyp | Unik | Värden (exempel) | beskrivning |
---|---|---|---|---|
cases | smallint | 5,515 | 1 2 | Antal rapporterade fall |
continent_exp | sträng | 6 | Europa Afrika | Namn på kontinent |
countries_and_territories | sträng | 214 | Kanada Belgien | Namn på land eller region |
country_territory_code | sträng | 213 | KOR ISL | Lands- eller regionkod med tre bokstäver |
date_rep | datum | 350 | 2020-12-11 2020-11-22 | Datum för rapporten |
dag | smallint | 31 | 14 13 | Dag i månaden |
dödsfall | smallint | 1,049 | 1 2 | Antal rapporterade dödsfall |
geo_id | sträng | 214 | CA SE | Geografisk identifierare |
iso_country | sträng | 214 | SE USA | Lands- eller regionkod (ISO 3166) |
load_date | timestamp | 1 | 2021-04-26 00:06:22.123000 | Datum då data lästes in i Azure |
månad | smallint | 12 | 10 8 | Månadsnummer |
år | smallint | 2 | 2020 2019 | Year |
Förhandsversion
date_rep | dag | månad | år | cases | dödsfall | countries_and_territories | geo_id | country_territory_code | continent_exp | load_date | iso_country |
---|---|---|---|---|---|---|---|---|---|---|---|
2020-12-14 | 14 | 12 | 2020 | 746 | 6 | Afghanistan | AF | AFG | Asien | 2021-04-26 12:06:22 | AF |
2020-12-13 | 13 | 12 | 2020 | 298 | 9 | Afghanistan | AF | AFG | Asien | 2021-04-26 12:06:22 | AF |
2020-12-12 | 12 | 12 | 2020 | 113 | 11 | Afghanistan | AF | AFG | Asien | 2021-04-26 12:06:22 | AF |
2020-12-11 | 11 | 12 | 2020 | 63 | 10 | Afghanistan | AF | AFG | Asien | 2021-04-26 12:06:22 | AF |
2020-12-10 | 10 | 12 | 2020 | 202 | 16 | Afghanistan | AF | AFG | Asien | 2021-04-26 12:06:22 | AF |
2020-12-09 | 9 | 12 | 2020 | 135 | 13 | Afghanistan | AF | AFG | Asien | 2021-04-26 12:06:22 | AF |
2020-12-08 | 8 | 12 | 2020 | 200 | 6 | Afghanistan | AF | AFG | Asien | 2021-04-26 12:06:22 | AF |
2020-12-07 | 7 | 12 | 2020 | 210 | 26 | Afghanistan | AF | AFG | Asien | 2021-04-26 12:06:22 | AF |
2020-12-06 | 6 | 12 | 2020 | 234 | 10 | Afghanistan | AF | AFG | Asien | 2021-04-26 12:06:22 | AF |
2020-12-05 | 5 | 12 | 2020 | 235 | 18 | Afghanistan | AF | AFG | Asien | 2021-04-26 12:06:22 | AF |
Dataåtkomst
Azure Notebooks
Den här notebook-filen dokumenterar URL:er och exempelkod för åtkomst till Ecdc Covid-19 Cases datauppsättnings-URL:er för olika datamängdsfilformat som finns i Azure Blob Storage:¶ CSV: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.csv
Ladda ned datamängdsfilen med hjälp av den inbyggda funktionsnedladdningen från en http-URL i Pandas. Pandas har läsare för olika filformat:
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_parquet.html
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html
import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt
df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.parquet")
df.head(10)
df.dtypes
df.groupby('countries_and_territories').first().filter(['continent_exp','cases', 'deaths','date_rep'])
df.groupby('continent_exp').agg({'countries_and_territories': 'count','cases': 'count','deaths': 'count'})
import plotly.graph_objects as go
import plotly.express as px
import matplotlib.pyplot as plt
df.loc[: , ['countries_and_territories', 'cases', 'deaths']].groupby(['countries_and_territories'
]).max().sort_values(by='cases',ascending=False).reset_index()[:15].style.background_gradient(cmap='rainbow')
df_Worldwide=df[df['countries_and_territories']=='United_States_of_America']
df.plot(kind='line',x='date_rep',y="cases",grid=True)
df.plot(kind='line',x='date_rep',y="deaths",grid=True)
#df_Worldwide.plot(kind='line',x='date_rep',y="confirmed_change",grid=True)
#df_Worldwide.plot(kind='line',x='date_rep',y="deaths_change",grid=True)
Azure Databricks
Exempel är inte tillgängligt för den här kombinationen av plattform/paket.
Azure Synapse
Exempel är inte tillgängligt för den här kombinationen av plattform/paket.
Exempel
Se exempel på hur den här datamängden kan användas:
- Analysera COVID-data med Synapse SQL serverlös slutpunkt
- Linjär regressionsanalys på COVID-data med SQL-slutpunkt i Azure Synapse Analytics
Nästa steg
Visa resten av datauppsättningarna i katalogen Öppna datamängder.