Europeiska centrumet för förebyggande och kontroll av sjukdomar (ECDC) covid-19 fall
De senaste tillgängliga offentliga uppgifterna om geografisk fördelning av COVID-19 fall över hela världen från European Center for Disease Prevention and Control (ECDC). Varje rad/post innehåller antalet nya rapporterade fall per dag och per land/region.
Anteckning
Microsoft tillhandahåller Azure Open Datasets i befintligt format. Microsoft ger inga garantier, uttryckliga eller underförstådda garantier eller villkor för din användning av datauppsättningarna. I den utsträckning som tillåts enligt din lokala lag frånsäger sig Microsoft allt ansvar för eventuella skador eller förluster, inklusive direkt, följdskador, särskilda, indirekta, tillfälliga eller straffande, till följd av din användning av datauppsättningarna.
Datamängden tillhandahålls enligt de ursprungliga villkor som gällde när Microsoft tog emot källdatan. Datamängden kan innehålla data från Microsoft.
Datauppsättningar
Modifierade versioner av datamängden finns i formaten CSV, JSON, JSON-Lines och Parquet. De uppdateras dagligen:
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.csv
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.json
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.jsonl
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.parquet
För alla modifierade datauppsättningar har iso_country_region-delkoder och inläsningstider lagts till, och kolumnnamnen visas i gemener med understreck som avgränsare.
Rådata: https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/ecdc_cases/latest/ECDCCases.csv
Tidigare versioner av ändrade och rådata: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/ecdc_cases/
Datavolym
Den 28 maj 2020 innehöll de 19 876 rader (1,5 MB i CSV-format, 4,9 MB i JSON-format, 4,9 MB i JSONL-format och 54,1 kB i Parquet-format).
Datakälla
Rådata matas in dagligen från CSV-filen ECDC. Mer information om den här datamängden, inklusive dess ursprung, finns på sidan ECDC-datainsamling.
Datakvalitet
ECDC utfärdar inga garantier gällande noggrannhet eller aktualitet för dessa data. Läs ansvarsfriskrivningen.
Licens- och användningsbehörighetsatribution
Dessa data görs tillgängliga och kan användas i enlighet med ECDC:s upphovsrättspolicy som du kan hitta här. Tillstånd att reproducera dokument där en tredje part äger upphovsrätten måste hämtas från direkt från upphovsrättsinnehavaren.
ECDC måste alltid namnges som den ursprungliga källan för dessa data. En sådan bekräftelse måste ingå i varje kopia av materialet.
Kontakt
Om du har frågor eller feedback om den här eller andra datauppsättningar i COVID-19-datasjön är du välkommen att kontakta askcovid19dl@microsoft.com.
Kolumner
Name | Datatyp | Unik | Värden (exempel) | Beskrivning |
---|---|---|---|---|
Fall | smallint | 5,515 | 1 2 | Antal rapporterade fall |
continent_exp | sträng | 6 | Europa Afrika | Namn på kontinent |
countries_and_territories | sträng | 214 | Kanada Belgien | Namn på land eller region |
country_territory_code | sträng | 213 | KOR ISL | Lands- eller regionkod med tre bokstäver |
date_rep | datum | 350 | 2020-12-11 2020-11-22 | Datum för rapporten |
day | smallint | 31 | 14 13 | Dag i månaden |
Dödsfall | smallint | 1,049 | 1 2 | Antal rapporterade dödsfall |
geo_id | sträng | 214 | CA SE | Geografisk identifierare |
iso_country | sträng | 214 | SE US | Lands- eller regionkod (ISO 3166) |
load_date | timestamp | 1 | 2021-04-26 00:06:22.123000 | Datum då data lästes in i Azure |
månad | smallint | 12 | 10 8 | Månadsnummer |
år | smallint | 2 | 2020 2019 | Year |
Förhandsgranskning
date_rep | day | månad | år | Fall | Dödsfall | countries_and_territories | geo_id | country_territory_code | continent_exp | load_date | iso_country |
---|---|---|---|---|---|---|---|---|---|---|---|
2020-12-14 | 14 | 12 | 2020 | 746 | 6 | Afghanistan | AF | AFG | Asien | 2021-04-26 12:06:22 | AF |
2020-12-13 | 13 | 12 | 2020 | 298 | 9 | Afghanistan | AF | AFG | Asien | 2021-04-26 12:06:22 | AF |
2020-12-12 | 12 | 12 | 2020 | 113 | 11 | Afghanistan | AF | AFG | Asien | 2021-04-26 12:06:22 | AF |
2020-12-11 | 11 | 12 | 2020 | 63 | 10 | Afghanistan | AF | AFG | Asien | 2021-04-26 12:06:22 | AF |
2020-12-10 | 10 | 12 | 2020 | 202 | 16 | Afghanistan | AF | AFG | Asien | 2021-04-26 12:06:22 | AF |
2020-12-09 | 9 | 12 | 2020 | 135 | 13 | Afghanistan | AF | AFG | Asien | 2021-04-26 12:06:22 | AF |
2020-12-08 | 8 | 12 | 2020 | 200 | 6 | Afghanistan | AF | AFG | Asien | 2021-04-26 12:06:22 | AF |
2020-12-07 | 7 | 12 | 2020 | 210 | 26 | Afghanistan | AF | AFG | Asien | 2021-04-26 12:06:22 | AF |
2020-12-06 | 6 | 12 | 2020 | 234 | 10 | Afghanistan | AF | AFG | Asien | 2021-04-26 12:06:22 | AF |
2020-12-05 | 5 | 12 | 2020 | 235 | 18 | Afghanistan | AF | AFG | Asien | 2021-04-26 12:06:22 | AF |
Dataåtkomst
Azure Notebooks
Den här anteckningsboken dokumenterar URL:er och exempelkod för att få åtkomst till Ecvid-19 Cases datauppsättnings-URL:er för olika datauppsättningsfilformat som finns på Azure Blob Storage:¶ CSV:https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.csv
Ladda ned datauppsättningsfilen med hjälp av den inbyggda funktionen som laddas ned från en HTTP-URL i Pandas. Pandas har läsare för olika filformat:
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_parquet.html
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html
import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt
df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.parquet")
df.head(10)
df.dtypes
df.groupby('countries_and_territories').first().filter(['continent_exp','cases', 'deaths','date_rep'])
df.groupby('continent_exp').agg({'countries_and_territories': 'count','cases': 'count','deaths': 'count'})
import plotly.graph_objects as go
import plotly.express as px
import matplotlib.pyplot as plt
df.loc[: , ['countries_and_territories', 'cases', 'deaths']].groupby(['countries_and_territories'
]).max().sort_values(by='cases',ascending=False).reset_index()[:15].style.background_gradient(cmap='rainbow')
df_Worldwide=df[df['countries_and_territories']=='United_States_of_America']
df.plot(kind='line',x='date_rep',y="cases",grid=True)
df.plot(kind='line',x='date_rep',y="deaths",grid=True)
#df_Worldwide.plot(kind='line',x='date_rep',y="confirmed_change",grid=True)
#df_Worldwide.plot(kind='line',x='date_rep',y="deaths_change",grid=True)
Azure Databricks
Exempel är inte tillgängligt för den här kombinationen av plattform/paket.
Azure Synapse
Exempel är inte tillgängligt för den här kombinationen av plattform/paket.
Exempel
Se exempel på hur den här datauppsättningen kan användas:
- Analysera COVID-data med Synapse SQL-serverlös slutpunkt
- Linjär regressionsanalys på COVID-data med SQL-slutpunkt i Azure Synapse Analytics
Nästa steg
Visa resten av datauppsättningarna i katalogen Öppna datauppsättningar.