Europeiska centrumet för förebyggande och kontroll av sjukdomar (ECDC) covid-19 fall

De senaste tillgängliga offentliga uppgifterna om geografisk fördelning av COVID-19 fall över hela världen från European Center for Disease Prevention and Control (ECDC). Varje rad/post innehåller antalet nya rapporterade fall per dag och per land/region.

Anteckning

Microsoft tillhandahåller Azure Open Datasets i befintligt format. Microsoft ger inga garantier, uttryckliga eller underförstådda garantier eller villkor för din användning av datauppsättningarna. I den utsträckning som tillåts enligt din lokala lag frånsäger sig Microsoft allt ansvar för eventuella skador eller förluster, inklusive direkt, följdskador, särskilda, indirekta, tillfälliga eller straffande, till följd av din användning av datauppsättningarna.

Datamängden tillhandahålls enligt de ursprungliga villkor som gällde när Microsoft tog emot källdatan. Datamängden kan innehålla data från Microsoft.

Datauppsättningar

Modifierade versioner av datamängden finns i formaten CSV, JSON, JSON-Lines och Parquet. De uppdateras dagligen:

För alla modifierade datauppsättningar har iso_country_region-delkoder och inläsningstider lagts till, och kolumnnamnen visas i gemener med understreck som avgränsare.

Rådata: https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/ecdc_cases/latest/ECDCCases.csv

Tidigare versioner av ändrade och rådata: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/ecdc_cases/

Datavolym

Den 28 maj 2020 innehöll de 19 876 rader (1,5 MB i CSV-format, 4,9 MB i JSON-format, 4,9 MB i JSONL-format och 54,1 kB i Parquet-format).

Datakälla

Rådata matas in dagligen från CSV-filen ECDC. Mer information om den här datamängden, inklusive dess ursprung, finns på sidan ECDC-datainsamling.

Datakvalitet

ECDC utfärdar inga garantier gällande noggrannhet eller aktualitet för dessa data. Läs ansvarsfriskrivningen.

Licens- och användningsbehörighetsatribution

Dessa data görs tillgängliga och kan användas i enlighet med ECDC:s upphovsrättspolicy som du kan hitta här. Tillstånd att reproducera dokument där en tredje part äger upphovsrätten måste hämtas från direkt från upphovsrättsinnehavaren.

ECDC måste alltid namnges som den ursprungliga källan för dessa data. En sådan bekräftelse måste ingå i varje kopia av materialet.

Kontakt

Om du har frågor eller feedback om den här eller andra datauppsättningar i COVID-19-datasjön är du välkommen att kontakta askcovid19dl@microsoft.com.

Kolumner

Name Datatyp Unik Värden (exempel) Beskrivning
Fall smallint 5,515 1 2 Antal rapporterade fall
continent_exp sträng 6 Europa Afrika Namn på kontinent
countries_and_territories sträng 214 Kanada Belgien Namn på land eller region
country_territory_code sträng 213 KOR ISL Lands- eller regionkod med tre bokstäver
date_rep datum 350 2020-12-11 2020-11-22 Datum för rapporten
day smallint 31 14 13 Dag i månaden
Dödsfall smallint 1,049 1 2 Antal rapporterade dödsfall
geo_id sträng 214 CA SE Geografisk identifierare
iso_country sträng 214 SE US Lands- eller regionkod (ISO 3166)
load_date timestamp 1 2021-04-26 00:06:22.123000 Datum då data lästes in i Azure
månad smallint 12 10 8 Månadsnummer
år smallint 2 2020 2019 Year

Förhandsgranskning

date_rep day månad år Fall Dödsfall countries_and_territories geo_id country_territory_code continent_exp load_date iso_country
2020-12-14 14 12 2020 746 6 Afghanistan AF AFG Asien 2021-04-26 12:06:22 AF
2020-12-13 13 12 2020 298 9 Afghanistan AF AFG Asien 2021-04-26 12:06:22 AF
2020-12-12 12 12 2020 113 11 Afghanistan AF AFG Asien 2021-04-26 12:06:22 AF
2020-12-11 11 12 2020 63 10 Afghanistan AF AFG Asien 2021-04-26 12:06:22 AF
2020-12-10 10 12 2020 202 16 Afghanistan AF AFG Asien 2021-04-26 12:06:22 AF
2020-12-09 9 12 2020 135 13 Afghanistan AF AFG Asien 2021-04-26 12:06:22 AF
2020-12-08 8 12 2020 200 6 Afghanistan AF AFG Asien 2021-04-26 12:06:22 AF
2020-12-07 7 12 2020 210 26 Afghanistan AF AFG Asien 2021-04-26 12:06:22 AF
2020-12-06 6 12 2020 234 10 Afghanistan AF AFG Asien 2021-04-26 12:06:22 AF
2020-12-05 5 12 2020 235 18 Afghanistan AF AFG Asien 2021-04-26 12:06:22 AF

Dataåtkomst

Azure Notebooks

Den här anteckningsboken dokumenterar URL:er och exempelkod för att få åtkomst till Ecvid-19 Cases datauppsättnings-URL:er för olika datauppsättningsfilformat som finns på Azure Blob Storage:¶ CSV:https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.csv

JSON: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.json

JSONL: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.jsonl

Parkett: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.parquet

Ladda ned datauppsättningsfilen med hjälp av den inbyggda funktionen som laddas ned från en HTTP-URL i Pandas. Pandas har läsare för olika filformat:

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_parquet.html

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html

import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt

df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.parquet")
df.head(10)

df.dtypes

df.groupby('countries_and_territories').first().filter(['continent_exp','cases', 'deaths','date_rep'])

df.groupby('continent_exp').agg({'countries_and_territories': 'count','cases': 'count','deaths': 'count'})

import plotly.graph_objects as go
import plotly.express as px
import matplotlib.pyplot as plt

df.loc[: , ['countries_and_territories', 'cases', 'deaths']].groupby(['countries_and_territories'
         ]).max().sort_values(by='cases',ascending=False).reset_index()[:15].style.background_gradient(cmap='rainbow')

df_Worldwide=df[df['countries_and_territories']=='United_States_of_America']

df.plot(kind='line',x='date_rep',y="cases",grid=True)
df.plot(kind='line',x='date_rep',y="deaths",grid=True)
#df_Worldwide.plot(kind='line',x='date_rep',y="confirmed_change",grid=True)
#df_Worldwide.plot(kind='line',x='date_rep',y="deaths_change",grid=True)

Azure Databricks

Exempel är inte tillgängligt för den här kombinationen av plattform/paket.

Azure Synapse

Exempel är inte tillgängligt för den här kombinationen av plattform/paket.

Exempel

Se exempel på hur den här datauppsättningen kan användas:

Nästa steg

Visa resten av datauppsättningarna i katalogen Öppna datauppsättningar.