Centro Europeu de Prevenção e Controlo de Doenças (ECDC) Casos COVID-19

Os últimos dados públicos disponíveis sobre a distribuição geográfica de casos COVID-19 em todo o mundo do Centro Europeu de Prevenção e Controlo de Doenças (ECDC). Cada linha/entrada contém o número de novos casos comunicados por dia e por país ou região.

Nota

Microsoft fornece conjuntos de dados Azure Open numa base "como está". Microsoft não tem garantias, expressas ou implícitas, garantias ou condições relativas à utilização dos conjuntos de dados. Na medida do permitido pela sua legislação local, Microsoft declina qualquer responsabilidade por quaisquer danos ou perdas, incluindo danos ou perdas diretas, consequentes, especiais, indiretos, incidentais ou punitivas, resultantes da utilização dos conjuntos de dados.

Este conjunto de dados é disponibilizado de acordo com os termos originais em que a Microsoft recebeu os dados de origem. O conjunto de dados pode incluir dados obtidos junto da Microsoft.

Conjuntos de dados

As versões modificadas do conjunto de dados estão disponíveis nos formatos CSV, JSON, JSON-Lines e Parquet, atualizadas diariamente:

Todas as versões modificadas têm códigos iso_country_region e tempos de carregamento adicionados, além de que utilizam nomes de colunas em minúsculas com separadores de caráter de sublinhado.

Dados não processados: https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/ecdc_cases/latest/ECDCCases.csv

Versões anteriores de dados modificados e brutos: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/ecdc_cases/

Volume de dados

Desde 28 de maio de 2020, contêm 19 876 linhas (CSV 1,5 MB, JSON 4,9 MB, JSONL 4,9 MB, Parquet 54,1 KB).

Origem de dados

Os dados brutos são ingeridos diariamente a partir do ficheiro csv do CSV do ECDC. Para obter mais informações sobre este conjunto de dados, incluindo as suas origens, consulte a página de recolha de dados do ECDC.

Qualidade de dados

O ECDC não garante a precisão ou atemporalidade dos dados. Leia a isenção de responsabilidade.

Atribuição de direitos de licença e utilização

Estes dados foram disponibilizados e podem ser utilizados conforme permitido ao abrigo da política de direitos de autor do ECDC aqui. Para quaisquer documentos em que os direitos de autor pertençam a terceiros, é necessário obter uma permissão de reprodução do titular dos direitos de autor.

O ECDC tem de ser sempre reconhecido como a fonte original destes dados. Tal reconhecimento deve ser incluído em cada cópia do material.

Contacto

Se tiver questões ou comentários sobre este ou outros conjuntos de dados no COVID-19 Data Lake, contacte askcovid19dl@microsoft.com.

Colunas

Name Tipo de dados Exclusivo Valores (amostra) Description
casos smallint 5,515 1 2 Número de casos reportados
continent_exp string 6 Europa África Nome do continente
countries_and_territories string 214 Canadá Bélgica Nome do país ou território
country_territory_code string 213 KOR ISL Código de três letras do país ou território
date_rep data 350 2020-12-11 2020-11-22 Data do relatório
day smallint 31 14 13 Dia do mês
mortes smallint 1,049 1 2 Número de mortes reportadas
geo_id string 214 CA SE Identificador geográfico
iso_country string 214 SE EUA Código ISO 3166 do país ou região
load_date carimbo de data/hora 1 2021-04-26 00:06:22.123000 Data em que os dados foram carregados para o Azure
month smallint 12 10 8 Número do mês
ano smallint 2 2020 2019 Anual

Pré-visualizar

date_rep day month ano casos mortes countries_and_territories geo_id country_territory_code continent_exp load_date iso_country
2020-12-14 14 12 2020 746 6 Afeganistão AF AFG Ásia 4/26/2021 12:06:22 AF
2020-12-13 13 12 2020 298 9 Afeganistão AF AFG Ásia 4/26/2021 12:06:22 AF
2020-12-12 12 12 2020 113 11 Afeganistão AF AFG Ásia 4/26/2021 12:06:22 AF
2020-12-11 11 12 2020 63 10 Afeganistão AF AFG Ásia 4/26/2021 12:06:22 AF
2020-12-10 10 12 2020 202 16 Afeganistão AF AFG Ásia 4/26/2021 12:06:22 AF
2020-12-09 9 12 2020 135 13 Afeganistão AF AFG Ásia 4/26/2021 12:06:22 AF
2020-12-08 8 12 2020 200 6 Afeganistão AF AFG Ásia 4/26/2021 12:06:22 AF
2020-12-07 7 12 2020 210 26 Afeganistão AF AFG Ásia 4/26/2021 12:06:22 AF
2020-12-06 6 12 2020 234 10 Afeganistão AF AFG Ásia 4/26/2021 12:06:22 AF
2020-12-05 5 12 2020 235 18 Afeganistão AF AFG Ásia 4/26/2021 12:06:22 AF

Acesso a dados

Azure Notebooks

Este caderno documenta os URLs e o código de amostra para aceder ao Centro Europeu de Prevenção e Controlo de Doenças (ECDC) Covid-19 Casos UrLs de diferentes formatos de ficheiros de conjuntos de dados alojados em Armazenamento de Blobs do Azure:' CSV: CSV:https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.csv

JSON: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.json

JSONL: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.jsonl

Parquet: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.parquet

Descarregue o ficheiro dataset utilizando o download de capacidade incorporada a partir de um URL http em Pandas. Pandas tem leitores para vários formatos de ficheiros:

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_parquet.html

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html

import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt

df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.parquet")
df.head(10)

df.dtypes

df.groupby('countries_and_territories').first().filter(['continent_exp','cases', 'deaths','date_rep'])

df.groupby('continent_exp').agg({'countries_and_territories': 'count','cases': 'count','deaths': 'count'})

import plotly.graph_objects as go
import plotly.express as px
import matplotlib.pyplot as plt

df.loc[: , ['countries_and_territories', 'cases', 'deaths']].groupby(['countries_and_territories'
         ]).max().sort_values(by='cases',ascending=False).reset_index()[:15].style.background_gradient(cmap='rainbow')

df_Worldwide=df[df['countries_and_territories']=='United_States_of_America']

df.plot(kind='line',x='date_rep',y="cases",grid=True)
df.plot(kind='line',x='date_rep',y="deaths",grid=True)
#df_Worldwide.plot(kind='line',x='date_rep',y="confirmed_change",grid=True)
#df_Worldwide.plot(kind='line',x='date_rep',y="deaths_change",grid=True)

Azure Databricks

Amostra não disponível para esta combinação plataforma/pacote.

Azure Synapse

Amostra não disponível para esta combinação plataforma/pacote.

Exemplos

Veja exemplos de como este conjunto de dados pode ser usado:

Passos seguintes

Ver o resto dos conjuntos de dados no catálogo Open Datasets.