Centro Europeu de Prevenção e Controlo de Doenças (ECDC) Casos COVID-19
Os últimos dados públicos disponíveis sobre a distribuição geográfica de casos COVID-19 em todo o mundo do Centro Europeu de Prevenção e Controlo de Doenças (ECDC). Cada linha/entrada contém o número de novos casos comunicados por dia e por país ou região.
Nota
Microsoft fornece conjuntos de dados Azure Open numa base "como está". Microsoft não tem garantias, expressas ou implícitas, garantias ou condições relativas à utilização dos conjuntos de dados. Na medida do permitido pela sua legislação local, Microsoft declina qualquer responsabilidade por quaisquer danos ou perdas, incluindo danos ou perdas diretas, consequentes, especiais, indiretos, incidentais ou punitivas, resultantes da utilização dos conjuntos de dados.
Este conjunto de dados é disponibilizado de acordo com os termos originais em que a Microsoft recebeu os dados de origem. O conjunto de dados pode incluir dados obtidos junto da Microsoft.
Conjuntos de dados
As versões modificadas do conjunto de dados estão disponíveis nos formatos CSV, JSON, JSON-Lines e Parquet, atualizadas diariamente:
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.csv
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.json
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.jsonl
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.parquet
Todas as versões modificadas têm códigos iso_country_region e tempos de carregamento adicionados, além de que utilizam nomes de colunas em minúsculas com separadores de caráter de sublinhado.
Dados não processados: https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/ecdc_cases/latest/ECDCCases.csv
Versões anteriores de dados modificados e brutos: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/ecdc_cases/
Volume de dados
Desde 28 de maio de 2020, contêm 19 876 linhas (CSV 1,5 MB, JSON 4,9 MB, JSONL 4,9 MB, Parquet 54,1 KB).
Origem de dados
Os dados brutos são ingeridos diariamente a partir do ficheiro csv do CSV do ECDC. Para obter mais informações sobre este conjunto de dados, incluindo as suas origens, consulte a página de recolha de dados do ECDC.
Qualidade de dados
O ECDC não garante a precisão ou atemporalidade dos dados. Leia a isenção de responsabilidade.
Atribuição de direitos de licença e utilização
Estes dados foram disponibilizados e podem ser utilizados conforme permitido ao abrigo da política de direitos de autor do ECDC aqui. Para quaisquer documentos em que os direitos de autor pertençam a terceiros, é necessário obter uma permissão de reprodução do titular dos direitos de autor.
O ECDC tem de ser sempre reconhecido como a fonte original destes dados. Tal reconhecimento deve ser incluído em cada cópia do material.
Contacto
Se tiver questões ou comentários sobre este ou outros conjuntos de dados no COVID-19 Data Lake, contacte askcovid19dl@microsoft.com.
Colunas
Name | Tipo de dados | Exclusivo | Valores (amostra) | Description |
---|---|---|---|---|
casos | smallint | 5,515 | 1 2 | Número de casos reportados |
continent_exp | string | 6 | Europa África | Nome do continente |
countries_and_territories | string | 214 | Canadá Bélgica | Nome do país ou território |
country_territory_code | string | 213 | KOR ISL | Código de três letras do país ou território |
date_rep | data | 350 | 2020-12-11 2020-11-22 | Data do relatório |
day | smallint | 31 | 14 13 | Dia do mês |
mortes | smallint | 1,049 | 1 2 | Número de mortes reportadas |
geo_id | string | 214 | CA SE | Identificador geográfico |
iso_country | string | 214 | SE EUA | Código ISO 3166 do país ou região |
load_date | carimbo de data/hora | 1 | 2021-04-26 00:06:22.123000 | Data em que os dados foram carregados para o Azure |
month | smallint | 12 | 10 8 | Número do mês |
ano | smallint | 2 | 2020 2019 | Anual |
Pré-visualizar
date_rep | day | month | ano | casos | mortes | countries_and_territories | geo_id | country_territory_code | continent_exp | load_date | iso_country |
---|---|---|---|---|---|---|---|---|---|---|---|
2020-12-14 | 14 | 12 | 2020 | 746 | 6 | Afeganistão | AF | AFG | Ásia | 4/26/2021 12:06:22 | AF |
2020-12-13 | 13 | 12 | 2020 | 298 | 9 | Afeganistão | AF | AFG | Ásia | 4/26/2021 12:06:22 | AF |
2020-12-12 | 12 | 12 | 2020 | 113 | 11 | Afeganistão | AF | AFG | Ásia | 4/26/2021 12:06:22 | AF |
2020-12-11 | 11 | 12 | 2020 | 63 | 10 | Afeganistão | AF | AFG | Ásia | 4/26/2021 12:06:22 | AF |
2020-12-10 | 10 | 12 | 2020 | 202 | 16 | Afeganistão | AF | AFG | Ásia | 4/26/2021 12:06:22 | AF |
2020-12-09 | 9 | 12 | 2020 | 135 | 13 | Afeganistão | AF | AFG | Ásia | 4/26/2021 12:06:22 | AF |
2020-12-08 | 8 | 12 | 2020 | 200 | 6 | Afeganistão | AF | AFG | Ásia | 4/26/2021 12:06:22 | AF |
2020-12-07 | 7 | 12 | 2020 | 210 | 26 | Afeganistão | AF | AFG | Ásia | 4/26/2021 12:06:22 | AF |
2020-12-06 | 6 | 12 | 2020 | 234 | 10 | Afeganistão | AF | AFG | Ásia | 4/26/2021 12:06:22 | AF |
2020-12-05 | 5 | 12 | 2020 | 235 | 18 | Afeganistão | AF | AFG | Ásia | 4/26/2021 12:06:22 | AF |
Acesso a dados
Azure Notebooks
Este caderno documenta os URLs e o código de amostra para aceder ao Centro Europeu de Prevenção e Controlo de Doenças (ECDC) Covid-19 Casos UrLs de diferentes formatos de ficheiros de conjuntos de dados alojados em Armazenamento de Blobs do Azure:' CSV: CSV:https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.csv
Descarregue o ficheiro dataset utilizando o download de capacidade incorporada a partir de um URL http em Pandas. Pandas tem leitores para vários formatos de ficheiros:
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_parquet.html
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html
import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt
df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.parquet")
df.head(10)
df.dtypes
df.groupby('countries_and_territories').first().filter(['continent_exp','cases', 'deaths','date_rep'])
df.groupby('continent_exp').agg({'countries_and_territories': 'count','cases': 'count','deaths': 'count'})
import plotly.graph_objects as go
import plotly.express as px
import matplotlib.pyplot as plt
df.loc[: , ['countries_and_territories', 'cases', 'deaths']].groupby(['countries_and_territories'
]).max().sort_values(by='cases',ascending=False).reset_index()[:15].style.background_gradient(cmap='rainbow')
df_Worldwide=df[df['countries_and_territories']=='United_States_of_America']
df.plot(kind='line',x='date_rep',y="cases",grid=True)
df.plot(kind='line',x='date_rep',y="deaths",grid=True)
#df_Worldwide.plot(kind='line',x='date_rep',y="confirmed_change",grid=True)
#df_Worldwide.plot(kind='line',x='date_rep',y="deaths_change",grid=True)
Azure Databricks
Amostra não disponível para esta combinação plataforma/pacote.
Azure Synapse
Amostra não disponível para esta combinação plataforma/pacote.
Exemplos
Veja exemplos de como este conjunto de dados pode ser usado:
- Analise os dados do COVID com o ponto final sem servidor Sinaapse SQL
- Análise linear de regressão em dados COVID utilizando ponto final SQL em Azure Synapse Analytics
Passos seguintes
Ver o resto dos conjuntos de dados no catálogo Open Datasets.