Casos de COVID-19 del Centro europeo para la prevención y el control de enfermedades (ECDC)
Datos públicos más recientes disponibles sobre la distribución geográfica de los casos de COVID-19 en todo el mundo proporcionados por el Centro europeo para la prevención y el control de enfermedades (ECDC). Cada fila o entrada contiene el número de casos nuevos notificados cada día por países o regiones.
Nota
Microsoft proporciona Azure Open Datasets "tal cual". Microsoft no ofrece ninguna garantía, expresa o implícita, ni condición con respecto al uso que usted haga de los conjuntos de datos. En la medida en la que lo permita su legislación local, Microsoft declina toda responsabilidad por posibles daños o pérdidas, incluidos los daños directos, consecuenciales, especiales, indirectos, incidentales o punitivos, que resulten de su uso de los conjuntos de datos.
Este conjunto de datos se proporciona bajo los términos originales con los que Microsoft recibió los datos de origen. El conjunto de datos puede incluir datos procedentes de Microsoft.
Conjuntos de datos
Las versiones modificadas del conjunto de datos están disponibles con los formatos CSV, JSON, JSON-Lines y Parquet, y se actualizan a diario.
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.csv
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.json
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.jsonl
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.parquet
Todas las versiones modificadas tienen códigos iso_country_region y los tiempos de carga agregados, y utilizan minúsculas para los nombres de las columnas con guiones bajos como separadores.
Datos sin procesar: https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/ecdc_cases/latest/ECDCCases.csv
Versiones anteriores de datos modificados y sin procesar: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/ecdc_cases/
Volumen de datos
El 28 de mayo de 2020 contenían 19 876 filas (CSV: 1,5 MB, JSON: 4,9 MB, JSONL: 4,9 MB, Parquet: 54,1 MB).
Origen de datos
Los datos sin procesar se ingieren diariamente desde el archivo CSV del ECDC. Para más información sobre este conjunto de datos, incluidos sus orígenes, consulte la página de recopilación de datos del ECDC.
Calidad de los datos
El ECDC no garantiza la precisión de los datos ni que estén actualizados. Lea la declinación de responsabilidades.
Atribución de licencias y derechos de uso
Estos datos se ofrecen y se pueden usar conforme a la directiva de propiedad intelectual del ECDC, disponible aquí. En el caso de los documentos cuya propiedad intelectual sea de un tercero, debe obtenerse el permiso del titular de tal propiedad intelectual para poder reproducirlos.
Siempre debe reconocerse al ECDC como origen de estos datos. Dicho reconocimiento se debe incluir en todas las copias del material.
Contacto
Si tiene alguna duda o desea aportar algún comentario sobre este u otros conjuntos de datos del lago de datos COVID-19, póngase en contacto con askcovid19dl@microsoft.com.
Columnas
Nombre | Tipo de datos | Único | Valores (ejemplo) | Descripción |
---|---|---|---|---|
cases | SMALLINT | 5515 | 1 2 | Número de casos notificados. |
continent_exp | string | 6 | Europa África | Nombre del continente. |
countries_and_territories | string | 214 | Canadá Bélgica | Nombre del país o territorio. |
country_territory_code | string | 213 | KOR ISL | Código de tres letras del país o el territorio. |
date_rep | date | 350 | 2020-12-11 2020-11-22 | Fecha del informe. |
day | SMALLINT | 31 | 14 13 | Día del mes. |
deaths | SMALLINT | 1049 | 1 2 | Número de fallecimientos notificados. |
geo_id | string | 214 | CA SE | Identificador geográfico. |
iso_country | string | 214 | SE US | Código de país o región conforme a la norma ISO 3166. |
load_date | timestamp | 1 | 2021-04-26 00:06:22.123000 | Fecha en la que se cargaron los datos en Azure. |
month | SMALLINT | 12 | 10 8 | Número de mes. |
year | SMALLINT | 2 | 2020 2019 | Year |
Vista previa
date_rep | day | month | year | cases | deaths | countries_and_territories | geo_id | country_territory_code | continent_exp | load_date | iso_country |
---|---|---|---|---|---|---|---|---|---|---|---|
2020-12-14 | 14 | 12 | 2020 | 746 | 6 | Afganistán | AF | AFG | Asia | 4/26/2021 12:06:22 AM | AF |
2020-12-13 | 13 | 12 | 2020 | 298 | 9 | Afganistán | AF | AFG | Asia | 4/26/2021 12:06:22 AM | AF |
2020-12-12 | 12 | 12 | 2020 | 113 | 11 | Afganistán | AF | AFG | Asia | 4/26/2021 12:06:22 AM | AF |
2020-12-11 | 11 | 12 | 2020 | 63 | 10 | Afganistán | AF | AFG | Asia | 4/26/2021 12:06:22 AM | AF |
2020-12-10 | 10 | 12 | 2020 | 202 | 16 | Afganistán | AF | AFG | Asia | 4/26/2021 12:06:22 AM | AF |
2020-12-09 | 9 | 12 | 2020 | 135 | 13 | Afganistán | AF | AFG | Asia | 4/26/2021 12:06:22 AM | AF |
2020-12-08 | 8 | 12 | 2020 | 200 | 6 | Afganistán | AF | AFG | Asia | 4/26/2021 12:06:22 AM | AF |
2020-12-07 | 7 | 12 | 2020 | 210 | 26 | Afganistán | AF | AFG | Asia | 4/26/2021 12:06:22 AM | AF |
2020-12-06 | 6 | 12 | 2020 | 234 | 10 | Afganistán | AF | AFG | Asia | 4/26/2021 12:06:22 AM | AF |
2020-12-05 | 5 | 12 | 2020 | 235 | 18 | Afganistán | AF | AFG | Asia | 4/26/2021 12:06:22 AM | AF |
Acceso a datos
Azure Notebooks
Este cuaderno documenta las direcciones URL y el código de ejemplo para acceder al Centro europeo para la prevención y el control de enfermedades (ECDC). Direcciones URL de diferentes formatos de archivo del conjunto de datos de casos de Covid-19 hospedados en Azure Blob Storage:¶ CSV: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.csv
Descargue el archivo del conjunto de datos mediante la funcionalidad integrada de descarga desde una dirección URL HTTP de Pandas. Pandas tiene lectores para varios formatos de archivo:
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_parquet.html
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html
import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt
df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.parquet")
df.head(10)
df.dtypes
df.groupby('countries_and_territories').first().filter(['continent_exp','cases', 'deaths','date_rep'])
df.groupby('continent_exp').agg({'countries_and_territories': 'count','cases': 'count','deaths': 'count'})
import plotly.graph_objects as go
import plotly.express as px
import matplotlib.pyplot as plt
df.loc[: , ['countries_and_territories', 'cases', 'deaths']].groupby(['countries_and_territories'
]).max().sort_values(by='cases',ascending=False).reset_index()[:15].style.background_gradient(cmap='rainbow')
df_Worldwide=df[df['countries_and_territories']=='United_States_of_America']
df.plot(kind='line',x='date_rep',y="cases",grid=True)
df.plot(kind='line',x='date_rep',y="deaths",grid=True)
#df_Worldwide.plot(kind='line',x='date_rep',y="confirmed_change",grid=True)
#df_Worldwide.plot(kind='line',x='date_rep',y="deaths_change",grid=True)
Azure Databricks
Ejemplo no disponible para esta combinación de plataforma y paquete.
Azure Synapse
Ejemplo no disponible para esta combinación de plataforma y paquete.
Ejemplos
Consulte ejemplos de cómo se puede usar este conjunto de datos:
- Análisis de datos de COVID con un punto de conexión de Synapse SQL sin servidor
- Análisis de regresión lineal sobre datos de COVID mediante un punto de conexión de SQL en Azure Synapse Analytics
Pasos siguientes
Consulte el resto de los conjuntos de datos en el catálogo de Open Datasets.