Bing COVID-19
Los datos de COVID-19 de Bing incluyen los casos confirmados, los fallecimientos y los casos recuperados de todas las regiones. Se actualizan a diario. El Bing COVID-19 Tracker refleja estos datos.
Bing recopila datos de múltiples fuentes fiables y de confianza, entre las que se incluyen:
- Noticias de BNO
- Centros para el Control y la Prevención de Enfermedades (CDC)
- Departamentos de salud pública nacionales/regionales y estatales
- Wikipedia
- La Organización Mundial de la Salud (OMS)
- 24/7 Wall St.
Nota:
Microsoft proporciona Azure Open Datasets "tal cual". Microsoft no ofrece ninguna garantía, expresa o implícita, ni condición con respecto al uso que usted haga de los conjuntos de datos. En la medida en la que lo permita su legislación local, Microsoft declina toda responsabilidad por posibles daños o pérdidas, incluidos los daños directos, consecuenciales, especiales, indirectos, incidentales o punitivos, que resulten de su uso de los conjuntos de datos.
Este conjunto de datos se proporciona bajo los términos originales con los que Microsoft recibió los datos de origen. El conjunto de datos puede incluir datos procedentes de Microsoft.
Conjuntos de datos
Los conjuntos de datos Bing COVID-19 modificados están disponibles en CSV, JSON, JSON-Lines y Parquet:
A todos los conjuntos de datos modificados se les han agregado los códigos de subdivisión ISO 3166 y los tiempos de carga. Utilizan nombres de columna en minúsculas con separadores de guión bajo.
Datos sin procesar en formato CSV
Las versiones anteriores de los datos modificados y sin procesar están disponibles en este recurso.
Volumen de datos
Todos los conjuntos de datos se actualizan diariamente. A 5 de marzo de 2023 contenían 4 766 737 filas. El conjunto de datos está disponible en estos formatos de archivo:
- CSV (560,3 MB)
- JSON (1515,6 MB)
- JSONL (1506,2 MB)
- Parquet (55,4 MB)
Atribución de licencias y derechos de uso
Los datos están disponibles estrictamente para fines educativos y académicos bajo estos términos y condiciones. Entre los fines válidos se incluyen:
- instituciones académicas
- organismos públicos
- investigación médica
Los datos utilizados o citados en publicaciones deben incluir una atribución a "Bing COVID-19 Tracker", con un vínculo a www.bing.com/covid.
Contacto
Si tiene alguna pregunta o comentario sobre este u otros conjuntos de datos del lago de datos COVID-19, póngase en contacto con askcovid19dl@microsoft.com.
Columnas
Nombre | Tipo de datos | Único | Valores (ejemplo) | Descripción |
---|---|---|---|---|
admin_region_1 | string | 864 | Texas Georgia | Región dentro de country_region |
admin_region_2 | string | 3143 | Washington County Jefferson County | Región dentro de admin_region_1 |
confirmed | int | 120 692 | 1 2 | Número de casos confirmados en la región |
confirmed_change | int | 12 120 | 1 2 | Cambio del número de casos confirmados con respecto al día anterior |
country_region | string | 237 | Estados Unidos India | País/región |
deaths | int | 20 616 | 1 2 | Número de muertes en la región |
deaths_change | SMALLINT | 1981 | 1 2 | Cambio del número de muertes con respecto al día anterior |
id | int | 1 783 534 | 742546 69019298 | Identificador único |
iso_subdivision | string | 484 | US-TX US-GA | Código de subdivisión según la norma ISO, segunda parte |
iso2 | string | 226 | US IN | Identificador de código de país de 2 letras |
iso3 | string | 226 | USA IND | Identificador de código de país de 3 letras |
latitude | double | 5675 | 42.28708 19.59852 | Latitud del centroide de la región |
load_time | timestamp | 1 | 26-04-2021 00:06:34.719000 | La fecha y hora de carga del archivo desde el origen de Bing en GitHub |
longitude | double | 5693 | -2.5396 -155.5186 | Longitud del centroide de la región |
recovered | int | 73 287 | 1 2 | Número de recuperados en la región |
recovered_change | int | 10 441 | 1 2 | Cambio del número de casos recuperados con respecto al día anterior |
actualizado | date | 457 | 23-04-2021 22-04-2021 | Registro a fecha de hoy |
Vista previa
id | actualizado | confirmed | deaths | iso2 | iso3 | country_region | admin_region_1 | iso_subdivision | admin_region_2 | load_time | confirmed_change | deaths_change |
---|---|---|---|---|---|---|---|---|---|---|---|---|
338995 | 2020-01-21 | 262 | 0 | null | null | Todo el mundo | null | null | null | 26/04/2021 12:06:34 AM | ||
338996 | 22-01-2020 | 313 | 0 | null | null | Todo el mundo | null | null | null | 26/04/2021 12:06:34 AM | 51 | 0 |
338997 | 23-1-2020 | 578 | 0 | null | null | Todo el mundo | null | null | null | 26/04/2021 12:06:34 AM | 265 | 0 |
338998 | 24-01-2020 | 841 | 0 | null | null | Todo el mundo | null | null | null | 26/04/2021 12:06:34 AM | 263 | 0 |
338999 | 25-01-2020 | 1320 | 0 | null | null | Todo el mundo | null | null | null | 26/04/2021 12:06:34 AM | 479 | 0 |
339000 | 26-01-2020 | 2014 | 0 | null | null | Todo el mundo | null | null | null | 26/04/2021 12:06:34 AM | 694 | 0 |
339001 | 27-01-2020 | 2798 | 0 | null | null | Todo el mundo | null | null | null | 26/04/2021 12:06:34 AM | 784 | 0 |
339002 | 28-01-2020 | 4593 | 0 | null | null | Todo el mundo | null | null | null | 26/04/2021 12:06:34 AM | 1795 | 0 |
339003 | 29-01-2020 | 6065 | 0 | null | null | Todo el mundo | null | null | null | 26/04/2021 12:06:34 AM | 1472 | 0 |
339004 | 30-1-2020 | 7818 | 0 | null | null | Todo el mundo | null | null | null | 26/04/2021 12:06:34 AM | 1753 | 0 |
Acceso a datos: Azure Notebooks
Nota:
Este cuaderno documenta las URL y el código de muestra para acceder al Conjunto de datos Bing COVID-19.
Utilice estas URL para obtener formatos de archivo específicos alojados en Azure Blob Storage:
Descargue el archivo del conjunto de datos utilizando la capacidad incorporada de Pandas para descargar desde una URL HTTP. Pandas tiene lectores para varios formatos de archivo:
import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt
df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.parquet")
df.head(10)
Para comprobar que la columna actualizada tiene formato de fecha y hora, compruebe los tipos de datos de los distintos campos:
df.dtypes
Revisar los datos mundiales. Para visualizar los datos, cree algunos gráficos:
df_Worldwide=df[df['country_region']=='Worldwide']
df_Worldwide_pivot=df_Worldwide.pivot_table(df_Worldwide, index=['country_region','updated'])
df_Worldwide_pivot
df_Worldwide.plot(kind='line',x='updated',y="confirmed",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="confirmed_change",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths_change",grid=True)
Acceso a datos: Azure Databricks
No hay ninguna muestra disponible para esta combinación de plataforma / paquete.
Acceso a datos: Azure Synapse
No hay ninguna muestra disponible para esta combinación de plataforma / paquete.
Pasos siguientes
Consulte el resto de los conjuntos de datos en el catálogo de Open Datasets.