Bing COVID-19
Los datos de COVID-19 de Bing incluyen los casos confirmados, los fallecimientos y los casos recuperados de todas las regiones. Se actualizan a diario. Estos datos se reflejan en Seguimiento de COVID-19 en Bing.
Bing recopila datos de múltiples fuentes confiables, como la Organización Mundial de la Salud (OMS), Centros para el Control y la Prevención de Enfermedades (CDC), los ministerios de salud públicos de Estado regionales y nacionales, BNO News, 24/7 Wall St. y Wikipedia.
Nota
Microsoft proporciona Azure Open Datasets "tal cual". Microsoft no ofrece ninguna garantía, expresa o implícita, ni condición con respecto al uso que usted haga de los conjuntos de datos. En la medida en la que lo permita su legislación local, Microsoft declina toda responsabilidad por posibles daños o pérdidas, incluidos los daños directos, consecuenciales, especiales, indirectos, incidentales o punitivos, que resulten de su uso de los conjuntos de datos.
Este conjunto de datos se proporciona bajo los términos originales con los que Microsoft recibió los datos de origen. El conjunto de datos puede incluir datos procedentes de Microsoft.
Conjuntos de datos
Los conjuntos de datos modificados están disponibles en los formatos CSV, JSON, JSON-Lines y Parquet.
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.csv
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.json
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.jsonl
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.parquet
Todos los conjuntos de datos modificados tienen códigos de subdivisión conforme a la norma ISO 3166 y tiempos de carga agregados, y utilizan minúsculas para los nombres de las columnas con guiones bajos como separadores.
Datos sin procesar: https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/bing_covid-19_data/latest/Bing-COVID19-Data.csv
Versiones anteriores de datos modificados y sin procesar: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/
Volumen de datos
Todos los conjuntos de datos se actualizan cada día. A 11 de mayo de 2020 contenían 125 576 filas (CSV 16,1 MB, JSON 40,0 MB, JSONL 39,6 MB, Parquet 1,1 MB).
Atribución de licencias y derechos de uso
Estos datos están disponibles estrictamente con fines educativos y académicos, como la investigación médica, las agencias gubernamentales y las instituciones académicas, en términos y condiciones.
Los datos que se usen o se citen en las publicaciones deben incluir una atribución a "Seguimiento de COVID-19 en Bing" con un vínculo a www.bing.com/covid.
Contacto
Si tiene alguna duda o desea aportar algún comentario sobre este u otros conjuntos de datos del lago de datos COVID-19, póngase en contacto con askcovid19dl@microsoft.com.
Columnas
Nombre | Tipo de datos | Único | Valores (ejemplo) | Descripción |
---|---|---|---|---|
admin_region_1 | string | 864 | Texas Georgia | Región dentro de country_region |
admin_region_2 | string | 3143 | Washington County Jefferson County | Región dentro de admin_region_1 |
confirmed | int | 120 692 | 1 2 | Número de casos confirmados en la región |
confirmed_change | int | 12 120 | 1 2 | Cambio del número de casos confirmados con respecto al día anterior |
country_region | string | 237 | Estados Unidos India | País/región |
deaths | int | 20 616 | 1 2 | Número de muertes en la región |
deaths_change | SMALLINT | 1981 | 1 2 | Cambio del número de muertes con respecto al día anterior |
id | int | 1 783 534 | 742546 69019298 | Identificador único |
iso_subdivision | string | 484 | US-TX US-GA | Código de subdivisión según la norma ISO, segunda parte |
iso2 | string | 226 | US IN | Identificador de código de país de 2 letras |
iso3 | string | 226 | USA IND | Identificador de código de país de 3 letras |
latitude | double | 5675 | 42.28708 19.59852 | Latitud del centroide de la región |
load_time | timestamp | 1 | 26-04-2021 00:06:34.719000 | La fecha y hora de carga del archivo desde el origen de Bing en GitHub |
longitude | double | 5693 | -2.5396 -155.5186 | Longitud del centroide de la región |
recovered | int | 73 287 | 1 2 | Número de recuperados en la región |
recovered_change | int | 10 441 | 1 2 | Cambio del número de casos recuperados con respecto al día anterior |
actualizado | date | 457 | 23-04-2021 22-04-2021 | Registro a fecha de hoy |
Vista previa
id | actualizado | confirmed | deaths | iso2 | iso3 | country_region | admin_region_1 | iso_subdivision | admin_region_2 | load_time | confirmed_change | deaths_change |
---|---|---|---|---|---|---|---|---|---|---|---|---|
338995 | 2020-01-21 | 262 | 0 | null | null | Todo el mundo | null | null | null | 26/04/2021 12:06:34 AM | ||
338996 | 22-01-2020 | 313 | 0 | null | null | Todo el mundo | null | null | null | 26/04/2021 12:06:34 AM | 51 | 0 |
338997 | 23-1-2020 | 578 | 0 | null | null | Todo el mundo | null | null | null | 26/04/2021 12:06:34 AM | 265 | 0 |
338998 | 24-01-2020 | 841 | 0 | null | null | Todo el mundo | null | null | null | 26/04/2021 12:06:34 AM | 263 | 0 |
338999 | 25-01-2020 | 1320 | 0 | null | null | Todo el mundo | null | null | null | 26/04/2021 12:06:34 AM | 479 | 0 |
339000 | 26-01-2020 | 2014 | 0 | null | null | Todo el mundo | null | null | null | 26/04/2021 12:06:34 AM | 694 | 0 |
339001 | 27-01-2020 | 2798 | 0 | null | null | Todo el mundo | null | null | null | 26/04/2021 12:06:34 AM | 784 | 0 |
339002 | 28-01-2020 | 4593 | 0 | null | null | Todo el mundo | null | null | null | 26/04/2021 12:06:34 AM | 1795 | 0 |
339003 | 29-01-2020 | 6065 | 0 | null | null | Todo el mundo | null | null | null | 26/04/2021 12:06:34 AM | 1472 | 0 |
339004 | 30-1-2020 | 7818 | 0 | null | null | Todo el mundo | null | null | null | 26/04/2021 12:06:34 AM | 1753 | 0 |
Acceso a datos
Azure Notebooks
En este cuaderno se documentan las direcciones URL y el código de ejemplo para acceder al conjunto de datos Bing COVID-19
Use las siguientes direcciones URL para obtener formatos de archivo específicos hospedados en Azure Blob Storage:
Descargue el archivo del conjunto de datos mediante la funcionalidad integrada de descarga desde una dirección URL HTTP de Pandas. Pandas tiene lectores para varios formatos de archivo:
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_parquet.html
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html
import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt
df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.parquet")
df.head(10)
Se comprobarán los tipos de datos de los distintos campos y que la columna actualizada tiene el formato datetime
df.dtypes
Ahora se buscarán datos a nivel mundial y se trazarán algunos gráficos sencillos para visualizar los datos.
df_Worldwide=df[df['country_region']=='Worldwide']
df_Worldwide_pivot=df_Worldwide.pivot_table(df_Worldwide, index=['country_region','updated'])
df_Worldwide_pivot
df_Worldwide.plot(kind='line',x='updated',y="confirmed",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="confirmed_change",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths_change",grid=True)
Azure Databricks
Ejemplo no disponible para esta combinación de plataforma y paquete.
Azure Synapse
Ejemplo no disponible para esta combinación de plataforma y paquete.
Pasos siguientes
Consulte el resto de los conjuntos de datos en el catálogo de Open Datasets.