Bing COVID-19

I dati su COVID-19 di Bing includono i casi confermati, letali e di guarigione da tutte le aree geografiche, aggiornati ogni giorno. Questi dati sono rispecchiati in Bing COVID-19 Tracker.

Bing raccoglie dati da più origini affidabili, tra cui World Health Organization (WHO), Centers for Disease Control and Prevention (CDC), autorità sanitarie nazionali e statali, BNO News, 24/7 Wall St. e Wikipedia.

Nota

Microsoft fornisce set di dati aperti di Azure su base "così come è". Microsoft non garantisce, esplicitamente o implicitamente, garanzie o condizioni in relazione all'uso dei set di dati. Nella misura consentita dalla legge locale, Microsoft dichiara tutte le responsabilità per eventuali danni o perdite, tra cui diretto, consequenziale, speciale, indiretto, incidentale o incidentale, risultante dall'uso dei set di dati.

Questo set di dati viene fornito in conformità con le condizioni originali in base alle quali Microsoft ha ricevuto i dati di origine. Il set di dati potrebbe includere dati provenienti da Microsoft.

Set di dati

I set di dati modificati sono disponibili in CSV, JSON, JSON-Lines e Parquet.

A tutti i set di dati modificati sono stati aggiunti codici di suddivisione ISO 3166 e tempi di caricamento e i set di dati usano nomi di colonna minuscoli con caratteri di sottolineatura come separatori.

Dati non elaborati: https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/bing_covid-19_data/latest/Bing-COVID19-Data.csv

Versioni precedenti di dati modificati e non elaborati: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/

Volume dati

Tutti i set di dati vengono aggiornati ogni giorno. A partire dal 11 maggio 2020 contengono 125.576 righe (CSV 16,1 MB, JSON 40,0 MB, JSONL 39,6 MB, Parquet 1,1 MB).

Attribuzione dei diritti di licenza e utilizzo

Questi dati sono disponibili esclusivamente per scopi didattici e accademici, come la ricerca medica, le agenzie governative e gli istituti accademici, in termini e condizioni.

I dati utilizzati o citati nelle pubblicazioni devono includere un'attribuzione a "Bing COVID-19 Tracker" con un collegamento a www.bing.com/covid.

Contatto

Se hai domande o feedback su questo o su altri set di dati nel data lake per COVID-19, contatta askcovid19dl@microsoft.com.

Colonne

Nome Tipo di dati Univoco Valori (esempio) Descrizione
admin_region_1 string 864 Texas Georgia Area geografica in country_region
admin_region_2 string 3,143 Washington County Jefferson County Area geografica in admin_region_1
Confermato INT 120,692 1 2 Conteggio di casi confermati per l'area geografica
confirmed_change int 12,120 1 2 Modifica del conteggio di casi confermati rispetto al giorno precedente
country_region string 237 Stati Uniti India Paese/Area geografica
Morti int 20,616 1 2 Conteggio di casi letali per l'area geografica
deaths_change SMALLINT 1,981 1 2 Modifica del conteggio di casi letali rispetto al giorno precedente
id INT 1,783,534 742546 69019298 Identificatore univoco
iso_subdivision string 484 US-TX US-GA Codice di suddivisione ISO in due parti
iso2 string 226 US IN Codice paese a 2 lettere
iso3 string 226 USA IND Codice paese a 3 lettere
latitudine double 5,675 42.28708 19.59852 Latitudine del centroide dell'area geografica
load_time timestamp 1 2021-04-26 00:06:34.719000 Data e ora del caricamento del file dall'origine Bing in GitHub
longitudine double 5,693 -2.5396 -155.5186 Longitudine del centroide dell'area geografica
Recuperato int 73,287 1 2 Conteggio di casi di guarigione per l'area geografica
recovered_change int 10,441 1 2 Modifica del conteggio di casi di guarigione rispetto al giorno precedente
informazioni aggiornate data 457 2021-04-23 2021-04-22 Data specifica per il record

Anteprima

id informazioni aggiornate Confermato Morti iso2 iso3 country_region admin_region_1 iso_subdivision admin_region_2 load_time confirmed_change deaths_change
338995 2020-01-21 262 0 Null Null Tutto il mondo Null Null Null 4/26/2021 12:06:34
338996 2020-01-22 313 0 Null Null Tutto il mondo Null Null Null 4/26/2021 12:06:34 51 0
338997 2020-01-23 578 0 Null Null Tutto il mondo Null Null Null 4/26/2021 12:06:34 265 0
338998 2020-01-24 841 0 Null Null Tutto il mondo Null Null Null 4/26/2021 12:06:34 263 0
338999 2020-01-25 1320 0 Null Null Tutto il mondo Null Null Null 4/26/2021 12:06:34 479 0
339000 2020-01-26 2014 0 Null Null Tutto il mondo Null Null Null 26/4/2021 12:06:34 694 0
339001 2020-01-27 2798 0 Null Null Tutto il mondo Null Null Null 26/4/2021 12:06:34 784 0
339002 2020-01-28 4593 0 Null Null Tutto il mondo Null Null Null 26/4/2021 12:06:34 1795 0
339003 29-01-2020 6065 0 Null Null Tutto il mondo Null Null Null 26/4/2021 12:06:34 1472 0
339004 2020-01-30 7818 0 Null Null Tutto il mondo Null Null Null 26/4/2021 12:06:34 1753 0

Accesso ai dati

Azure Notebooks

Questo notebook documenta gli URL e il codice di esempio per accedere al set di dati Bing COVID-19

Usare gli URL seguenti per ottenere formati di file specifici ospitati in Archiviazione BLOB di Azure:

CSV: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.csv

JSON: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.json

JSONL: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.jsonl

Parquet: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.parquet

Scaricare il file del set di dati usando il download della funzionalità predefinita da un URL HTTP in Pandas. Pandas ha lettori per diversi formati di file:

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_parquet.html

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html

import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt

df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.parquet")
df.head(10)

Consente di controllare i tipi di dati dei vari campi e verificare che la colonna aggiornata sia in formato datetime

df.dtypes

Verranno ora esaminati i dati in tutto il mondo e verranno tracciati alcuni grafici semplici per visualizzare i dati

df_Worldwide=df[df['country_region']=='Worldwide']
df_Worldwide_pivot=df_Worldwide.pivot_table(df_Worldwide, index=['country_region','updated'])

df_Worldwide_pivot
df_Worldwide.plot(kind='line',x='updated',y="confirmed",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="confirmed_change",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths_change",grid=True)

Azure Databricks

Esempio non disponibile per questa combinazione di piattaforma/pacchetto.

Azure Synapse

Esempio non disponibile per questa combinazione di piattaforma/pacchetto.

Passaggi successivi

Visualizzare il resto dei set di dati nel catalogo Open Datasets.