Share via


Bing COVID-19

Les données COVID-19 de Bing incluent les cas confirmés, décédés et guéris de toutes les régions, mis à jour quotidiennement. Ces données sont reflétées dans le suivi Bing COVID-19 Tracker.

Bing collecte des données à partir de plusieurs sources fiables et approuvées, notamment l’Organisation mondiale de la santé (OMS), les centres pour le contrôle et la prévention des maladies (CDC, Centers for Disease Control and Prevention), les services de santé publique nationaux/régionaux et d’état, BNO News, 24/7 Wall St. et Wikipédia.

Notes

Microsoft fournit Azure Open Datasets « en l’état ». Microsoft n’offre aucune garantie, expresse ou implicite, ni de conditions relatives à votre utilisation des jeux de données. Dans la mesure autorisée par votre droit local, Microsoft décline toute responsabilité pour les dommages ou pertes, y compris directs, consécutifs, spéciaux, indirects ou punitifs, résultant de votre utilisation des jeux de données.

Ce jeu de données est fourni selon les conditions initiales par lesquelles Microsoft a reçu les données sources. Le jeu de données peut inclure des données provenant de Microsoft.

Groupes de données

Les jeux de données modifiés sont disponibles aux formats CSV, JSON, JSON-Lines et Parquet.

Tous les jeux de données modifiés se sont vu ajouter des codes de subdivision ISO 3166 et des temps de chargement, et utilisent des noms de colonnes en minuscules avec des séparateurs de soulignement.

Données brutes : https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/bing_covid-19_data/latest/Bing-COVID19-Data.csv

Versions précédentes des données modifiées et brutes : https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/

Volume de données

Tous les jeux de données sont mis à jour quotidiennement. Au 11 mai 2020, ils contenaient 125 576 lignes (CSV 1,1 Mo, JSON 40 Mo, JSONL 39,60 Mo, Parquet 1,1 Mo).

Attribution des licences et des droits d’utilisation

Ces données sont disponibles exclusivement à des fins éducatives et académiques, telles que la recherche médicale, les organismes gouvernementaux et les établissements scolaires, dans le cadre des conditions générales.

Les données utilisées ou citées dans des publications doivent inclure une attribution à « Bing COVID-19 Tracker » avec un lien vers www.bing.com/covid.

Contact

Pour toute question ou commentaire sur ce jeu de données ou d’autres jeux de données dans le Data Lake COVID-19, veuillez contacter askcovid19dl@microsoft.com.

Colonnes

Nom Type de données Unique Valeurs (exemple) Description
admin_region_1 string 864 Texas Géorgie Région dans country_region
admin_region_2 string 3,143 Comté de Washington Comté de Jefferson Région dans admin_region_1
confirmed int 120 692 1 2 Nombre de cas confirmés pour la région
confirmed_change int 12 120 1 2 Différence de cas confirmés par rapport au jour précédent
country_region string 237 États-Unis Inde Pays/région
deaths int 20 616 1 2 Nombre de décès pour la région
deaths_change SMALLINT 1 981 1 2 Différence de nombre de décès par rapport au jour précédent
id int 1 783 534 742546 69019298 Identificateur unique
iso_subdivision string 484 US-TX US-GA Codes de subdivision ISO en deux parties
iso2 string 226 US-IN Code pays à 2 lettres
iso3 string 226 USA IND Code pays à 3 lettres
latitude double 5 675 42.28708 19.59852 Latitude du centroïde de la région
load_time timestamp 1 2021-04-26 00:06:34.719000 Date et heure du chargement du fichier à partir de la source Bing sur GitHub
longitude double 5 693 -2,5396 -155,5186 Longitude du centroïde de la région
recovered int 73 287 1 2 Nombre de personnes guéries pour la région
recovered_change int 10 441 1 2 Différence de nombre de personnes guéries par rapport au jour précédent
date de mise à jour Date 457 2021-04-23 2021-04-22 Date de l’enregistrement

Préversion

id date de mise à jour confirmed deaths iso2 iso3 country_region admin_region_1 iso_subdivision admin_region_2 load_time confirmed_change deaths_change
338995 2020-01-21 262 0 null null Monde entier null null null 26/04/2021 00:06:34
338996 2020-01-22 313 0 null null Monde entier null null null 26/04/2021 00:06:34 51 0
338997 23-01-2020 578 0 null null Monde entier null null null 26/04/2021 00:06:34 265 0
338998 2020-01-24 841 0 null null Monde entier null null null 26/04/2021 00:06:34 263 0
338999 2020-01-25 1320 0 null null Monde entier null null null 26/04/2021 00:06:34 479 0
339000 2020-01-26 2014 0 null null Monde entier null null null 26/04/2021 00:06:34 694 0
339001 2020-01-27 2798 0 null null Monde entier null null null 26/04/2021 00:06:34 784 0
339002 2020-01-28 4593 0 null null Monde entier null null null 26/04/2021 00:06:34 1795 0
339003 2020-01-29 6065 0 null null Monde entier null null null 26/04/2021 00:06:34 1472 0
339004 30-01-2020 7818 0 null null Monde entier null null null 26/04/2021 00:06:34 1753 0

Accès aux données

Azure Notebooks

Ce bloc-notes documente les URL et les exemples de code pour accéder au jeu de données Bing COVID-19

Utilisez les URL suivantes pour récupérer des formats de fichier spécifiques hébergés sur des objets Blob Azure Stockage :

CSV : https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.csv

JSON : https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.json

JSONL : https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.jsonl

Parquet : https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.parquet

Téléchargez le fichier de jeu de données à l’aide de la capacité intégrée permettant de télécharger à partir d’une URL HTTP dans Pandas. Pandas comprend des visionneuses pour différents formats de fichiers :

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_parquet.html

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html

import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt

df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.parquet")
df.head(10)

Vérifions les types de données des différents champs et vérifions que la colonne mise à jour est au format DateHeure

df.dtypes

Nous allons maintenant examiner les données mondiales et tracer des graphiques simples pour visualiser les données

df_Worldwide=df[df['country_region']=='Worldwide']
df_Worldwide_pivot=df_Worldwide.pivot_table(df_Worldwide, index=['country_region','updated'])

df_Worldwide_pivot
df_Worldwide.plot(kind='line',x='updated',y="confirmed",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="confirmed_change",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths_change",grid=True)

Azure Databricks

Exemple non disponible pour cette combinaison de plateforme et de package.

Azure Synapse

Exemple non disponible pour cette combinaison de plateforme et de package.

Étapes suivantes

Consultez les autres jeux de données du catalogue Open Datasets.