Bing COVID-19

COVID-19-gegevens van Bing omvatten cijfers over bevestigde, fatale en genezen gevallen uit alle regio's en worden dagelijks bijgewerkt. Deze gegevens worden weergegeven in de Bing COVID-19 Tracker.

Bing verzamelt gegevens van meerdere vertrouwde, betrouwbare bronnen, waaronder de Wereldgezondheidsorganisatie (WHO), Centers for Disease Control and Prevention (CDC), nationale/regionale en staatsafdelingen voor volksgezondheid, BNO News, 24/7 Wall St. en Wikipedia.

Notitie

Microsoft biedt Azure Open Datasets op basis van 'zoals is'. Microsoft geeft geen garanties, uitdrukkelijk of impliciet, garanties of voorwaarden met betrekking tot uw gebruik van de gegevenssets. Voor zover toegestaan volgens uw lokale wetgeving, wijst Microsoft alle aansprakelijkheid af voor eventuele schade of verliezen, waaronder directe, gevolgschade, speciale, indirecte, incidentele of strafbare gegevenssets, die het gevolg zijn van uw gebruik van de gegevenssets.

Deze gegevensset wordt geleverd onder de oorspronkelijke voorwaarden dat Microsoft de brongegevens heeft ontvangen. De gegevensset kan gegevens bevatten die afkomstig zijn van Microsoft.

Gegevenssets

Gewijzigde gegevenssets zijn beschikbaar in CSV, JSON, JSON-Lijnen en Parquet.

Aan alle gewijzigde gegevenssets zijn ISO 3166-onderverdelingscodes en laadtijden toegevoegd. Ook worden voor de gegevenssets kolomnamen in kleine letters gescheiden door onderstrepingstekens gebruikt.

Onbewerkte gegevens: https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/bing_covid-19_data/latest/Bing-COVID19-Data.csv

Vorige versies van gewijzigde en onbewerkte gegevens: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/

Gegevensvolume

Alle gegevenssets worden dagelijks bijgewerkt. Vanaf 11 mei 2020 bevatten ze 125.576 rijen (CSV 16,1 MB, JSON 40,0 MB, JSONL 39,6 MB, Parquet 1,1 MB).

Licentie- en gebruiksrechten toewijzen

Deze gegevens zijn strikt beschikbaar voor educatieve en academische doeleinden, zoals medisch onderzoek, overheidsinstanties en academische instellingen, onder voorwaarden.

Gegevens die in publicaties worden gebruikt of geciteerd, moeten een naamsvermelding voor Bing COVID-19 Tracker bevatten met een koppeling naar www.bing.com/covid.

Contact

Neem contact op met askcovid19dl@microsoft.com voor vragen of feedback over deze of andere gegevenssets in de COVID-19 Data Lake.

Kolommen

Naam Gegevenstype Uniek Waarden (voorbeeld) Beschrijving
admin_region_1 tekenreeks 864 Texas Georgia Regio in country_region
admin_region_2 tekenreeks 3143 Washington County Seattle County Regio in admin_region_1
Bevestigd geheel getal (int) 120,692 1 2 Aantal bevestigde gevallen voor de regio
confirmed_change geheel getal (int) 12,120 1 2 Wijziging van het aantal bevestigde gevallen ten opzichte van de vorige dag
country_region tekenreeks 237 Verenigde Staten India Land/regio
Sterfgevallen geheel getal (int) 20,616 1 2 Aantal sterfgevallen voor de regio
deaths_change smallint 1,981 1 2 Wijziging van het aantal sterfgevallen ten opzichte van de vorige dag
id geheel getal (int) 1,783,534 742546 69019298 Unieke id
iso_subdivision tekenreeks 484 US-TX US-GA Tweedelige ISO-onderverdelingscode
iso2 tekenreeks 226 VS IN Landcode-id met twee letters
iso3 tekenreeks 226 USA IND Landcode-id met drie letters
breedtegraad dubbel 5,675 42.28708 19.59852 Breedtegraad van het massamiddelpunt van de regio
load_time timestamp 1 2021-04-26 00:06:34.719000 De datum en tijd waarop het bestand vanuit de Bing-bron in GitHub is geladen
lengtegraad dubbel 5,693 -2.5396 -155.5186 Lengtegraad van het massamiddelpunt van de regio
Hersteld geheel getal (int) 73,287 1 2 Aantal genezen gevallen voor de regio
recovered_change geheel getal (int) 10,441 1 2 Wijziging van het aantal genezen gevallen ten opzichte van de vorige dag
bijgewerkt datum 457 2021-04-23 2021-04-22 De peildatum voor de record

Preview

id bijgewerkt Bevestigd Sterfgevallen iso2 iso3 country_region admin_region_1 iso_subdivision admin_region_2 load_time confirmed_change deaths_change
338995 2020-01-21 262 0 null Nul Wereldwijd Nul Nul Nul 26-4-2021 12:06:34 uur
338996 2020-01-22 313 0 null Nul Wereldwijd Nul Nul Nul 26-4-2021 12:06:34 uur 51 0
338997 2020-01-23 578 0 null Nul Wereldwijd Nul Nul Nul 26-4-2021 12:06:34 uur 265 0
338998 2020-01-24 841 0 null Nul Wereldwijd Nul Nul Nul 26-4-2021 12:06:34 uur 263 0
338999 2020-01-25 1320 0 null Nul Wereldwijd Nul Nul Nul 26-4-2021 12:06:34 uur 479 0
339000 2020-01-26 2014 0 null Nul Wereldwijd Nul Nul Nul 26-4-2021 12:06:34 uur 694 0
339001 2020-01-27 2798 0 null Nul Wereldwijd Nul Nul Nul 26-4-2021 12:06:34 uur 784 0
339002 2020-01-28 4593 0 null Nul Wereldwijd Nul Nul Nul 26-4-2021 12:06:34 uur 1795 0
339003 2020-01-29 6065 0 null Nul Wereldwijd Nul Nul Nul 26-4-2021 12:06:34 uur 1472 0
339004 2020-01-30 7818 0 null Nul Wereldwijd Nul Nul Nul 26-4-2021 12:06:34 uur 1753 0

Toegang tot gegevens

Azure Notebooks

Dit notebook documenteerde de URL's en voorbeeldcode voor toegang tot de Bing COVID-19-gegevensset

Gebruik de volgende URL's om specifieke bestandsindelingen op te halen die worden gehost in Azure Blob Storage:

CSV: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.csv

JSON: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.json

JSONL: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.jsonl

Parquet: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.parquet

Download het gegevenssetbestand met behulp van de ingebouwde mogelijkheid downloaden van een HTTP-URL in Pandas. Pandas heeft lezers voor verschillende bestandsindelingen:

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_parquet.html

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html

import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt

df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.parquet")
df.head(10)

Hiermee kunt u de gegevenstypen van de verschillende velden controleren en controleren of de bijgewerkte kolom datum/tijd-indeling is

df.dtypes

We gaan nu kijken naar wereldwijde gegevens en enkele eenvoudige grafieken tekenen om de gegevens te visualiseren

df_Worldwide=df[df['country_region']=='Worldwide']
df_Worldwide_pivot=df_Worldwide.pivot_table(df_Worldwide, index=['country_region','updated'])

df_Worldwide_pivot
df_Worldwide.plot(kind='line',x='updated',y="confirmed",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="confirmed_change",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths_change",grid=True)

Azure Databricks

Voorbeeld niet beschikbaar voor deze combinatie van platform/pakket.

Azure Synapse

Voorbeeld niet beschikbaar voor deze combinatie van platform/pakket.

Volgende stappen

Bekijk de rest van de gegevenssets in de catalogus Open Datasets.