Bing COVID-19
COVID-19-gegevens van Bing omvatten cijfers over bevestigde, fatale en genezen gevallen uit alle regio's en worden dagelijks bijgewerkt. Deze gegevens worden weergegeven in de Bing COVID-19 Tracker.
Bing verzamelt gegevens van meerdere vertrouwde, betrouwbare bronnen, waaronder de Wereldgezondheidsorganisatie (WHO), Centers for Disease Control and Prevention (CDC), nationale/regionale en staatsafdelingen voor volksgezondheid, BNO News, 24/7 Wall St. en Wikipedia.
Notitie
Microsoft biedt Azure Open Datasets op basis van 'zoals is'. Microsoft geeft geen garanties, uitdrukkelijk of impliciet, garanties of voorwaarden met betrekking tot uw gebruik van de gegevenssets. Voor zover toegestaan volgens uw lokale wetgeving, wijst Microsoft alle aansprakelijkheid af voor eventuele schade of verliezen, waaronder directe, gevolgschade, speciale, indirecte, incidentele of strafbare gegevenssets, die het gevolg zijn van uw gebruik van de gegevenssets.
Deze gegevensset wordt geleverd onder de oorspronkelijke voorwaarden dat Microsoft de brongegevens heeft ontvangen. De gegevensset kan gegevens bevatten die afkomstig zijn van Microsoft.
Gegevenssets
Gewijzigde gegevenssets zijn beschikbaar in CSV, JSON, JSON-Lijnen en Parquet.
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.csv
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.json
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.jsonl
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.parquet
Aan alle gewijzigde gegevenssets zijn ISO 3166-onderverdelingscodes en laadtijden toegevoegd. Ook worden voor de gegevenssets kolomnamen in kleine letters gescheiden door onderstrepingstekens gebruikt.
Onbewerkte gegevens: https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/bing_covid-19_data/latest/Bing-COVID19-Data.csv
Vorige versies van gewijzigde en onbewerkte gegevens: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/
Gegevensvolume
Alle gegevenssets worden dagelijks bijgewerkt. Vanaf 11 mei 2020 bevatten ze 125.576 rijen (CSV 16,1 MB, JSON 40,0 MB, JSONL 39,6 MB, Parquet 1,1 MB).
Licentie- en gebruiksrechten toewijzen
Deze gegevens zijn strikt beschikbaar voor educatieve en academische doeleinden, zoals medisch onderzoek, overheidsinstanties en academische instellingen, onder voorwaarden.
Gegevens die in publicaties worden gebruikt of geciteerd, moeten een naamsvermelding voor Bing COVID-19 Tracker bevatten met een koppeling naar www.bing.com/covid.
Contact
Neem contact op met askcovid19dl@microsoft.com voor vragen of feedback over deze of andere gegevenssets in de COVID-19 Data Lake.
Kolommen
Naam | Gegevenstype | Uniek | Waarden (voorbeeld) | Beschrijving |
---|---|---|---|---|
admin_region_1 | tekenreeks | 864 | Texas Georgia | Regio in country_region |
admin_region_2 | tekenreeks | 3143 | Washington County Seattle County | Regio in admin_region_1 |
Bevestigd | geheel getal (int) | 120,692 | 1 2 | Aantal bevestigde gevallen voor de regio |
confirmed_change | geheel getal (int) | 12,120 | 1 2 | Wijziging van het aantal bevestigde gevallen ten opzichte van de vorige dag |
country_region | tekenreeks | 237 | Verenigde Staten India | Land/regio |
Sterfgevallen | geheel getal (int) | 20,616 | 1 2 | Aantal sterfgevallen voor de regio |
deaths_change | smallint | 1,981 | 1 2 | Wijziging van het aantal sterfgevallen ten opzichte van de vorige dag |
id | geheel getal (int) | 1,783,534 | 742546 69019298 | Unieke id |
iso_subdivision | tekenreeks | 484 | US-TX US-GA | Tweedelige ISO-onderverdelingscode |
iso2 | tekenreeks | 226 | VS IN | Landcode-id met twee letters |
iso3 | tekenreeks | 226 | USA IND | Landcode-id met drie letters |
breedtegraad | dubbel | 5,675 | 42.28708 19.59852 | Breedtegraad van het massamiddelpunt van de regio |
load_time | timestamp | 1 | 2021-04-26 00:06:34.719000 | De datum en tijd waarop het bestand vanuit de Bing-bron in GitHub is geladen |
lengtegraad | dubbel | 5,693 | -2.5396 -155.5186 | Lengtegraad van het massamiddelpunt van de regio |
Hersteld | geheel getal (int) | 73,287 | 1 2 | Aantal genezen gevallen voor de regio |
recovered_change | geheel getal (int) | 10,441 | 1 2 | Wijziging van het aantal genezen gevallen ten opzichte van de vorige dag |
bijgewerkt | datum | 457 | 2021-04-23 2021-04-22 | De peildatum voor de record |
Preview
id | bijgewerkt | Bevestigd | Sterfgevallen | iso2 | iso3 | country_region | admin_region_1 | iso_subdivision | admin_region_2 | load_time | confirmed_change | deaths_change |
---|---|---|---|---|---|---|---|---|---|---|---|---|
338995 | 2020-01-21 | 262 | 0 | null | Nul | Wereldwijd | Nul | Nul | Nul | 26-4-2021 12:06:34 uur | ||
338996 | 2020-01-22 | 313 | 0 | null | Nul | Wereldwijd | Nul | Nul | Nul | 26-4-2021 12:06:34 uur | 51 | 0 |
338997 | 2020-01-23 | 578 | 0 | null | Nul | Wereldwijd | Nul | Nul | Nul | 26-4-2021 12:06:34 uur | 265 | 0 |
338998 | 2020-01-24 | 841 | 0 | null | Nul | Wereldwijd | Nul | Nul | Nul | 26-4-2021 12:06:34 uur | 263 | 0 |
338999 | 2020-01-25 | 1320 | 0 | null | Nul | Wereldwijd | Nul | Nul | Nul | 26-4-2021 12:06:34 uur | 479 | 0 |
339000 | 2020-01-26 | 2014 | 0 | null | Nul | Wereldwijd | Nul | Nul | Nul | 26-4-2021 12:06:34 uur | 694 | 0 |
339001 | 2020-01-27 | 2798 | 0 | null | Nul | Wereldwijd | Nul | Nul | Nul | 26-4-2021 12:06:34 uur | 784 | 0 |
339002 | 2020-01-28 | 4593 | 0 | null | Nul | Wereldwijd | Nul | Nul | Nul | 26-4-2021 12:06:34 uur | 1795 | 0 |
339003 | 2020-01-29 | 6065 | 0 | null | Nul | Wereldwijd | Nul | Nul | Nul | 26-4-2021 12:06:34 uur | 1472 | 0 |
339004 | 2020-01-30 | 7818 | 0 | null | Nul | Wereldwijd | Nul | Nul | Nul | 26-4-2021 12:06:34 uur | 1753 | 0 |
Toegang tot gegevens
Azure Notebooks
Dit notebook documenteerde de URL's en voorbeeldcode voor toegang tot de Bing COVID-19-gegevensset
Gebruik de volgende URL's om specifieke bestandsindelingen op te halen die worden gehost in Azure Blob Storage:
Download het gegevenssetbestand met behulp van de ingebouwde mogelijkheid downloaden van een HTTP-URL in Pandas. Pandas heeft lezers voor verschillende bestandsindelingen:
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_parquet.html
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html
import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt
df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.parquet")
df.head(10)
Hiermee kunt u de gegevenstypen van de verschillende velden controleren en controleren of de bijgewerkte kolom datum/tijd-indeling is
df.dtypes
We gaan nu kijken naar wereldwijde gegevens en enkele eenvoudige grafieken tekenen om de gegevens te visualiseren
df_Worldwide=df[df['country_region']=='Worldwide']
df_Worldwide_pivot=df_Worldwide.pivot_table(df_Worldwide, index=['country_region','updated'])
df_Worldwide_pivot
df_Worldwide.plot(kind='line',x='updated',y="confirmed",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="confirmed_change",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths_change",grid=True)
Azure Databricks
Voorbeeld niet beschikbaar voor deze combinatie van platform/pakket.
Azure Synapse
Voorbeeld niet beschikbaar voor deze combinatie van platform/pakket.
Volgende stappen
Bekijk de rest van de gegevenssets in de catalogus Open Datasets.