Bing COVID-19
COVID-19-gegevens van Bing omvatten cijfers over bevestigde, fatale en genezen gevallen uit alle regio's en worden dagelijks bijgewerkt. De Bing COVID-19 Tracker weerspiegelt deze gegevens.
Bing verzamelt gegevens van meerdere vertrouwde, betrouwbare bronnen, waaronder:
- BNO Nieuws
- Centers for Disease Control and Prevention (CDC)
- Nationale/regionale en openbare gezondheidsafdelingen
- Wikipedia
- De Wereldgezondheidsorganisatie (WHO)
- 24/7 Wall St.
Notitie
Microsoft biedt Azure Open Datasets op basis van 'zoals is'. Microsoft geeft geen garanties, uitdrukkelijk of impliciet, garanties of voorwaarden met betrekking tot uw gebruik van de gegevenssets. Voor zover toegestaan volgens uw lokale wetgeving, wijst Microsoft alle aansprakelijkheid af voor eventuele schade of verliezen, waaronder directe, gevolgschade, speciale, indirecte, incidentele of strafbare gegevenssets, die het gevolg zijn van uw gebruik van de gegevenssets.
Deze gegevensset wordt geleverd onder de oorspronkelijke voorwaarden dat Microsoft de brongegevens heeft ontvangen. De gegevensset kan gegevens bevatten die afkomstig zijn van Microsoft.
Gegevenssets
Gewijzigde Bing COVID-19-gegevenssets zijn beschikbaar in CSV, JSON, JSON-Lijnen en Parquet:
Alle gewijzigde gegevenssets hebben ISO 3166-onderverdelingscodes en laadtijden toegevoegd. Ze gebruiken kolomnamen met kleine letters met scheidingstekens voor onderstrepingstekens.
Onbewerkte gegevens in CSV-indeling
Eerdere versies van gewijzigde en onbewerkte gegevens zijn beschikbaar in deze resource.
Gegevensvolume
Alle gegevenssets ontvangen dagelijkse updates. Vanaf 5 maart 2023 bevatten ze 4.766.737 rijen. De gegevensset is beschikbaar in deze bestandsindelingen:
- CSV (560,3 MB)
- JSON (1515,6 MB)
- JSONL (1506,2 MB)
- Parquet (55,4 MB)
Licentie- en gebruiksrechten toewijzen
De gegevens zijn strikt beschikbaar voor educatieve en academische doeleinden onder deze voorwaarden. Geldige doeleinden zijn:
- academische instellingen
- Overheidsinstanties
- medisch onderzoek
Gegevens die in publicaties worden gebruikt of geciteerd, moeten een naamsvermelding bevatten voor 'Bing COVID-19 Tracker', met een koppeling naar www.bing.com/covid.
Contactpersoon
Voor vragen of feedback over deze of andere gegevenssets in de contact met askcovid19dl@microsoft.comCOVID-19 Data Lake.
Kolommen
Naam | Gegevenstype | Uniek | Waarden (voorbeeld) | Beschrijving |
---|---|---|---|---|
admin_region_1 | tekenreeks | 864 | Texas Georgia | Regio in country_region |
admin_region_2 | tekenreeks | 3143 | Washington County Seattle County | Regio in admin_region_1 |
bevestigd | int | 120,692 | 1 2 | Aantal bevestigde gevallen voor de regio |
confirmed_change | int | 12,120 | 1 2 | Wijziging van het aantal bevestigde gevallen ten opzichte van de vorige dag |
country_region | tekenreeks | 237 | Verenigde Staten India | Land/regio |
Sterfgevallen | int | 20,616 | 1 2 | Aantal sterfgevallen voor de regio |
deaths_change | smallint | 1,981 | 1 2 | Wijziging van het aantal sterfgevallen ten opzichte van de vorige dag |
id | int | 1,783,534 | 742546 69019298 | Unieke id |
iso_subdivision | tekenreeks | 484 | US-TX US-GA | Tweedelige ISO-onderverdelingscode |
iso2 | tekenreeks | 226 | VS IN | Landcode-id met twee letters |
iso3 | tekenreeks | 226 | USA IND | Landcode-id met drie letters |
breedtegraad | dubbel | 5,675 | 42.28708 19.59852 | Breedtegraad van het massamiddelpunt van de regio |
load_time | timestamp | 1 | 2021-04-26 00:06:34.719000 | De datum en tijd waarop het bestand vanuit de Bing-bron in GitHub is geladen |
lengtegraad | dubbel | 5,693 | -2.5396 -155.5186 | Lengtegraad van het massamiddelpunt van de regio |
beter | int | 73,287 | 1 2 | Aantal genezen gevallen voor de regio |
recovered_change | int | 10,441 | 1 2 | Wijziging van het aantal genezen gevallen ten opzichte van de vorige dag |
bijgewerkt | datum | 457 | 2021-04-23 2021-04-22 | De peildatum voor de record |
Preview uitvoeren
id | bijgewerkt | bevestigd | Sterfgevallen | iso2 | iso3 | country_region | admin_region_1 | iso_subdivision | admin_region_2 | load_time | confirmed_change | deaths_change |
---|---|---|---|---|---|---|---|---|---|---|---|---|
338995 | 2020-01-21 | 262 | 0 | null | Nul | Wereldwijd | Nul | Nul | Nul | 26-4-2021 12:06:34 uur | ||
338996 | 2020-01-22 | 313 | 0 | null | Nul | Wereldwijd | Nul | Nul | Nul | 26-4-2021 12:06:34 uur | 51 | 0 |
338997 | 2020-01-23 | 578 | 0 | null | Nul | Wereldwijd | Nul | Nul | Nul | 26-4-2021 12:06:34 uur | 265 | 0 |
338998 | 2020-01-24 | 841 | 0 | null | Nul | Wereldwijd | Nul | Nul | Nul | 26-4-2021 12:06:34 uur | 263 | 0 |
338999 | 2020-01-25 | 1320 | 0 | null | Nul | Wereldwijd | Nul | Nul | Nul | 26-4-2021 12:06:34 uur | 479 | 0 |
339000 | 2020-01-26 | 2014 | 0 | null | Nul | Wereldwijd | Nul | Nul | Nul | 26-4-2021 12:06:34 uur | 694 | 0 |
339001 | 2020-01-27 | 2798 | 0 | null | Nul | Wereldwijd | Nul | Nul | Nul | 26-4-2021 12:06:34 uur | 784 | 0 |
339002 | 2020-01-28 | 4593 | 0 | null | Nul | Wereldwijd | Nul | Nul | Nul | 26-4-2021 12:06:34 uur | 1795 | 0 |
339003 | 2020-01-29 | 6065 | 0 | null | Nul | Wereldwijd | Nul | Nul | Nul | 26-4-2021 12:06:34 uur | 1472 | 0 |
339004 | 2020-01-30 | 7818 | 0 | null | Nul | Wereldwijd | Nul | Nul | Nul | 26-4-2021 12:06:34 uur | 1753 | 0 |
Gegevenstoegang - Azure Notebooks
Notitie
Dit notebook documenteerde de URL's en voorbeeldcode voor toegang tot de Bing COVID-19-gegevensset.
Gebruik deze URL's om specifieke bestandsindelingen op te halen die worden gehost in Azure Blob Storage:
Download het gegevenssetbestand met behulp van de ingebouwde mogelijkheid van Pandas om te downloaden van een HTTP-URL. Pandas heeft lezers voor verschillende bestandsindelingen:
import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt
df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.parquet")
df.head(10)
Als u wilt controleren of de bijgewerkte kolom een datum/tijd-indeling heeft, controleert u de gegevenstypen van de verschillende velden:
df.dtypes
Bekijk de wereldwijde gegevens. Als u de gegevens wilt visualiseren, maakt u enkele grafieken:
df_Worldwide=df[df['country_region']=='Worldwide']
df_Worldwide_pivot=df_Worldwide.pivot_table(df_Worldwide, index=['country_region','updated'])
df_Worldwide_pivot
df_Worldwide.plot(kind='line',x='updated',y="confirmed",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="confirmed_change",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths_change",grid=True)
Data Access - Azure Databricks
Er is geen voorbeeld beschikbaar voor deze combinatie van platform/pakket.
Gegevenstoegang - Azure Synapse
Er is geen voorbeeld beschikbaar voor deze combinatie van platform/pakket.
Volgende stappen
Bekijk de rest van de gegevenssets in de catalogus Open Datasets.