Bing Daten zu COVID-19

Diese Bing-Daten zu COVID-19 enthalten bestätigte Fälle, Fälle mit tödlichem Verlauf und genesene Patienten aus allen Regionen. Sie werden täglich aktualisiert. Diese Daten werden im Bing-Tracker zu COVID-19 verwendet.

Bing erfasst Daten aus mehreren vertrauenswürdigen und zuverlässigen Quellen. Dazu zählen die Weltgesundheitsorganisation (World Health Organization, WHO), die Centers for Disease Control and Prevention (CDC), öffentliche Gesundheitsbehörden auf nationaler/regionaler und bundesstaatlicher Ebene, BNO News, 24/7 Wall St. und Wikipedia.

Hinweis

Microsoft stellt Datasets der Plattform Azure Open Datasets auf einer „As is“-Basis (d. h. ohne Mängelgewähr) zur Verfügung. Microsoft übernimmt weder ausdrücklich noch stillschweigend die Gewährleistung für Ihre Nutzung der Datasets und sichert keinerlei Garantien oder Bedingungen zu. Soweit nach örtlich anwendbarem Recht zulässig, lehnt Microsoft jegliche Haftung für Schäden oder Verluste ab. Dies schließt direkte, indirekte, besondere oder zufällige Schäden oder Verluste sowie Folge- und Strafschäden und damit verbundene Verluste ein, die sich aus Ihrer Nutzung der Datasets ergeben.

Für die Bereitstellung dieses Datasets gelten die ursprünglichen Nutzungsbedingungen, unter denen Microsoft die Quelldaten bezogen hat. Das Dataset kann Daten von Microsoft enthalten.

Datasets

Die geänderten Datasets sind im CSV-, JSON-, JSON-Lines und Parquet-Format verfügbar.

Allen geänderten Datasets wurden ISO 3166-Teilgebietscodes und Ladezeiten hinzugefügt. Außerdem wurden die Spaltennamen in Kleinbuchstaben umformatiert und mit Unterstrichen versehen.

Rohdaten: https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/bing_covid-19_data/latest/Bing-COVID19-Data.csv

Vorgängerversionen der geänderten Daten und Rohdaten: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/

Datenvolumen

Alle Datasets werden täglich aktualisiert. Seit dem 11. Mai 2020 enthalten diese 125.576 Zeilen (CSV: 16,1 MB, JSON: 40,0 MB, JSONL: 39,6 MB, Parquet: 1,1 MB).

Vergabe von Lizenz- und Nutzungsrechten

Diese Daten stehen ausschließlich für Bildungszwecke und akademische Zwecke zur Verfügung, z. B. für die medizinische Forschung, für Regierungsbehörden und akademische Einrichtungen, und zwar unter diesen Geschäftsbedingungen.

In Publikationen verwendete oder zitierte Daten müssen mit einem Quellenzuordnungsverweis zum „Bing-Tracker zu COVID-19“ und einem Link zu www.bing.com/covid gekennzeichnet werden.

Contact

Wenden Sie sich bei Fragen oder Feedback zu diesem Dataset oder anderen Datasets im Data Lake zu COVID-19 an askcovid19dl@microsoft.com.

Spalten

Name Datentyp Eindeutig Beispielwerte BESCHREIBUNG
admin_region_1 Zeichenfolge 864 Texas Georgia Region in country_region
admin_region_2 Zeichenfolge 3.143 Washington County Jefferson County Region in admin_region_1
bestätigt INT 120,692 1 2 Bestätigte Todesfälle in der Region
confirmed_change INT 12,120 1 2 Änderungen an der Anzahl der bestätigten Fälle im Vergleich zum Vortag
country_region Zeichenfolge 237 Vereinigte Staaten – Indien Land/Region
Todesfälle INT 20,616 1 2 Anzahl der Todesfälle in der Region
deaths_change SMALLINT 1,981 1 2 Änderungen an der Anzahl der Todesfälle im Vergleich zum Vortag
id INT 1,783,534 742546 69019298 Eindeutiger Bezeichner
iso_subdivision Zeichenfolge 484 US-TX US-GA Zweiteiliger ISO-Teilgebietscode
iso2 Zeichenfolge 226 US IN Ländercode (zwei Buchstaben)
iso3 Zeichenfolge 226 USA IND Ländercode (drei Buchstaben)
latitude double 5,675 42.28708 19.59852 Breitengrad des Schwerpunkts der Region
load_time timestamp 1 2021-04-26 00:06:34.719000 Datum und Uhrzeit des Dateiuploads von der Bing-Quelle auf GitHub
longitude double 5,693 -2.5396 -155.5186 Längengrad des Schwerpunkts der Region
genesen INT 73,287 1 2 Anzahl genesener Patienten in der Region
recovered_change INT 10,441 1 2 Änderungen an der Anzahl genesener Patienten im Vergleich zum Vortag
aktualisiert date 457 2021-04-23 2021-04-22 Datumsangabe für aktuellen Stand des Datensatzes

Vorschau

id aktualisiert bestätigt Todesfälle iso2 iso3 country_region admin_region_1 iso_subdivision admin_region_2 load_time confirmed_change deaths_change
338995 2020-01-21 262 0 NULL NULL Weltweit NULL NULL NULL 4/26/2021 00:06:34 Uhr
338996 2020-01-22 313 0 NULL NULL Weltweit NULL NULL NULL 4/26/2021 00:06:34 Uhr 51 0
338997 23.01.2020 578 0 NULL NULL Weltweit NULL NULL NULL 4/26/2021 00:06:34 Uhr 265 0
338998 2020-01-24 841 0 NULL NULL Weltweit NULL NULL NULL 4/26/2021 00:06:34 Uhr 263 0
338999 2020-01-25 1320 0 NULL NULL Weltweit NULL NULL NULL 4/26/2021 00:06:34 Uhr 479 0
339000 2020-01-26 2014 0 NULL NULL Weltweit NULL NULL NULL 4/26/2021 00:06:34 Uhr 694 0
339001 2020-01-27 2798 0 NULL NULL Weltweit NULL NULL NULL 4/26/2021 00:06:34 Uhr 784 0
339002 2020-01-28 4593 0 NULL NULL Weltweit NULL NULL NULL 4/26/2021 00:06:34 Uhr 1795 0
339003 2020-01-29 6065 0 NULL NULL Weltweit NULL NULL NULL 4/26/2021 00:06:34 Uhr 1472 0
339004 30.01.2020 7818 0 NULL NULL Weltweit NULL NULL NULL 4/26/2021 00:06:34 Uhr 1753 0

Datenzugriff

Azure Notebooks

In diesem Notebook werden die URLs und der Beispielcode für den Zugriff auf das Bing COVID-19-Dataset dokumentiert

Verwenden Sie die folgenden URLs, um bestimmte Dateiformate zu erhalten, die auf Azure Blob Storage gehostet sind:

CSV: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.csv

JSON: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.json

JSONL: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.jsonl

Parquet: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.parquet

Laden Sie die Dataset-Datei mithilfe des integrierten Funktionsdownloads in Pandas anhand der HTTP-URL herunter. Pandas verfügt über Reader für verschiedene Dateiformate:

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_parquet.html

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html

import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt

df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.parquet")
df.head(10)

Überprüfen Sie die Datentypen der verschiedenen Felder, und ob die aktualisierte Spalte das datetime-Format aufweist.

df.dtypes

Wir sehen uns nun die weltweiten Daten an und zeichnen einige einfache Diagramme, um die Daten zu visualisieren.

df_Worldwide=df[df['country_region']=='Worldwide']
df_Worldwide_pivot=df_Worldwide.pivot_table(df_Worldwide, index=['country_region','updated'])

df_Worldwide_pivot
df_Worldwide.plot(kind='line',x='updated',y="confirmed",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="confirmed_change",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths_change",grid=True)

Azure Databricks

Für diese Kombination aus Plattform und Paket ist kein Beispiel verfügbar.

Azure Synapse

Für diese Kombination aus Plattform und Paket ist kein Beispiel verfügbar.

Nächste Schritte

Machen Sie sich mit den restlichen Datasets im Open Datasets-Katalog vertraut.