Bing COVID-19

Data Bing COVID-19 zahrnují počty potvrzených případů, počty úmrtí a počty zotavených osob ze všech oblastí a aktualizují se každý den. Tato data znázorňuje Bing COVID-19 Tracker.

Bing shromažďuje data z několika důvěryhodných, spolehlivých zdrojů, včetně Světové zdravotnické organizace (WHO), Center for Disease Control and Prevention (CDC), národních/regionálních a státních zdravotnických oddělení, BNO News, 24/7 Wall St. a Wikipedie.

Poznámka:

Microsoft poskytuje datové sady Azure Open Datasets na bázi "tak, jak je". Společnost Microsoft neposkytuje žádné záruky, výslovné ani předpokládané záruky ani podmínky týkající se vašeho používání datových sad. V rozsahu povoleném vaším místním zákonem společnost Microsoft odmítá veškerou odpovědnost za případné škody nebo ztráty, včetně přímých, následných, zvláštních, nepřímých, náhodných nebo represivních, vyplývajících z vašeho používání datových sad.

Na tuto datovou sadu se vztahují původní podmínky, které Microsoft přijal se zdrojovými daty. Datová sada může obsahovat data pocházející z Microsoftu.

Datové sady

Upravené datové sady jsou k dispozici ve formátu CSV, JSON, JSON-Lines a Parquet.

Do všech upravených sad byly přidány kódy území podle ISO 3166 a časy načtení. Pro názvy sloupců jsou použita malá písmena s podtržítky jako oddělovači.

Nezpracovaná data: https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/bing_covid-19_data/latest/Bing-COVID19-Data.csv

Předchozí verze upravených a nezpracovaných dat: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/

Objem dat

Všechny datové sady se denně aktualizují. Od 11. května 2020 obsahovaly 125 576 řádků (CSV 16,1 MB, JSON 40,0 MB, JSONL 39,6 MB, Parquet 1,1 MB).

Přisuzování práv k licencím a používání

Tato data jsou k dispozici výhradně pro vzdělávací a akademické účely, jako je lékařský výzkum, vládní instituce a akademické instituce za podmínek a ujednání.

Data použitá nebo citovaná v publikacích by měla obsahovat přisuzování bingu covid-19 Tracker s odkazem na www.bing.com/covid.

Kontakt

Pokud máte v souvislosti s touto datovou sadou nebo jinými datovými sadami v datovém jezeře COVID-19 nějaké dotazy nebo připomínky, kontaktujte askcovid19dl@microsoft.com.

Sloupce

Name Datový typ Jedinečný Values (sample) Popis
admin_region_1 string 864 Texas Georgia Oblast v rámci country_region
admin_region_2 string 3,143 Washington County Jefferson County Oblast v rámci admin_region_1
Potvrdil int 120,692 1 2 Počet potvrzených případů pro oblast
confirmed_change int 12,120 1 2 Změna počtu potvrzených případů oproti předchozímu dni
country_region string 237 USA Indie Země/oblast
Úmrtí int 20,616 1 2 Počet případů úmrtí pro oblast
deaths_change smallint 1,981 1 2 Změna počtu úmrtí oproti předchozímu dni
ID int 1,783,534 742546 69019298 Jedinečný identifikátor
iso_subdivision string 484 US-TX US-GA Dvoudílný kód území podle ISO
iso2 string 226 US IN Dvouznakový identifikátor země
iso3 string 226 USA IND Tříznakový identifikátor země
zeměpisná šířka double 5,675 42.28708 19.59852 Zeměpisná šířka středu oblasti
load_time časové razítko 0 2021-04-26 00:06:34.719000 Datum a čas načtení souboru ze zdroje Bingu na GitHubu
longitude double 5,693 -2.5396 -155.5186 Zeměpisná délka středu oblasti
Obnovit int 73,287 1 2 Počet uzdravených pro oblast
recovered_change int 10,441 1 2 Změna počtu případů uzdravení oproti předchozímu dni
aktualizováno datum 457 2021-04-23 2021-04-22 Datum, ke kterému se záznam vztahuje

Ukázková

ID aktualizováno Potvrdil Úmrtí iso2 iso3 country_region admin_region_1 iso_subdivision admin_region_2 load_time confirmed_change deaths_change
338995 2020-01-21 262 0 null null Celosvětově null null null 26.4.2021 12:06:34
338996 2020-01-22 313 0 null null Celosvětově null null null 26.4.2021 12:06:34 51 0
338997 2020-01-23 578 0 null null Celosvětově null null null 26.4.2021 12:06:34 265 0
338998 2020-01-24 841 0 null null Celosvětově null null null 26.4.2021 12:06:34 263 0
338999 2020-01-25 1320 0 null null Celosvětově null null null 26.4.2021 12:06:34 479 0
339000 2020-01-26 2014 0 null null Celosvětově null null null 26.4.2021 12:06:34 694 0
339001 2020-01-27 2798 0 null null Celosvětově null null null 26.4.2021 12:06:34 784 0
339002 2020-01-28 4593 0 null null Celosvětově null null null 26.4.2021 12:06:34 1795 0
339003 2020-01-29 6065 0 null null Celosvětově null null null 26.4.2021 12:06:34 1472 0
339004 2020-01-30 7818 0 null null Celosvětově null null null 26.4.2021 12:06:34 1753 0

Přístup k datům

Azure Notebooks

Tento poznámkový blok dokumentuje adresy URL a vzorový kód pro přístup k datové sadě Bingu COVID-19.

K získání konkrétních formátů souborů hostovaných ve službě Azure Blob Storage použijte následující adresy URL:

CSV: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.csv

JSON: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.json

JSONL: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.jsonl

Parquet: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.parquet

Stáhněte si soubor datové sady pomocí integrované funkce ke stažení z adresy URL http v Knihovně Pandas. Pandas má čtenáře pro různé formáty souborů:

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_parquet.html

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html

import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt

df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.parquet")
df.head(10)

Umožňuje zkontrolovat datové typy různých polí a ověřit, že aktualizovaný sloupec má formát data a času.

df.dtypes

Teď se podíváme na data po celém světě a vykreslíme několik jednoduchých grafů pro vizualizaci dat.

df_Worldwide=df[df['country_region']=='Worldwide']
df_Worldwide_pivot=df_Worldwide.pivot_table(df_Worldwide, index=['country_region','updated'])

df_Worldwide_pivot
df_Worldwide.plot(kind='line',x='updated',y="confirmed",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="confirmed_change",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths_change",grid=True)

Azure Databricks

Ukázka není k dispozici pro tuto kombinaci platformy nebo balíčku.

Azure Synapse

Ukázka není k dispozici pro tuto kombinaci platformy nebo balíčku.

Další kroky

Prohlédněte si zbývající datové sady v katalogu Open Datasets.