Bing COVID-19
Data Bing COVID-19 zahrnují počty potvrzených případů, počty úmrtí a počty zotavených osob ze všech oblastí a aktualizují se každý den. Tato data znázorňuje Bing COVID-19 Tracker.
Bing shromažďuje data z několika důvěryhodných, spolehlivých zdrojů, včetně Světové zdravotnické organizace (WHO), Center for Disease Control and Prevention (CDC), národních/regionálních a státních zdravotnických oddělení, BNO News, 24/7 Wall St. a Wikipedie.
Poznámka:
Microsoft poskytuje datové sady Azure Open Datasets na bázi "tak, jak je". Společnost Microsoft neposkytuje žádné záruky, výslovné ani předpokládané záruky ani podmínky týkající se vašeho používání datových sad. V rozsahu povoleném vaším místním zákonem společnost Microsoft odmítá veškerou odpovědnost za případné škody nebo ztráty, včetně přímých, následných, zvláštních, nepřímých, náhodných nebo represivních, vyplývajících z vašeho používání datových sad.
Na tuto datovou sadu se vztahují původní podmínky, které Microsoft přijal se zdrojovými daty. Datová sada může obsahovat data pocházející z Microsoftu.
Datové sady
Upravené datové sady jsou k dispozici ve formátu CSV, JSON, JSON-Lines a Parquet.
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.csv
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.json
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.jsonl
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.parquet
Do všech upravených sad byly přidány kódy území podle ISO 3166 a časy načtení. Pro názvy sloupců jsou použita malá písmena s podtržítky jako oddělovači.
Nezpracovaná data: https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/bing_covid-19_data/latest/Bing-COVID19-Data.csv
Předchozí verze upravených a nezpracovaných dat: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/
Objem dat
Všechny datové sady se denně aktualizují. Od 11. května 2020 obsahovaly 125 576 řádků (CSV 16,1 MB, JSON 40,0 MB, JSONL 39,6 MB, Parquet 1,1 MB).
Přisuzování práv k licencím a používání
Tato data jsou k dispozici výhradně pro vzdělávací a akademické účely, jako je lékařský výzkum, vládní instituce a akademické instituce za podmínek a ujednání.
Data použitá nebo citovaná v publikacích by měla obsahovat přisuzování bingu covid-19 Tracker s odkazem na www.bing.com/covid.
Kontakt
Pokud máte v souvislosti s touto datovou sadou nebo jinými datovými sadami v datovém jezeře COVID-19 nějaké dotazy nebo připomínky, kontaktujte askcovid19dl@microsoft.com.
Sloupce
Name | Datový typ | Jedinečný | Values (sample) | Popis |
---|---|---|---|---|
admin_region_1 | string | 864 | Texas Georgia | Oblast v rámci country_region |
admin_region_2 | string | 3,143 | Washington County Jefferson County | Oblast v rámci admin_region_1 |
Potvrdil | int | 120,692 | 1 2 | Počet potvrzených případů pro oblast |
confirmed_change | int | 12,120 | 1 2 | Změna počtu potvrzených případů oproti předchozímu dni |
country_region | string | 237 | USA Indie | Země/oblast |
Úmrtí | int | 20,616 | 1 2 | Počet případů úmrtí pro oblast |
deaths_change | smallint | 1,981 | 1 2 | Změna počtu úmrtí oproti předchozímu dni |
ID | int | 1,783,534 | 742546 69019298 | Jedinečný identifikátor |
iso_subdivision | string | 484 | US-TX US-GA | Dvoudílný kód území podle ISO |
iso2 | string | 226 | US IN | Dvouznakový identifikátor země |
iso3 | string | 226 | USA IND | Tříznakový identifikátor země |
zeměpisná šířka | double | 5,675 | 42.28708 19.59852 | Zeměpisná šířka středu oblasti |
load_time | časové razítko | 0 | 2021-04-26 00:06:34.719000 | Datum a čas načtení souboru ze zdroje Bingu na GitHubu |
longitude | double | 5,693 | -2.5396 -155.5186 | Zeměpisná délka středu oblasti |
Obnovit | int | 73,287 | 1 2 | Počet uzdravených pro oblast |
recovered_change | int | 10,441 | 1 2 | Změna počtu případů uzdravení oproti předchozímu dni |
aktualizováno | datum | 457 | 2021-04-23 2021-04-22 | Datum, ke kterému se záznam vztahuje |
Ukázková
ID | aktualizováno | Potvrdil | Úmrtí | iso2 | iso3 | country_region | admin_region_1 | iso_subdivision | admin_region_2 | load_time | confirmed_change | deaths_change |
---|---|---|---|---|---|---|---|---|---|---|---|---|
338995 | 2020-01-21 | 262 | 0 | null | null | Celosvětově | null | null | null | 26.4.2021 12:06:34 | ||
338996 | 2020-01-22 | 313 | 0 | null | null | Celosvětově | null | null | null | 26.4.2021 12:06:34 | 51 | 0 |
338997 | 2020-01-23 | 578 | 0 | null | null | Celosvětově | null | null | null | 26.4.2021 12:06:34 | 265 | 0 |
338998 | 2020-01-24 | 841 | 0 | null | null | Celosvětově | null | null | null | 26.4.2021 12:06:34 | 263 | 0 |
338999 | 2020-01-25 | 1320 | 0 | null | null | Celosvětově | null | null | null | 26.4.2021 12:06:34 | 479 | 0 |
339000 | 2020-01-26 | 2014 | 0 | null | null | Celosvětově | null | null | null | 26.4.2021 12:06:34 | 694 | 0 |
339001 | 2020-01-27 | 2798 | 0 | null | null | Celosvětově | null | null | null | 26.4.2021 12:06:34 | 784 | 0 |
339002 | 2020-01-28 | 4593 | 0 | null | null | Celosvětově | null | null | null | 26.4.2021 12:06:34 | 1795 | 0 |
339003 | 2020-01-29 | 6065 | 0 | null | null | Celosvětově | null | null | null | 26.4.2021 12:06:34 | 1472 | 0 |
339004 | 2020-01-30 | 7818 | 0 | null | null | Celosvětově | null | null | null | 26.4.2021 12:06:34 | 1753 | 0 |
Přístup k datům
Azure Notebooks
Tento poznámkový blok dokumentuje adresy URL a vzorový kód pro přístup k datové sadě Bingu COVID-19.
K získání konkrétních formátů souborů hostovaných ve službě Azure Blob Storage použijte následující adresy URL:
Stáhněte si soubor datové sady pomocí integrované funkce ke stažení z adresy URL http v Knihovně Pandas. Pandas má čtenáře pro různé formáty souborů:
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_parquet.html
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html
import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt
df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.parquet")
df.head(10)
Umožňuje zkontrolovat datové typy různých polí a ověřit, že aktualizovaný sloupec má formát data a času.
df.dtypes
Teď se podíváme na data po celém světě a vykreslíme několik jednoduchých grafů pro vizualizaci dat.
df_Worldwide=df[df['country_region']=='Worldwide']
df_Worldwide_pivot=df_Worldwide.pivot_table(df_Worldwide, index=['country_region','updated'])
df_Worldwide_pivot
df_Worldwide.plot(kind='line',x='updated',y="confirmed",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="confirmed_change",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths_change",grid=True)
Azure Databricks
Ukázka není k dispozici pro tuto kombinaci platformy nebo balíčku.
Azure Synapse
Ukázka není k dispozici pro tuto kombinaci platformy nebo balíčku.
Další kroky
Prohlédněte si zbývající datové sady v katalogu Open Datasets.