Bing COVID-19
Data Bing COVID-19 zahrnují počty potvrzených případů, počty úmrtí a počty zotavených osob ze všech oblastí a aktualizují se každý den. Tato data odráží sledování COVID-19 Bingu.
Bing shromažďuje data z několika důvěryhodných, spolehlivých zdrojů, včetně:
- Novinky BNO
- Centra pro kontrolu a prevenci onemocnění (CDC)
- Národní/regionální a státní zdravotní oddělení
- Wikipedie
- Světová zdravotnická organizace (WHO)
- 24/7 Stěna st.
Poznámka:
Microsoft poskytuje datové sady Azure Open Datasets na bázi "tak, jak je". Společnost Microsoft neposkytuje žádné záruky, výslovné ani předpokládané záruky ani podmínky týkající se vašeho používání datových sad. V rozsahu povoleném vaším místním zákonem společnost Microsoft odmítá veškerou odpovědnost za případné škody nebo ztráty, včetně přímých, následných, zvláštních, nepřímých, náhodných nebo represivních, vyplývajících z vašeho používání datových sad.
Na tuto datovou sadu se vztahují původní podmínky, které Microsoft přijal se zdrojovými daty. Datová sada může obsahovat data pocházející z Microsoftu.
Datové sady
Upravené datové sady Bingu COVID-19 jsou k dispozici ve formátu CSV, JSON, linkách JSON a Parquet:
Všechny upravené datové sady mají přidané kódy dělení ISO 3166 a časy načtení. Používají názvy sloupců malých písmen s oddělovači podtržítka.
Nezpracovaná data ve formátu CSV
V tomto prostředku jsou k dispozici starší verze upravených a nezpracovaných dat.
Objem dat
Všechny datové sady přijímají denní aktualizace. Od 5. března 2023 obsahovaly 4 766 737 řádků. Datová sada je dostupná v těchto formátech souborů:
- CSV (560,3 MB)
- JSON (1515 MB)
- JSONL (1506 MB)
- Parquet (55,4 MB)
Přisuzování práv k licencím a používání
Data jsou k dispozici výhradně pro vzdělávací a akademické účely za těchto podmínek a ujednání. Mezi platné účely patří:
- akademické instituce
- vládní agentury
- lékařský výzkum
Data použitá nebo citovaná v publikacích by měla zahrnovat přisuzování "Bing COVID-19 Tracker" s odkazem na www.bing.com/covid.
Kontakt
Jakékoli dotazy nebo připomínky k této nebo jiné datové sadě v kontaktu askcovid19dl@microsoft.coms COVID-19 Data Lake .
Sloupce
Name | Datový typ | Jedinečný | Values (sample) | Popis |
---|---|---|---|---|
admin_region_1 | string | 864 | Texas Georgia | Oblast v rámci country_region |
admin_region_2 | string | 3,143 | Washington County Jefferson County | Oblast v rámci admin_region_1 |
potvrzený | int | 120,692 | 1 2 | Počet potvrzených případů pro oblast |
confirmed_change | int | 12,120 | 1 2 | Změna počtu potvrzených případů oproti předchozímu dni |
country_region | string | 237 | USA Indie | Země/oblast |
smrti | int | 20,616 | 1 2 | Počet případů úmrtí pro oblast |
deaths_change | smallint | 1,981 | 1 2 | Změna počtu úmrtí oproti předchozímu dni |
ID | int | 1,783,534 | 742546 69019298 | Jedinečný identifikátor |
iso_subdivision | string | 484 | US-TX US-GA | Dvoudílný kód území podle ISO |
iso2 | string | 226 | US IN | Dvouznakový identifikátor země |
iso3 | string | 226 | USA IND | Tříznakový identifikátor země |
zeměpisná šířka | double | 5,675 | 42.28708 19.59852 | Zeměpisná šířka středu oblasti |
load_time | časové razítko | 0 | 2021-04-26 00:06:34.719000 | Datum a čas načtení souboru ze zdroje Bingu na GitHubu |
longitude | double | 5,693 | -2.5396 -155.5186 | Zeměpisná délka středu oblasti |
uzdravený | int | 73,287 | 1 2 | Počet uzdravených pro oblast |
recovered_change | int | 10,441 | 1 2 | Změna počtu případů uzdravení oproti předchozímu dni |
aktualizováno | datum | 457 | 2021-04-23 2021-04-22 | Datum, ke kterému se záznam vztahuje |
Preview
ID | aktualizováno | potvrzený | smrti | iso2 | iso3 | country_region | admin_region_1 | iso_subdivision | admin_region_2 | load_time | confirmed_change | deaths_change |
---|---|---|---|---|---|---|---|---|---|---|---|---|
338995 | 2020-01-21 | 262 | 0 | null | null | Celosvětově | null | null | null | 26.4.2021 12:06:34 | ||
338996 | 2020-01-22 | 313 | 0 | null | null | Celosvětově | null | null | null | 26.4.2021 12:06:34 | 51 | 0 |
338997 | 2020-01-23 | 578 | 0 | null | null | Celosvětově | null | null | null | 26.4.2021 12:06:34 | 265 | 0 |
338998 | 2020-01-24 | 841 | 0 | null | null | Celosvětově | null | null | null | 26.4.2021 12:06:34 | 263 | 0 |
338999 | 2020-01-25 | 1320 | 0 | null | null | Celosvětově | null | null | null | 26.4.2021 12:06:34 | 479 | 0 |
339000 | 2020-01-26 | 2014 | 0 | null | null | Celosvětově | null | null | null | 26.4.2021 12:06:34 | 694 | 0 |
339001 | 2020-01-27 | 2798 | 0 | null | null | Celosvětově | null | null | null | 26.4.2021 12:06:34 | 784 | 0 |
339002 | 2020-01-28 | 4593 | 0 | null | null | Celosvětově | null | null | null | 26.4.2021 12:06:34 | 1795 | 0 |
339003 | 2020-01-29 | 6065 | 0 | null | null | Celosvětově | null | null | null | 26.4.2021 12:06:34 | 1472 | 0 |
339004 | 2020-01-30 | 7818 | 0 | null | null | Celosvětově | null | null | null | 26.4.2021 12:06:34 | 1753 | 0 |
Přístup k datům – Azure Notebooks
Poznámka:
Tento poznámkový blok dokumentuje adresy URL a vzorový kód pro přístup k datové sadě Bingu COVID-19.
Pomocí těchto adres URL získáte konkrétní formáty souborů hostované ve službě Azure Blob Storage:
Stáhněte si soubor datové sady pomocí integrované funkce Pandas ke stažení z adresy URL PROTOKOLU HTTP. Pandas má čtenáře pro různé formáty souborů:
import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt
df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.parquet")
df.head(10)
Pokud chcete ověřit, že aktualizovaný sloupec má formát data a času, zkontrolujte datové typy různých polí:
df.dtypes
Zkontrolujte data po celém světě. Pokud chcete vizualizovat data, vytvořte několik grafů:
df_Worldwide=df[df['country_region']=='Worldwide']
df_Worldwide_pivot=df_Worldwide.pivot_table(df_Worldwide, index=['country_region','updated'])
df_Worldwide_pivot
df_Worldwide.plot(kind='line',x='updated',y="confirmed",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="confirmed_change",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths_change",grid=True)
Přístup k datům – Azure Databricks
Pro tuto platformu nebo kombinaci balíčků není k dispozici ukázka.
Přístup k datům – Azure Synapse
Pro tuto platformu nebo kombinaci balíčků není k dispozici ukázka.
Další kroky
Prohlédněte si zbývající datové sady v katalogu Open Datasets.