Sdílet prostřednictvím


Bing COVID-19

Data Bing COVID-19 zahrnují počty potvrzených případů, počty úmrtí a počty zotavených osob ze všech oblastí a aktualizují se každý den. Tato data odráží sledování COVID-19 Bingu.

Bing shromažďuje data z několika důvěryhodných, spolehlivých zdrojů, včetně:

Poznámka:

Microsoft poskytuje datové sady Azure Open Datasets na bázi "tak, jak je". Společnost Microsoft neposkytuje žádné záruky, výslovné ani předpokládané záruky ani podmínky týkající se vašeho používání datových sad. V rozsahu povoleném vaším místním zákonem společnost Microsoft odmítá veškerou odpovědnost za případné škody nebo ztráty, včetně přímých, následných, zvláštních, nepřímých, náhodných nebo represivních, vyplývajících z vašeho používání datových sad.

Na tuto datovou sadu se vztahují původní podmínky, které Microsoft přijal se zdrojovými daty. Datová sada může obsahovat data pocházející z Microsoftu.

Datové sady

Upravené datové sady Bingu COVID-19 jsou k dispozici ve formátu CSV, JSON, linkách JSON a Parquet:

Všechny upravené datové sady mají přidané kódy dělení ISO 3166 a časy načtení. Používají názvy sloupců malých písmen s oddělovači podtržítka.

Nezpracovaná data ve formátu CSV

V tomto prostředku jsou k dispozici starší verze upravených a nezpracovaných dat.

Objem dat

Všechny datové sady přijímají denní aktualizace. Od 5. března 2023 obsahovaly 4 766 737 řádků. Datová sada je dostupná v těchto formátech souborů:

  • CSV (560,3 MB)
  • JSON (1515 MB)
  • JSONL (1506 MB)
  • Parquet (55,4 MB)

Přisuzování práv k licencím a používání

Data jsou k dispozici výhradně pro vzdělávací a akademické účely za těchto podmínek a ujednání. Mezi platné účely patří:

  • akademické instituce
  • vládní agentury
  • lékařský výzkum

Data použitá nebo citovaná v publikacích by měla zahrnovat přisuzování "Bing COVID-19 Tracker" s odkazem na www.bing.com/covid.

Kontakt

Jakékoli dotazy nebo připomínky k této nebo jiné datové sadě v kontaktu askcovid19dl@microsoft.coms COVID-19 Data Lake .

Sloupce

Name Datový typ Jedinečný Values (sample) Popis
admin_region_1 string 864 Texas Georgia Oblast v rámci country_region
admin_region_2 string 3,143 Washington County Jefferson County Oblast v rámci admin_region_1
potvrzený int 120,692 1 2 Počet potvrzených případů pro oblast
confirmed_change int 12,120 1 2 Změna počtu potvrzených případů oproti předchozímu dni
country_region string 237 USA Indie Země/oblast
smrti int 20,616 1 2 Počet případů úmrtí pro oblast
deaths_change smallint 1,981 1 2 Změna počtu úmrtí oproti předchozímu dni
ID int 1,783,534 742546 69019298 Jedinečný identifikátor
iso_subdivision string 484 US-TX US-GA Dvoudílný kód území podle ISO
iso2 string 226 US IN Dvouznakový identifikátor země
iso3 string 226 USA IND Tříznakový identifikátor země
zeměpisná šířka double 5,675 42.28708 19.59852 Zeměpisná šířka středu oblasti
load_time časové razítko 0 2021-04-26 00:06:34.719000 Datum a čas načtení souboru ze zdroje Bingu na GitHubu
longitude double 5,693 -2.5396 -155.5186 Zeměpisná délka středu oblasti
uzdravený int 73,287 1 2 Počet uzdravených pro oblast
recovered_change int 10,441 1 2 Změna počtu případů uzdravení oproti předchozímu dni
aktualizováno datum 457 2021-04-23 2021-04-22 Datum, ke kterému se záznam vztahuje

Preview

ID aktualizováno potvrzený smrti iso2 iso3 country_region admin_region_1 iso_subdivision admin_region_2 load_time confirmed_change deaths_change
338995 2020-01-21 262 0 null null Celosvětově null null null 26.4.2021 12:06:34
338996 2020-01-22 313 0 null null Celosvětově null null null 26.4.2021 12:06:34 51 0
338997 2020-01-23 578 0 null null Celosvětově null null null 26.4.2021 12:06:34 265 0
338998 2020-01-24 841 0 null null Celosvětově null null null 26.4.2021 12:06:34 263 0
338999 2020-01-25 1320 0 null null Celosvětově null null null 26.4.2021 12:06:34 479 0
339000 2020-01-26 2014 0 null null Celosvětově null null null 26.4.2021 12:06:34 694 0
339001 2020-01-27 2798 0 null null Celosvětově null null null 26.4.2021 12:06:34 784 0
339002 2020-01-28 4593 0 null null Celosvětově null null null 26.4.2021 12:06:34 1795 0
339003 2020-01-29 6065 0 null null Celosvětově null null null 26.4.2021 12:06:34 1472 0
339004 2020-01-30 7818 0 null null Celosvětově null null null 26.4.2021 12:06:34 1753 0

Přístup k datům – Azure Notebooks

Poznámka:

Tento poznámkový blok dokumentuje adresy URL a vzorový kód pro přístup k datové sadě Bingu COVID-19.

Pomocí těchto adres URL získáte konkrétní formáty souborů hostované ve službě Azure Blob Storage:

Stáhněte si soubor datové sady pomocí integrované funkce Pandas ke stažení z adresy URL PROTOKOLU HTTP. Pandas má čtenáře pro různé formáty souborů:

pandas.read_parquet

pandas.read_csv

import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt

df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.parquet")
df.head(10)

Pokud chcete ověřit, že aktualizovaný sloupec má formát data a času, zkontrolujte datové typy různých polí:

df.dtypes

Zkontrolujte data po celém světě. Pokud chcete vizualizovat data, vytvořte několik grafů:

df_Worldwide=df[df['country_region']=='Worldwide']
df_Worldwide_pivot=df_Worldwide.pivot_table(df_Worldwide, index=['country_region','updated'])

df_Worldwide_pivot
df_Worldwide.plot(kind='line',x='updated',y="confirmed",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="confirmed_change",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths_change",grid=True)

Přístup k datům – Azure Databricks

Pro tuto platformu nebo kombinaci balíčků není k dispozici ukázka.

Přístup k datům – Azure Synapse

Pro tuto platformu nebo kombinaci balíčků není k dispozici ukázka.

Další kroky

Prohlédněte si zbývající datové sady v katalogu Open Datasets.