Bing COVID-19

Dane Bing COVID-19 obejmują przypadki potwierdzone, śmiertelne i wyleczone ze wszystkich regionów, aktualizowane codziennie. Te dane są odzwierciedlone w monitorze Bing COVID-19.

Bing zbiera dane z wielu zaufanych, niezawodnych źródeł, w tym Światowej Organizacji Zdrowia (WHO), Centers for Disease Control and Prevention (CDC), krajowych/regionalnych i państwowych służb zdrowia publicznego, BNO News, 24/7 Wall St., i Wikipedia.

Uwaga

Firma Microsoft udostępnia zestawy danych Platformy Azure open na zasadzie "tak, jak to jest". Firma Microsoft nie udziela żadnych gwarancji, wyraźnych lub domniemanych, gwarancji ani warunków w odniesieniu do korzystania z zestawów danych. W zakresie dozwolonym zgodnie z prawem lokalnym firma Microsoft nie ponosi odpowiedzialności za wszelkie szkody lub straty, w tym bezpośrednie, wtórne, specjalne, pośrednie, przypadkowe lub karne wynikające z korzystania z zestawów danych.

Zestaw danych jest udostępniany zgodnie z pierwotnymi warunkami, na jakich firma Microsoft otrzymała dane źródłowe. Zestaw danych może zawierać dane pozyskane z firmy Microsoft.

Zestawy danych

Zmodyfikowane zestawy danych są dostępne w plikach CSV, JSON, JSON-Lines i Parquet.

Wszystkie zmodyfikowane zestawy danych mają dodane czasy ładowania i kody poddziałów standardu ISO 3166 oraz używają nazw kolumn pisanych małymi literami z separatorami w postaci znaków podkreślenia.

Dane pierwotne: https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/bing_covid-19_data/latest/Bing-COVID19-Data.csv

Poprzednie wersje danych zmodyfikowanych i pierwotnych: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/

Ilość danych

Wszystkie zestawy danych są codziennie aktualizowane. Od 11 maja 2020 r. zawierały 125 576 wierszy (CSV 16,1 MB, JSON 40,0 MB, JSONL 39,6 MB, Parquet 1,1 MB).

Przypisywanie praw do licencji i użytkowania

Te dane są dostępne wyłącznie dla celów edukacyjnych i akademickich, takich jak badania medyczne, agencje rządowe i instytucje akademickie, zgodnie z warunkami i warunkami.

Dane używane lub cytowane w publikacjach powinny zawierać przypisanie do "Monitora COVID-19 Bing" z linkiem do www.bing.com/covid.

Kontakt biznesowy

W razie jakichkolwiek pytań lub opinii dotyczących tego zestawu danych lub innych zestawów danych w usłudze COVID-19 Data Lake, skontaktuj się z askcovid19dl@microsoft.com.

Kolumny

Nazwisko Typ danych Unikatowe Wartości (przykładowe) opis
admin_region_1 string 864 Texas Georgia Region w obrębie country_region
admin_region_2 string 3143 Hrabstwo Washington Jefferson Region w obrębie admin_region_1
Potwierdzone int 120,692 1 2 Liczba potwierdzonych przypadków dla regionu
confirmed_change int 12,120 1 2 Zmiana liczby potwierdzonych przypadków z poprzedniego dnia
country_region string 237 Stany Zjednoczone Indiach Kraj/region
Zgonów int 20,616 1 2 Liczba przypadków śmiertelnych dla regionu
deaths_change smallint 1,981 1 2 Zmiana liczby przypadków śmiertelnych z poprzedniego dnia
identyfikator int 1,783,534 742546 69019298 Unikatowy identyfikator
iso_subdivision string 484 US-TX US-GA Dwuczęściowy kod poddziału standardu ISO
iso2 string 226 STANY ZJEDNOCZONE 2-literowy identyfikator kodu kraju
iso3 string 226 USA IND 3-literowy identyfikator kodu kraju
latitude double 5,675 42.28708 19.59852 Szerokość geograficzna centroidy regionu
load_time timestamp 1 2021-04-26 00:06:34.719000 Data i godzina załadowania pliku ze źródła usługi Bing w witrynie GitHub
długość geograficzna double 5,693 -2.5396 -155.5186 Długość geograficzna centroidy regionu
Odzyskane int 73,287 1 2 Liczba przypadków wyzdrowień dla regionu
recovered_change int 10,441 1 2 Zmiana liczby przypadków wyzdrowień z poprzedniego dnia
aktualizacja: data 457 2021-04-23 2021-04-22 Na dzień dla rekordu

Wersja zapoznawcza

identyfikator aktualizacja: Potwierdzone Zgonów iso2 iso3 country_region admin_region_1 iso_subdivision admin_region_2 load_time confirmed_change deaths_change
338995 2020-01-21 262 0 null null Cały świat null null null 26.04.2021 12:06:34
338996 2020-01-22 313 0 null null Cały świat null null null 26.04.2021 12:06:34 51 0
338997 2020-01-23 578 0 null null Cały świat null null null 26.04.2021 12:06:34 265 0
338998 2020-01-24 841 0 null null Cały świat null null null 26.04.2021 12:06:34 263 0
338999 2020-01-25 1320 0 null null Cały świat null null null 26.04.2021 12:06:34 479 0
339000 2020-01-26 2014 0 null null Cały świat null null null 26.04.2021 12:06:34 694 0
339001 2020-01-27 2798 0 null null Cały świat null null null 26.04.2021 12:06:34 784 0
339002 2020-01-28 4593 0 null null Cały świat null null null 26.04.2021 12:06:34 1795 0
339003 2020-01-29 6065 0 null null Cały świat null null null 26.04.2021 12:06:34 1472 0
339004 2020-01-30 7818 0 null null Cały świat null null null 26.04.2021 12:06:34 1753 0

Dostęp do danych

Azure Notebooks

Ten notes dokumentuje adresy URL i przykładowy kod, aby uzyskać dostęp do zestawu danych Bing COVID-19

Użyj następujących adresów URL, aby uzyskać określone formaty plików hostowane w usłudze Azure Blob Storage:

CSV: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.csv

JSON: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.json

JSONL: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.jsonl

Parquet: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.parquet

Pobierz plik zestawu danych przy użyciu wbudowanej funkcji pobierania z adresu URL http w bibliotece Pandas. Biblioteka Pandas ma czytniki dla różnych formatów plików:

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_parquet.html

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html

import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt

df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.parquet")
df.head(10)

Umożliwia sprawdzenie typów danych różnych pól i sprawdzenie, czy zaktualizowana kolumna ma format datetime

df.dtypes

Teraz przyjrzymy się danym na całym świecie i wykreślimy kilka prostych wykresów, aby zwizualizować dane

df_Worldwide=df[df['country_region']=='Worldwide']
df_Worldwide_pivot=df_Worldwide.pivot_table(df_Worldwide, index=['country_region','updated'])

df_Worldwide_pivot
df_Worldwide.plot(kind='line',x='updated',y="confirmed",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="confirmed_change",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths_change",grid=True)

Azure Databricks

Przykład nie jest dostępny dla tej kombinacji platformy/pakietu.

Azure Synapse

Przykład nie jest dostępny dla tej kombinacji platformy/pakietu.

Następne kroki

Wyświetl pozostałe zestawy danych w katalogu Open Datasets (Otwieranie zestawów danych).