Bing COVID-19
Dane Bing COVID-19 obejmują przypadki potwierdzone, śmiertelne i wyleczone ze wszystkich regionów, aktualizowane codziennie. Te dane są odzwierciedlone w monitorze Bing COVID-19.
Bing zbiera dane z wielu zaufanych, niezawodnych źródeł, w tym Światowej Organizacji Zdrowia (WHO), Centers for Disease Control and Prevention (CDC), krajowych/regionalnych i państwowych służb zdrowia publicznego, BNO News, 24/7 Wall St., i Wikipedia.
Uwaga
Firma Microsoft udostępnia zestawy danych Platformy Azure open na zasadzie "tak, jak to jest". Firma Microsoft nie udziela żadnych gwarancji, wyraźnych lub domniemanych, gwarancji ani warunków w odniesieniu do korzystania z zestawów danych. W zakresie dozwolonym zgodnie z prawem lokalnym firma Microsoft nie ponosi odpowiedzialności za wszelkie szkody lub straty, w tym bezpośrednie, wtórne, specjalne, pośrednie, przypadkowe lub karne wynikające z korzystania z zestawów danych.
Zestaw danych jest udostępniany zgodnie z pierwotnymi warunkami, na jakich firma Microsoft otrzymała dane źródłowe. Zestaw danych może zawierać dane pozyskane z firmy Microsoft.
Zestawy danych
Zmodyfikowane zestawy danych są dostępne w plikach CSV, JSON, JSON-Lines i Parquet.
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.csv
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.json
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.jsonl
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.parquet
Wszystkie zmodyfikowane zestawy danych mają dodane czasy ładowania i kody poddziałów standardu ISO 3166 oraz używają nazw kolumn pisanych małymi literami z separatorami w postaci znaków podkreślenia.
Dane pierwotne: https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/bing_covid-19_data/latest/Bing-COVID19-Data.csv
Poprzednie wersje danych zmodyfikowanych i pierwotnych: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/
Ilość danych
Wszystkie zestawy danych są codziennie aktualizowane. Od 11 maja 2020 r. zawierały 125 576 wierszy (CSV 16,1 MB, JSON 40,0 MB, JSONL 39,6 MB, Parquet 1,1 MB).
Przypisywanie praw do licencji i użytkowania
Te dane są dostępne wyłącznie dla celów edukacyjnych i akademickich, takich jak badania medyczne, agencje rządowe i instytucje akademickie, zgodnie z warunkami i warunkami.
Dane używane lub cytowane w publikacjach powinny zawierać przypisanie do "Monitora COVID-19 Bing" z linkiem do www.bing.com/covid.
Kontakt biznesowy
W razie jakichkolwiek pytań lub opinii dotyczących tego zestawu danych lub innych zestawów danych w usłudze COVID-19 Data Lake, skontaktuj się z askcovid19dl@microsoft.com.
Kolumny
Nazwisko | Typ danych | Unikatowe | Wartości (przykładowe) | opis |
---|---|---|---|---|
admin_region_1 | string | 864 | Texas Georgia | Region w obrębie country_region |
admin_region_2 | string | 3143 | Hrabstwo Washington Jefferson | Region w obrębie admin_region_1 |
Potwierdzone | int | 120,692 | 1 2 | Liczba potwierdzonych przypadków dla regionu |
confirmed_change | int | 12,120 | 1 2 | Zmiana liczby potwierdzonych przypadków z poprzedniego dnia |
country_region | string | 237 | Stany Zjednoczone Indiach | Kraj/region |
Zgonów | int | 20,616 | 1 2 | Liczba przypadków śmiertelnych dla regionu |
deaths_change | smallint | 1,981 | 1 2 | Zmiana liczby przypadków śmiertelnych z poprzedniego dnia |
identyfikator | int | 1,783,534 | 742546 69019298 | Unikatowy identyfikator |
iso_subdivision | string | 484 | US-TX US-GA | Dwuczęściowy kod poddziału standardu ISO |
iso2 | string | 226 | STANY ZJEDNOCZONE | 2-literowy identyfikator kodu kraju |
iso3 | string | 226 | USA IND | 3-literowy identyfikator kodu kraju |
latitude | double | 5,675 | 42.28708 19.59852 | Szerokość geograficzna centroidy regionu |
load_time | timestamp | 1 | 2021-04-26 00:06:34.719000 | Data i godzina załadowania pliku ze źródła usługi Bing w witrynie GitHub |
długość geograficzna | double | 5,693 | -2.5396 -155.5186 | Długość geograficzna centroidy regionu |
Odzyskane | int | 73,287 | 1 2 | Liczba przypadków wyzdrowień dla regionu |
recovered_change | int | 10,441 | 1 2 | Zmiana liczby przypadków wyzdrowień z poprzedniego dnia |
aktualizacja: | data | 457 | 2021-04-23 2021-04-22 | Na dzień dla rekordu |
Wersja zapoznawcza
identyfikator | aktualizacja: | Potwierdzone | Zgonów | iso2 | iso3 | country_region | admin_region_1 | iso_subdivision | admin_region_2 | load_time | confirmed_change | deaths_change |
---|---|---|---|---|---|---|---|---|---|---|---|---|
338995 | 2020-01-21 | 262 | 0 | null | null | Cały świat | null | null | null | 26.04.2021 12:06:34 | ||
338996 | 2020-01-22 | 313 | 0 | null | null | Cały świat | null | null | null | 26.04.2021 12:06:34 | 51 | 0 |
338997 | 2020-01-23 | 578 | 0 | null | null | Cały świat | null | null | null | 26.04.2021 12:06:34 | 265 | 0 |
338998 | 2020-01-24 | 841 | 0 | null | null | Cały świat | null | null | null | 26.04.2021 12:06:34 | 263 | 0 |
338999 | 2020-01-25 | 1320 | 0 | null | null | Cały świat | null | null | null | 26.04.2021 12:06:34 | 479 | 0 |
339000 | 2020-01-26 | 2014 | 0 | null | null | Cały świat | null | null | null | 26.04.2021 12:06:34 | 694 | 0 |
339001 | 2020-01-27 | 2798 | 0 | null | null | Cały świat | null | null | null | 26.04.2021 12:06:34 | 784 | 0 |
339002 | 2020-01-28 | 4593 | 0 | null | null | Cały świat | null | null | null | 26.04.2021 12:06:34 | 1795 | 0 |
339003 | 2020-01-29 | 6065 | 0 | null | null | Cały świat | null | null | null | 26.04.2021 12:06:34 | 1472 | 0 |
339004 | 2020-01-30 | 7818 | 0 | null | null | Cały świat | null | null | null | 26.04.2021 12:06:34 | 1753 | 0 |
Dostęp do danych
Azure Notebooks
Ten notes dokumentuje adresy URL i przykładowy kod, aby uzyskać dostęp do zestawu danych Bing COVID-19
Użyj następujących adresów URL, aby uzyskać określone formaty plików hostowane w usłudze Azure Blob Storage:
Pobierz plik zestawu danych przy użyciu wbudowanej funkcji pobierania z adresu URL http w bibliotece Pandas. Biblioteka Pandas ma czytniki dla różnych formatów plików:
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_parquet.html
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html
import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt
df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.parquet")
df.head(10)
Umożliwia sprawdzenie typów danych różnych pól i sprawdzenie, czy zaktualizowana kolumna ma format datetime
df.dtypes
Teraz przyjrzymy się danym na całym świecie i wykreślimy kilka prostych wykresów, aby zwizualizować dane
df_Worldwide=df[df['country_region']=='Worldwide']
df_Worldwide_pivot=df_Worldwide.pivot_table(df_Worldwide, index=['country_region','updated'])
df_Worldwide_pivot
df_Worldwide.plot(kind='line',x='updated',y="confirmed",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="confirmed_change",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths_change",grid=True)
Azure Databricks
Przykład nie jest dostępny dla tej kombinacji platformy/pakietu.
Azure Synapse
Przykład nie jest dostępny dla tej kombinacji platformy/pakietu.
Następne kroki
Wyświetl pozostałe zestawy danych w katalogu Open Datasets (Otwieranie zestawów danych).