Bing COVID-19

A Bing COVID-19-adatai tartalmazzák a aktív, halálos és gyógyult eseteket minden régióból, naponta frissítve. Ezeket az adatokat tükrözi a Bing COVID-19-figyelő.

A Bing több megbízható, megbízható forrásból gyűjt adatokat, többek között az Egészségügyi Világszervezettől (WHO), a Betegségek elleni védekezési és megelőzési központoktól (CDC), a nemzeti/regionális és állami közegészségügyi részlegektől, a BNO News-tól, a 24/7 Wall St.-től és a Wikipédiától.

Megjegyzés:

A Microsoft az Azure Open Datasets szolgáltatást "adott módon" biztosítja. A Microsoft nem vállal kifejezett vagy vélelmezett garanciát vagy feltételeket az adathalmazok Ön általi használatára vonatkozóan. A microsoft a helyi jogszabályok által megengedett mértékben kizár minden felelősséget az adathalmazok használatából eredő károkért vagy veszteségekért, beleértve a közvetlen, következményi, különleges, közvetett, incidenses vagy büntető jellegű károkat is.

Az adatkészletet a Microsoft forrásadataihoz tartozó eredeti feltételek szerint szolgáltatjuk. A készlet tartalmazhat Microsofttól származó adatokat.

Adathalmazok

A módosított adathalmazok a CSV, a JSON, a JSON-Lines és a Parquet alkalmazásban érhetők el.

Minden módosított adatkészletben fel van tüntetve az ISO 3166-os alcsoportkód és a betöltési idő, és kisbetűs oszlopneveket használnak, elválasztóként pedig aláhúzás karaktert.

Nyers adatok: https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/bing_covid-19_data/latest/Bing-COVID19-Data.csv

A módosított és nyers adatok előző verziói: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/

Data volume

Minden adatkészlet naponta frissül. 2020. május 11-én 125 576 sort tartalmaztak (CSV 16,1 MB, JSON 40,0 MB, JSONL 39,6 MB, Parquet 1,1 MB).

Licenc és használati jogosultságok hozzárendelése

Ezek az adatok szigorúan oktatási és tudományos célokra, például orvosi kutatások, kormányzati szervek és felsőoktatási intézmények számára érhetők el, feltételek és feltételek mellett.

A kiadványokban használt vagy idézett adatoknak tartalmazniuk kell a "Bing COVID-19 Tracker" attribútumot, valamint a www.bing.com/covid mutató hivatkozást.

KAPCSOLATTARTÓ

A COVID-19-adattóval kapcsolatos kérdéseit és visszajelzéseit az askcovid19dl@microsoft.com címre küldheti.

Oszlopok

Név Adattípus Egyedi Values (sample) Leírás
admin_region_1 sztring 864 Texas Georgia Régió az országon/régión belül
admin_region_2 sztring 3143 Washington megye Jefferson megye Régió az admin_region_1-on belül
Megerősítette egész 120,692 1 2 A régióra vonatkozó megerősített esetszám
confirmed_change egész 12,120 1 2 A megerősített esetek számában beállt változás az előző nap óta
country_region sztring 237 Egyesült Államok India Ország/régió
Halálesetek egész 20,616 1 2 Halálozások száma a régióban
deaths_change smallint 1,981 1 2 A halálozások számában beállt változás az előző nap óta
id egész 1,783,534 742546 69019298 Egyedi azonosító
iso_subdivision sztring 484 US-TX US-GA Kétrészes ISO-alosztály kódja
iso2 sztring 226 USA-BAN 2 jegyű országkód-azonosító
iso3 sztring 226 USA IND 3 jegyű országkód-azonosító
latitude double 5,675 42.28708 19.59852 A régió középpontjának földrajzi szélessége
load_time timestamp 1 2021-04-26 00:06:34.719000 A dátum és idő, amikor a fájlt a GitHubon lévő Bing-forrásból letöltötték
hosszúság double 5,693 -2.5396 -155.5186 A régió középpontjának földrajzi hosszúsága
Vissza egész 73,287 1 2 Gyógyultak száma a régióban
recovered_change egész 10,441 1 2 A gyógyult estek számában beállt változás az előző nap óta
frissítve dátum: 457 2021-04-23 2021-04-22 A rekord rögzítési időpontja

Előnézet megtekintése

id frissítve Megerősítette Halálesetek iso2 iso3 country_region admin_region_1 iso_subdivision admin_region_2 load_time confirmed_change deaths_change
338995 2020-01-21 262 0 null null Világszerte null null null 2021.04.26. 12:06:34
338996 2020-01-22 313 0 null null Világszerte null null null 2021.04.26. 12:06:34 51 0
338997 2020-01-23 578 0 null null Világszerte null null null 2021.04.26. 12:06:34 265 0
338998 2020-01-24 841 0 null null Világszerte null null null 2021.04.26. 12:06:34 263 0
338999 2020-01-25 1320 0 null null Világszerte null null null 2021.04.26. 12:06:34 479 0
339000 2020-01-26 2014 0 null null Világszerte null null null 2021.04.26. 12:06:34 694 0
339001 2020-01-27 2798 0 null null Világszerte null null null 2021.04.26. 12:06:34 784 0
339002 2020-01-28 4593 0 null null Világszerte null null null 2021.04.26. 12:06:34 1795 0
339003 2020-01-29 6065 0 null null Világszerte null null null 2021.04.26. 12:06:34 1472 0
339004 2020-01-30 7818 0 null null Világszerte null null null 2021.04.26. 12:06:34 1753 0

Az adatok elérése

Azure Notebooks

Ez a jegyzetfüzet a Bing COVID-19-adatkészlet eléréséhez szükséges URL-címeket és mintakódot dokumentálja

Az alábbi URL-címekkel lekérheti az Azure Blob Storage-ban üzemeltetett fájlformátumokat:

CSV: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.csv

JSON: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.json

JSONL: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.jsonl

Parquet: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.parquet

Töltse le az adathalmazfájlt a pandas-i HTTP URL-címről letölthető beépített funkcióval. A Pandas különböző fájlformátumok olvasóival rendelkezik:

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_parquet.html

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html

import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt

df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.parquet")
df.head(10)

Lehetővé teszi a különböző mezők adattípusainak ellenőrzését és annak ellenőrzését, hogy a frissített oszlop dátum/idő formátumú-e

df.dtypes

Most áttekintjük a globális adatokat, és néhány egyszerű diagramot ábrázolunk az adatok megjelenítéséhez

df_Worldwide=df[df['country_region']=='Worldwide']
df_Worldwide_pivot=df_Worldwide.pivot_table(df_Worldwide, index=['country_region','updated'])

df_Worldwide_pivot
df_Worldwide.plot(kind='line',x='updated',y="confirmed",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="confirmed_change",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths_change",grid=True)

Azure Databricks

A minta nem érhető el ehhez a platform-/csomagkombinációhoz.

Azure Synapse

A minta nem érhető el ehhez a platform-/csomagkombinációhoz.

További lépések

Tekintse meg a többi adathalmazt az Open Datasets katalógusban.