Bing COVID-19
A Bing COVID-19-adatai tartalmazzák a aktív, halálos és gyógyult eseteket minden régióból, naponta frissítve. Ezeket az adatokat tükrözi a Bing COVID-19-figyelő.
A Bing több megbízható, megbízható forrásból gyűjt adatokat, többek között az Egészségügyi Világszervezettől (WHO), a Betegségek elleni védekezési és megelőzési központoktól (CDC), a nemzeti/regionális és állami közegészségügyi részlegektől, a BNO News-tól, a 24/7 Wall St.-től és a Wikipédiától.
Megjegyzés:
A Microsoft az Azure Open Datasets szolgáltatást "adott módon" biztosítja. A Microsoft nem vállal kifejezett vagy vélelmezett garanciát vagy feltételeket az adathalmazok Ön általi használatára vonatkozóan. A microsoft a helyi jogszabályok által megengedett mértékben kizár minden felelősséget az adathalmazok használatából eredő károkért vagy veszteségekért, beleértve a közvetlen, következményi, különleges, közvetett, incidenses vagy büntető jellegű károkat is.
Az adatkészletet a Microsoft forrásadataihoz tartozó eredeti feltételek szerint szolgáltatjuk. A készlet tartalmazhat Microsofttól származó adatokat.
Adathalmazok
A módosított adathalmazok a CSV, a JSON, a JSON-Lines és a Parquet alkalmazásban érhetők el.
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.csv
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.json
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.jsonl
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.parquet
Minden módosított adatkészletben fel van tüntetve az ISO 3166-os alcsoportkód és a betöltési idő, és kisbetűs oszlopneveket használnak, elválasztóként pedig aláhúzás karaktert.
Nyers adatok: https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/bing_covid-19_data/latest/Bing-COVID19-Data.csv
A módosított és nyers adatok előző verziói: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/
Data volume
Minden adatkészlet naponta frissül. 2020. május 11-én 125 576 sort tartalmaztak (CSV 16,1 MB, JSON 40,0 MB, JSONL 39,6 MB, Parquet 1,1 MB).
Licenc és használati jogosultságok hozzárendelése
Ezek az adatok szigorúan oktatási és tudományos célokra, például orvosi kutatások, kormányzati szervek és felsőoktatási intézmények számára érhetők el, feltételek és feltételek mellett.
A kiadványokban használt vagy idézett adatoknak tartalmazniuk kell a "Bing COVID-19 Tracker" attribútumot, valamint a www.bing.com/covid mutató hivatkozást.
KAPCSOLATTARTÓ
A COVID-19-adattóval kapcsolatos kérdéseit és visszajelzéseit az askcovid19dl@microsoft.com címre küldheti.
Oszlopok
Név | Adattípus | Egyedi | Values (sample) | Leírás |
---|---|---|---|---|
admin_region_1 | sztring | 864 | Texas Georgia | Régió az országon/régión belül |
admin_region_2 | sztring | 3143 | Washington megye Jefferson megye | Régió az admin_region_1-on belül |
Megerősítette | egész | 120,692 | 1 2 | A régióra vonatkozó megerősített esetszám |
confirmed_change | egész | 12,120 | 1 2 | A megerősített esetek számában beállt változás az előző nap óta |
country_region | sztring | 237 | Egyesült Államok India | Ország/régió |
Halálesetek | egész | 20,616 | 1 2 | Halálozások száma a régióban |
deaths_change | smallint | 1,981 | 1 2 | A halálozások számában beállt változás az előző nap óta |
id | egész | 1,783,534 | 742546 69019298 | Egyedi azonosító |
iso_subdivision | sztring | 484 | US-TX US-GA | Kétrészes ISO-alosztály kódja |
iso2 | sztring | 226 | USA-BAN | 2 jegyű országkód-azonosító |
iso3 | sztring | 226 | USA IND | 3 jegyű országkód-azonosító |
latitude | double | 5,675 | 42.28708 19.59852 | A régió középpontjának földrajzi szélessége |
load_time | timestamp | 1 | 2021-04-26 00:06:34.719000 | A dátum és idő, amikor a fájlt a GitHubon lévő Bing-forrásból letöltötték |
hosszúság | double | 5,693 | -2.5396 -155.5186 | A régió középpontjának földrajzi hosszúsága |
Vissza | egész | 73,287 | 1 2 | Gyógyultak száma a régióban |
recovered_change | egész | 10,441 | 1 2 | A gyógyult estek számában beállt változás az előző nap óta |
frissítve | dátum: | 457 | 2021-04-23 2021-04-22 | A rekord rögzítési időpontja |
Előnézet megtekintése
id | frissítve | Megerősítette | Halálesetek | iso2 | iso3 | country_region | admin_region_1 | iso_subdivision | admin_region_2 | load_time | confirmed_change | deaths_change |
---|---|---|---|---|---|---|---|---|---|---|---|---|
338995 | 2020-01-21 | 262 | 0 | null | null | Világszerte | null | null | null | 2021.04.26. 12:06:34 | ||
338996 | 2020-01-22 | 313 | 0 | null | null | Világszerte | null | null | null | 2021.04.26. 12:06:34 | 51 | 0 |
338997 | 2020-01-23 | 578 | 0 | null | null | Világszerte | null | null | null | 2021.04.26. 12:06:34 | 265 | 0 |
338998 | 2020-01-24 | 841 | 0 | null | null | Világszerte | null | null | null | 2021.04.26. 12:06:34 | 263 | 0 |
338999 | 2020-01-25 | 1320 | 0 | null | null | Világszerte | null | null | null | 2021.04.26. 12:06:34 | 479 | 0 |
339000 | 2020-01-26 | 2014 | 0 | null | null | Világszerte | null | null | null | 2021.04.26. 12:06:34 | 694 | 0 |
339001 | 2020-01-27 | 2798 | 0 | null | null | Világszerte | null | null | null | 2021.04.26. 12:06:34 | 784 | 0 |
339002 | 2020-01-28 | 4593 | 0 | null | null | Világszerte | null | null | null | 2021.04.26. 12:06:34 | 1795 | 0 |
339003 | 2020-01-29 | 6065 | 0 | null | null | Világszerte | null | null | null | 2021.04.26. 12:06:34 | 1472 | 0 |
339004 | 2020-01-30 | 7818 | 0 | null | null | Világszerte | null | null | null | 2021.04.26. 12:06:34 | 1753 | 0 |
Az adatok elérése
Azure Notebooks
Ez a jegyzetfüzet a Bing COVID-19-adatkészlet eléréséhez szükséges URL-címeket és mintakódot dokumentálja
Az alábbi URL-címekkel lekérheti az Azure Blob Storage-ban üzemeltetett fájlformátumokat:
Töltse le az adathalmazfájlt a pandas-i HTTP URL-címről letölthető beépített funkcióval. A Pandas különböző fájlformátumok olvasóival rendelkezik:
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_parquet.html
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html
import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt
df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.parquet")
df.head(10)
Lehetővé teszi a különböző mezők adattípusainak ellenőrzését és annak ellenőrzését, hogy a frissített oszlop dátum/idő formátumú-e
df.dtypes
Most áttekintjük a globális adatokat, és néhány egyszerű diagramot ábrázolunk az adatok megjelenítéséhez
df_Worldwide=df[df['country_region']=='Worldwide']
df_Worldwide_pivot=df_Worldwide.pivot_table(df_Worldwide, index=['country_region','updated'])
df_Worldwide_pivot
df_Worldwide.plot(kind='line',x='updated',y="confirmed",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="confirmed_change",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths_change",grid=True)
Azure Databricks
A minta nem érhető el ehhez a platform-/csomagkombinációhoz.
Azure Synapse
A minta nem érhető el ehhez a platform-/csomagkombinációhoz.
További lépések
Tekintse meg a többi adathalmazt az Open Datasets katalógusban.