Bing COVID-19
A Bing COVID-19-adatai tartalmazzák a aktív, halálos és gyógyult eseteket minden régióból, naponta frissítve. A Bing COVID-19 Tracker ezeket az adatokat tükrözi.
A Bing több megbízható, megbízható forrásból gyűjt adatokat, többek között a következőket:
- BNO Hírek
- Centers for Disease Control and Prevention (CDC)
- Nemzeti/regionális és állami közegészségügyi részlegek
- Wikipédia
- Az Egészségügyi Világszervezet (WHO)
- 24/7 Wall St.
Feljegyzés
A Microsoft az Azure Open Datasets szolgáltatást "adott módon" biztosítja. A Microsoft nem vállal kifejezett vagy vélelmezett garanciát vagy feltételeket az adathalmazok Ön általi használatára vonatkozóan. A microsoft a helyi jogszabályok által megengedett mértékben kizár minden felelősséget az adathalmazok használatából eredő károkért vagy veszteségekért, beleértve a közvetlen, következményi, különleges, közvetett, incidenses vagy büntető jellegű károkat is.
Az adatkészletet a Microsoft forrásadataihoz tartozó eredeti feltételek szerint szolgáltatjuk. A készlet tartalmazhat Microsofttól származó adatokat.
Adathalmazok
A módosított Bing COVID-19-adatkészletek a CSV, a JSON, a JSON-Lines és a Parquet alkalmazásban érhetők el:
Minden módosított adatkészlet iso 3166-os felosztási kóddal és betöltési idővel rendelkezik. Kisbetűs oszlopneveket használnak aláhúzásjel-elválasztókkal.
Ebben az erőforrásban a módosított és nyers adatok korábbi verziói érhetők el.
Adatmennyiség
Minden adathalmaz napi frissítéseket kap. 2023. március 5-én 4 766 737 sort tartalmaztak. Az adathalmaz az alábbi fájlformátumokban érhető el:
- CSV (560,3 MB)
- JSON (1515,6 MB)
- JSONL (1506,2 MB)
- Parquet (55,4 MB)
Licenc és használati jogosultságok hozzárendelése
Az adatok szigorúan oktatási és tudományos célokra érhetők el a jelen feltételek és feltételek szerint. Érvényes célok:
- felsőoktatási intézmények
- kormányzati szervek
- orvosi kutatás
A kiadványokban használt vagy idézett adatoknak tartalmazniuk kell a "Bing COVID-19 Tracker" attribútumot, amely tartalmazza a www.bing.com/covid mutató hivatkozást.
Kapcsolat
A COVID-19 Data Lake-kapcsolatfelvételen askcovid19dl@microsoft.comezzel vagy más adatkészletekkel kapcsolatos kérdésekért vagy visszajelzésért.
Oszlopok
Név | Adattípus | Egyedi | Values (sample) | Leírás |
---|---|---|---|---|
admin_region_1 | húr | 864 | Texas Georgia | Régió az országon/régión belül |
admin_region_2 | húr | 3143 | Washington megye Jefferson megye | Régió az admin_region_1-on belül |
megrögzött | egész | 120,692 | 1 2 | A régióra vonatkozó megerősített esetszám |
confirmed_change | egész | 12,120 | 1 2 | A megerősített esetek számában beállt változás az előző nap óta |
country_region | húr | 237 | Egyesült Államok India | Ország/régió |
Halálesetek | egész | 20,616 | 1 2 | Halálozások száma a régióban |
deaths_change | smallint | 1,981 | 1 2 | A halálozások számában beállt változás az előző nap óta |
id | egész | 1,783,534 | 742546 69019298 | Egyedi azonosító |
iso_subdivision | húr | 484 | US-TX US-GA | Kétrészes ISO-alosztály kódja |
iso2 | húr | 226 | USA-BAN | 2 jegyű országkód-azonosító |
iso3 | húr | 226 | USA IND | 3 jegyű országkód-azonosító |
latitude | double | 5,675 | 42.28708 19.59852 | A régió középpontjának földrajzi szélessége |
load_time | időbélyeg | 0 | 2021-04-26 00:06:34.719000 | A dátum és idő, amikor a fájlt a GitHubon lévő Bing-forrásból letöltötték |
hosszúság | double | 5,693 | -2.5396 -155.5186 | A régió középpontjának földrajzi hosszúsága |
Vissza | egész | 73,287 | 1 2 | Gyógyultak száma a régióban |
recovered_change | egész | 10,441 | 1 2 | A gyógyult estek számában beállt változás az előző nap óta |
frissítve | dátum: | 457 | 2021-04-23 2021-04-22 | A rekord rögzítési időpontja |
Előnézet
id | frissítve | megrögzött | Halálesetek | iso2 | iso3 | country_region | admin_region_1 | iso_subdivision | admin_region_2 | load_time | confirmed_change | deaths_change |
---|---|---|---|---|---|---|---|---|---|---|---|---|
338995 | 2020-01-21 | 262 | 0 | null | null | Világszerte | null | null | null | 2021.04.26. 12:06:34 | ||
338996 | 2020-01-22 | 313 | 0 | null | null | Világszerte | null | null | null | 2021.04.26. 12:06:34 | 51 | 0 |
338997 | 2020-01-23 | 578 | 0 | null | null | Világszerte | null | null | null | 2021.04.26. 12:06:34 | 265 | 0 |
338998 | 2020-01-24 | 841 | 0 | null | null | Világszerte | null | null | null | 2021.04.26. 12:06:34 | 263 | 0 |
338999 | 2020-01-25 | 1320 | 0 | null | null | Világszerte | null | null | null | 2021.04.26. 12:06:34 | 479 | 0 |
339000 | 2020-01-26 | 2014 | 0 | null | null | Világszerte | null | null | null | 2021.04.26. 12:06:34 | 694 | 0 |
339001 | 2020-01-27 | 2798 | 0 | null | null | Világszerte | null | null | null | 2021.04.26. 12:06:34 | 784 | 0 |
339002 | 2020-01-28 | 4593 | 0 | null | null | Világszerte | null | null | null | 2021.04.26. 12:06:34 | 1795 | 0 |
339003 | 2020-01-29 | 6065 | 0 | null | null | Világszerte | null | null | null | 2021.04.26. 12:06:34 | 1472 | 0 |
339004 | 2020-01-30 | 7818 | 0 | null | null | Világszerte | null | null | null | 2021.04.26. 12:06:34 | 1753 | 0 |
Adathozzáférés – Azure-jegyzetfüzetek
Feljegyzés
Ez a jegyzetfüzet a Bing COVID-19-adatkészlet eléréséhez szükséges URL-címeket és mintakódot dokumentálja.
Az alábbi URL-címek használatával lekérheti az Azure Blob Storage-ban üzemeltetett fájlformátumokat:
Töltse le az adathalmazfájlt a Pandas beépített funkciójának használatával a HTTP URL-címről való letöltéshez. A Pandas különböző fájlformátumok olvasóival rendelkezik:
import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt
df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.parquet")
df.head(10)
Annak ellenőrzéséhez, hogy a frissített oszlop dátum/idő formátumú-e, ellenőrizze a különböző mezők adattípusait:
df.dtypes
Tekintse át a worldwide adatokat. Az adatok megjelenítéséhez hozzon létre néhány diagramot:
df_Worldwide=df[df['country_region']=='Worldwide']
df_Worldwide_pivot=df_Worldwide.pivot_table(df_Worldwide, index=['country_region','updated'])
df_Worldwide_pivot
df_Worldwide.plot(kind='line',x='updated',y="confirmed",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="confirmed_change",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths_change",grid=True)
Adathozzáférés – Azure Databricks
Ehhez a platformhoz/csomagkombinációhoz nem érhető el minta.
Adathozzáférés – Azure Synapse
Ehhez a platformhoz/csomagkombinációhoz nem érhető el minta.
Következő lépések
Tekintse meg a többi adathalmazt az Open Datasets katalógusban.