Megosztás a következőn keresztül:


Bing COVID-19

A Bing COVID-19-adatai tartalmazzák a aktív, halálos és gyógyult eseteket minden régióból, naponta frissítve. A Bing COVID-19 Tracker ezeket az adatokat tükrözi.

A Bing több megbízható, megbízható forrásból gyűjt adatokat, többek között a következőket:

Feljegyzés

A Microsoft az Azure Open Datasets szolgáltatást "adott módon" biztosítja. A Microsoft nem vállal kifejezett vagy vélelmezett garanciát vagy feltételeket az adathalmazok Ön általi használatára vonatkozóan. A microsoft a helyi jogszabályok által megengedett mértékben kizár minden felelősséget az adathalmazok használatából eredő károkért vagy veszteségekért, beleértve a közvetlen, következményi, különleges, közvetett, incidenses vagy büntető jellegű károkat is.

Az adatkészletet a Microsoft forrásadataihoz tartozó eredeti feltételek szerint szolgáltatjuk. A készlet tartalmazhat Microsofttól származó adatokat.

Adathalmazok

A módosított Bing COVID-19-adatkészletek a CSV, a JSON, a JSON-Lines és a Parquet alkalmazásban érhetők el:

Minden módosított adatkészlet iso 3166-os felosztási kóddal és betöltési idővel rendelkezik. Kisbetűs oszlopneveket használnak aláhúzásjel-elválasztókkal.

CSV-formátumú nyers adatok

Ebben az erőforrásban a módosított és nyers adatok korábbi verziói érhetők el.

Adatmennyiség

Minden adathalmaz napi frissítéseket kap. 2023. március 5-én 4 766 737 sort tartalmaztak. Az adathalmaz az alábbi fájlformátumokban érhető el:

  • CSV (560,3 MB)
  • JSON (1515,6 MB)
  • JSONL (1506,2 MB)
  • Parquet (55,4 MB)

Licenc és használati jogosultságok hozzárendelése

Az adatok szigorúan oktatási és tudományos célokra érhetők el a jelen feltételek és feltételek szerint. Érvényes célok:

  • felsőoktatási intézmények
  • kormányzati szervek
  • orvosi kutatás

A kiadványokban használt vagy idézett adatoknak tartalmazniuk kell a "Bing COVID-19 Tracker" attribútumot, amely tartalmazza a www.bing.com/covid mutató hivatkozást.

Kapcsolat

A COVID-19 Data Lake-kapcsolatfelvételen askcovid19dl@microsoft.comezzel vagy más adatkészletekkel kapcsolatos kérdésekért vagy visszajelzésért.

Oszlopok

Név Adattípus Egyedi Values (sample) Leírás
admin_region_1 húr 864 Texas Georgia Régió az országon/régión belül
admin_region_2 húr 3143 Washington megye Jefferson megye Régió az admin_region_1-on belül
megrögzött egész 120,692 1 2 A régióra vonatkozó megerősített esetszám
confirmed_change egész 12,120 1 2 A megerősített esetek számában beállt változás az előző nap óta
country_region húr 237 Egyesült Államok India Ország/régió
Halálesetek egész 20,616 1 2 Halálozások száma a régióban
deaths_change smallint 1,981 1 2 A halálozások számában beállt változás az előző nap óta
id egész 1,783,534 742546 69019298 Egyedi azonosító
iso_subdivision húr 484 US-TX US-GA Kétrészes ISO-alosztály kódja
iso2 húr 226 USA-BAN 2 jegyű országkód-azonosító
iso3 húr 226 USA IND 3 jegyű országkód-azonosító
latitude double 5,675 42.28708 19.59852 A régió középpontjának földrajzi szélessége
load_time időbélyeg 0 2021-04-26 00:06:34.719000 A dátum és idő, amikor a fájlt a GitHubon lévő Bing-forrásból letöltötték
hosszúság double 5,693 -2.5396 -155.5186 A régió középpontjának földrajzi hosszúsága
Vissza egész 73,287 1 2 Gyógyultak száma a régióban
recovered_change egész 10,441 1 2 A gyógyult estek számában beállt változás az előző nap óta
frissítve dátum: 457 2021-04-23 2021-04-22 A rekord rögzítési időpontja

Előnézet

id frissítve megrögzött Halálesetek iso2 iso3 country_region admin_region_1 iso_subdivision admin_region_2 load_time confirmed_change deaths_change
338995 2020-01-21 262 0 null null Világszerte null null null 2021.04.26. 12:06:34
338996 2020-01-22 313 0 null null Világszerte null null null 2021.04.26. 12:06:34 51 0
338997 2020-01-23 578 0 null null Világszerte null null null 2021.04.26. 12:06:34 265 0
338998 2020-01-24 841 0 null null Világszerte null null null 2021.04.26. 12:06:34 263 0
338999 2020-01-25 1320 0 null null Világszerte null null null 2021.04.26. 12:06:34 479 0
339000 2020-01-26 2014 0 null null Világszerte null null null 2021.04.26. 12:06:34 694 0
339001 2020-01-27 2798 0 null null Világszerte null null null 2021.04.26. 12:06:34 784 0
339002 2020-01-28 4593 0 null null Világszerte null null null 2021.04.26. 12:06:34 1795 0
339003 2020-01-29 6065 0 null null Világszerte null null null 2021.04.26. 12:06:34 1472 0
339004 2020-01-30 7818 0 null null Világszerte null null null 2021.04.26. 12:06:34 1753 0

Adathozzáférés – Azure-jegyzetfüzetek

Feljegyzés

Ez a jegyzetfüzet a Bing COVID-19-adatkészlet eléréséhez szükséges URL-címeket és mintakódot dokumentálja.

Az alábbi URL-címek használatával lekérheti az Azure Blob Storage-ban üzemeltetett fájlformátumokat:

Töltse le az adathalmazfájlt a Pandas beépített funkciójának használatával a HTTP URL-címről való letöltéshez. A Pandas különböző fájlformátumok olvasóival rendelkezik:

pandas.read_parquet

pandas.read_csv

import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt

df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.parquet")
df.head(10)

Annak ellenőrzéséhez, hogy a frissített oszlop dátum/idő formátumú-e, ellenőrizze a különböző mezők adattípusait:

df.dtypes

Tekintse át a worldwide adatokat. Az adatok megjelenítéséhez hozzon létre néhány diagramot:

df_Worldwide=df[df['country_region']=='Worldwide']
df_Worldwide_pivot=df_Worldwide.pivot_table(df_Worldwide, index=['country_region','updated'])

df_Worldwide_pivot
df_Worldwide.plot(kind='line',x='updated',y="confirmed",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="confirmed_change",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths_change",grid=True)

Adathozzáférés – Azure Databricks

Ehhez a platformhoz/csomagkombinációhoz nem érhető el minta.

Adathozzáférés – Azure Synapse

Ehhez a platformhoz/csomagkombinációhoz nem érhető el minta.

Következő lépések

Tekintse meg a többi adathalmazt az Open Datasets katalógusban.