Európai Betegségmegelőzési és Járványvédelmi Központ (ECDC) COVID-19-esetek
A COVID-19-esetek földrajzi eloszlására vonatkozó legfrissebb nyilvános adatok világszerte az Európai Betegségmegelőzési és Járványvédelmi Központból (ECDC). Minden sor/bejegyzés az új jelentett esetek számát tartalmazza naponként és országonként/régiónként.
Megjegyzés
A Microsoft "adott módon" biztosítja az Azure Open Datasets szolgáltatást. A Microsoft nem vállal kifejezett vagy vélelmezett garanciát vagy feltételeket az adathalmazok Ön általi használatára vonatkozóan. A helyi jogszabályok által megengedett mértékben a Microsoft kizár minden felelősséget az adathalmazok ön általi használatából eredő károkért vagy veszteségekért, beleértve a közvetlen, következményi, különleges, közvetett, járulékos vagy büntető jellegű károkat.
Az adatkészletet a Microsoft forrásadataihoz tartozó eredeti feltételek szerint szolgáltatjuk. A készlet tartalmazhat Microsofttól származó adatokat.
Adathalmazok
Az adathalmaz módosított verziói naponta frissített CSV-, JSON-, JSON-Lines és Parquet-fájlokként is elérhetők:
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.csv
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.json
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.jsonl
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.parquet
Minden módosított verzióban fel van tüntetve az iso_country_region kód és a betöltési idő, és kisbetűs oszlopneveket használnak, elválasztóként pedig aláhúzás karaktert.
Nyers adatok: https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/ecdc_cases/latest/ECDCCases.csv
A módosított és nyers adatok korábbi verziói: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/ecdc_cases/
Adatmennyiség
2020. május 28-án 19 876 sort tartalmaztak (CSV 1,5 MB, JSON 4,9 MB, JSONL 4,9 MB, Parquet 54,1 kB).
Adatforrás
A rendszer naponta betölti a nyers adatokat az ECDC CSV-fájlból. Erről az adatkészletről, beleértve azok eredetét is, az ECDC adatgyűjtési oldalán talál további információt.
Adatminőség
Az ECDC nem garantálja az adatok helyességét és időbeli pontosságát. Olvassa el a jogi nyilatkozatot.
Licenc- és használati jogok hozzárendelése
Az adatok forrása az ECDC, és az ECDC itt elérhető szerzői jogi szabályzatával összhangban lettek elérhetővé és felhasználhatóvá téve. Minden olyan dokumentum esetén, melynek a szerzői joga harmadik fél tulajdonában van, a felhasználásra és a másolásra vonatkozó engedélyt a jogtulajdonostól kell beszerezni.
Az ECDC-t mindig fel kell tüntetni az adatok eredeti forrásaként. Ezt a visszaigazolást az anyag minden példányában fel kell tüntetni.
Kapcsolattartó
A COVID-19-adattóval kapcsolatos kérdéseit és visszajelzéseit az askcovid19dl@microsoft.com címre küldheti.
Oszlopok
Name | Adattípus | Egyedi | Értékek (minta) | Description |
---|---|---|---|---|
Esetekben | smallint | 5,515 | 1 2 | A jelentett esetek száma |
continent_exp | sztring | 6 | Európa Afrika | Kontinens neve |
countries_and_territories | sztring | 214 | Kanada Belgium | Ország vagy terület neve |
country_territory_code | sztring | 213 | KOR ISL | Ország vagy terület hárombetűs kódja |
date_rep | dátum | 350 | 2020-12-11 2020-11-22 | A jelentés kelte |
nap | smallint | 31 | 14 13 | A hónap hányadik napja |
Halálesetek | smallint | 1,049 | 1 2 | A jelentett halálesetek száma |
geo_id | sztring | 214 | CA SE | Földrajzi hely azonosítója |
iso_country | sztring | 214 | SE US | ISO 3166 ország vagy régió kódja |
load_date | időbélyeg | 1 | 2021-04-26 00:06:22.123000 | Az adatok Azure-ba történő betöltésének dátuma |
hónap | smallint | 12 | 10 8 | Hónap száma |
év | smallint | 2 | 2020 2019 | Year |
Előnézet
date_rep | nap | hónap | év | Esetekben | Halálesetek | countries_and_territories | geo_id | country_territory_code | continent_exp | load_date | iso_country |
---|---|---|---|---|---|---|---|---|---|---|---|
2020-12-14 | 14 | 12 | 2020 | 746 | 6 | Afganisztán | AF | AFG | Ázsia | 2021. 04. 26. 12:06:22 | AF |
2020-12-13 | 13 | 12 | 2020 | 298 | 9 | Afganisztán | AF | AFG | Ázsia | 2021. 04. 26. 12:06:22 | AF |
2020-12-12 | 12 | 12 | 2020 | 113 | 11 | Afganisztán | AF | AFG | Ázsia | 2021. 04. 26. 12:06:22 | AF |
2020-12-11 | 11 | 12 | 2020 | 63 | 10 | Afganisztán | AF | AFG | Ázsia | 2021. 04. 26. 12:06:22 | AF |
2020-12-10 | 10 | 12 | 2020 | 202 | 16 | Afganisztán | AF | AFG | Ázsia | 2021. 04. 26. 12:06:22 | AF |
2020-12-09 | 9 | 12 | 2020 | 135 | 13 | Afganisztán | AF | AFG | Ázsia | 2021. 04. 26. 12:06:22 | AF |
2020-12-08 | 8 | 12 | 2020 | 200 | 6 | Afganisztán | AF | AFG | Ázsia | 2021. 04. 26. 12:06:22 | AF |
2020-12-07 | 7 | 12 | 2020 | 210 | 26 | Afganisztán | AF | AFG | Ázsia | 2021. 04. 26. 12:06:22 | AF |
2020-12-06 | 6 | 12 | 2020 | 234 | 10 | Afganisztán | AF | AFG | Ázsia | 2021. 04. 26. 12:06:22 | AF |
2020-12-05 | 5 | 12 | 2020 | 235 | 18 | Afganisztán | AF | AFG | Ázsia | 2021. 04. 26. 12:06:22 | AF |
Az adatok elérése
Azure Notebooks
Ez a jegyzetfüzet dokumentálja az Európai Betegségmegelőzési és Járványvédelmi Központ (ECDC) Covid-19-esetek adatkészletének URL-címeit a Azure Blob Storage:¶ CSV-n tárolt különböző adathalmaz-fájlformátumok URL-címeinek eléréséhez:https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.csv
Töltse le az adathalmazfájlt a pandas-beli HTTP URL-címről való beépített letöltési funkcióval. A Pandas különböző fájlformátumokhoz rendelkezik olvasóval:
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_parquet.html
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html
import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt
df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.parquet")
df.head(10)
df.dtypes
df.groupby('countries_and_territories').first().filter(['continent_exp','cases', 'deaths','date_rep'])
df.groupby('continent_exp').agg({'countries_and_territories': 'count','cases': 'count','deaths': 'count'})
import plotly.graph_objects as go
import plotly.express as px
import matplotlib.pyplot as plt
df.loc[: , ['countries_and_territories', 'cases', 'deaths']].groupby(['countries_and_territories'
]).max().sort_values(by='cases',ascending=False).reset_index()[:15].style.background_gradient(cmap='rainbow')
df_Worldwide=df[df['countries_and_territories']=='United_States_of_America']
df.plot(kind='line',x='date_rep',y="cases",grid=True)
df.plot(kind='line',x='date_rep',y="deaths",grid=True)
#df_Worldwide.plot(kind='line',x='date_rep',y="confirmed_change",grid=True)
#df_Worldwide.plot(kind='line',x='date_rep',y="deaths_change",grid=True)
Azure Databricks
Ehhez a platform-/csomagkombinációhoz nem érhető el minta.
Azure Synapse
Ehhez a platform-/csomagkombinációhoz nem érhető el minta.
Példák
Tekintse meg az adathalmaz használhatóságára vonatkozó példákat:
- COVID-adatok elemzése kiszolgáló nélküli Synapse SQL-végponttal
- Lineáris regresszióelemzés COVID-adatokon SQL-végpont használatával az Azure Synapse Analyticsben
Következő lépések
Tekintse meg a többi adathalmazt az Open Datasets katalógusban.