COVID-nyomkövetési projekt

A COVID-követési projekt adatkészlete a tesztek, a megerősített esetek, a kórházi kezelések és a páciensek eredményeinek legutóbbi adatait tartalmazza az Egyesült Államok minden államára és tartományára vonatkozóan.

Erről az adatkészletről további információt a GitHub-adattár projektben talál.

Megjegyzés

A Microsoft "adott módon" biztosítja az Azure Open Datasets szolgáltatást. A Microsoft nem vállal kifejezett vagy vélelmezett garanciát vagy feltételeket az adathalmazok Ön általi használatára vonatkozóan. A helyi jogszabályok által megengedett mértékben a Microsoft kizár minden felelősséget az adathalmazok Ön általi használatából eredő károkért vagy veszteségekért, beleértve a közvetlen, következményi, különleges, közvetett, incidenses vagy büntető jellegű károkat is.

Az adatkészletet a Microsoft forrásadataihoz tartozó eredeti feltételek szerint szolgáltatjuk. A készlet tartalmazhat Microsofttól származó adatokat.

Adathalmazok

Az adathalmaz módosított verziói CSV-, JSON-, JSON-Lines és Parquet-fájlokként is elérhetők.

Minden módosított verzióban fel van tüntetve az ISO 3166-os alcsoportkód és a betöltési idő, és kisbetűs oszlopneveket használnak, elválasztóként pedig aláhúzás karaktert.

Nyers adatok: 'https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/covid_tracking/latest/daily.json'

A módosított és nyers adatok előző verziói: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/

https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/covid_tracking/

Adatmennyiség

Minden adatkészlet naponta frissül. 2020. május 13-án 4100 sort tartalmaztak (CSV 574 MB, JSON 1,8 MB, JSONL 1,8 MB, Parquet 334 kB).

Adatforrás

Ezeket az adatokat eredetileg az Atlantic COVID Tracking projektje részeként tették közzé. A nyers adatok a COVID Tracking GitHub-adattárból vannak betöltve a states_daily_4p_et.csv fájl használatával. Erről az adatkészletről, beleértve a COVID Tracking Project API-ból származó eredetét is, tekintse meg a GitHub-adattár projektben.

Adatminőség

A COVID Tracking Project az egyes állapotok adatminőségét osztályozja, és további információkat nyújt az adatok minőségének értékeléséről. További információ: COVID Tracking Project data (Covid Tracking Project-adatok) oldal. A GitHub-adattárban található adatok az API-hoz képest egy órás késéssel jelenhetnek meg, ezért a legfrissebb adatokhoz az API-t szükséges használni.

Licencelési és használati jogosultságok hozzárendelése

Az adatok licencelése az Apache License 2.0 feltételei szerint történik.

Az adatok felhasználásának meg kell őriznie az összes szerzői jogi, szabadalmi, védjegy- és hozzárendelési közleményt.

Kapcsolattartó

A COVID-19 Data Lake-ben ezzel vagy más adatkészletekkel kapcsolatos kérdéseivel vagy visszajelzéseivel kapcsolatban lépjen kapcsolatba a következővel askcovid19dl@microsoft.com: .

Oszlopok

Name Adattípus Egyedi Értékek (minta) Description
dátum dátum 420 2020-11-10 2021-01-30 Az a dátum, amelyre a napi összegek össze lettek gyűjtve.
date_checked sztring 9,487 2020-12-01T00:00:00Z 2020-09-01T00:00:00Z Elavult
Halál smallint 7,327 2 5 A COVID-19 következtében eddig elhunyt személyek teljes száma.
death_increase smallint 429 1 2 Elavult
Fips smallint 56 26 55 Az állam népszámlálási FIPS kódja.
fips_code sztring 60 53 25 Az állam népszámlálási FIPS kódja.
hash sztring 20,780 63df8cccd23a5476bab2d8111b138e4c9becd35e c606cd6990f16086b5382e12d84f6206172d493d Ennek a rekordnak a kivonata
Kórházba int 7,641 89995 4 Elavult
hospitalized_cumulative int 7,641 89995 4 A COVID-19 következtében eddig kórházba került személyek teljes száma, beleértve az azóta felgyógyultakat és elhunytakat is.
hospitalized_currently smallint 3,886 8 13 Az ezen a napon COVID-19 miatt kórházban lévő személyek száma.
hospitalized_increase smallint 615 1 2 Elavult
in_icu_cumulative smallint 2,295 990 220 A COVID-19 következtében eddig intenzív osztályra került személyek teljes száma, beleértve az azóta felgyógyultakat és elhunytakat is.
in_icu_currently smallint 1,643 2 8 Az ezen a napon COVID-19 miatt intenzív osztályon ápolt személyek teljes száma.
iso_country sztring 1 USA ISO 3166 ország vagy régió kódja
iso_subdivision sztring 57 US-UM US-WA ISO 3166-alosztály kódja
last_update_et időbélyeg 9,487 2020-12-01 00:00:00 2020-09-01 00:00:00 A napi adatok legutóbbi frissítésének időpontja
load_time időbélyeg 1 2021-04-26 00:06:49.883000 A dátum és idő, amikor az adatok be lettek töltve az Azure-ba a forrásból
negatív int 10,864 305972 2140 Azoknak a személyeknek a teljes száma, akiken eddig negatív COVID-19-tesztet végeztek.
negative_increase int 7,328 6 17 Elavult
on_ventilator_cumulative smallint 677 411 412 A COVID-19 következtében eddig lélegeztetőgépre került személyek teljes száma, beleértve az azóta felgyógyultakat és elhunytakat is.
on_ventilator_currently smallint 837 4 10 A COVID-19 következtében a mai napon lélegeztetőgépen lévő személyek száma.
függőben smallint 944 2 17 A még meghatározandó eredményű tesztek száma.
pos_neg int 18,282 2140 2 Elavult
pozitív int 16,837 2 1 Azoknak a személyeknek a teljes száma, akiken eddig pozitív COVID-19-tesztet végeztek.
positive_increase smallint 4,754 1 2 Elavult
Vissza int 8,286 29 19 A COVID-19-ből eddig felépült személyek teljes száma.
állapot sztring 56 MI PA Az állam kétbetűs kódja.
összesen int 18,283 2140 2 Elavult
total_test_results int 18,648 2140 3 Az állam által megadott összes teszteredmény
total_test_results_increase int 13,463 1 2 Elavult

Előnézet

dátum állapot pozitív hospitalized_currently hospitalized_cumulative on_ventilator_currently data_quality_grade last_update_et hash date_checked Halál Kórházba összesen total_test_results pos_neg Fips death_increase hospitalized_increase negative_increase positive_increase total_test_results_increase fips_code iso_subdivision load_time iso_country negatív in_icu_cumulative on_ventilator_cumulative Vissza in_icu_currently
2021-03-07 AK 56886 33 1293 2 null 2021.03.05. 03:59:00 dc4bccd4bb885349d7e94d6fed058e285d4be164 2021.03.05. 03:59:00 305 1293 56886 1731628 56886 2 0 0 0 0 0 2 US-AK 2021. 04. 26. 12:06:49 USA
2021-03-07 AL 499819 494 45976 null 2021.03.07. 11:00:00 997207b430824ea40b8eb8506c19a93e07bc972e 2021.03.07. 11:00:00 10148 45976 2431530 2323788 2431530 1 -1 0 2087 408 2347 1 US-AL 2021. 04. 26. 12:06:49 USA 1931711 2676 1515 295690
2021-03-07 AR 324818 335 14926 65 null 2021. 03. 07. 12:00:00 50921aeefba3e30d31623aa495b47fb2ecc72fae 2021. 03. 07. 12:00:00 5319 14926 2805534 2736442 2805534 5 22 11 3267 165 3380 5 US-AR 2021. 04. 26. 12:06:49 USA 2480716 1533 315517 141
2021-03-07 AS 0 null 2020. 12. 01. 12:00:00 96d23f888c995b9a7f3b4b864de6414f45c728ff 2020. 12. 01. 12:00:00 0 2140 2140 2140 60 0 0 0 0 0 60 US-AS 2021. 04. 26. 12:06:49 USA 2140
2021-03-07 AZ 826454 963 57907 143 null 2021. 03. 07. 12:00:00 0437a7a96f4471666f775e63e86923eb5cbd8cdf 2021. 03. 07. 12:00:00 16328 57907 3899464 7908105 3899464 4 5 44 13678 1335 45110 4 US-AZ 2021. 04. 26. 12:06:49 USA 3073010 273
2021-03-07 CA 3501394 4291 null 2021. 03. 07. 02:59:00 63c5c0fd2daef2fb65150e9db486de98ed3f7b72 2021. 03. 07. 02:59:00 3501394 49646014 3501394 6 258 0 0 3816 133186 6 US-CA 2021. 04. 26. 12:06:49 USA 1159
2021-03-07 CO 436602 326 23904 null 2021.03.07. 1:59:00 444746cda3a596f183f3fa3269c8cab68704e819 2021.03.07. 1:59:00 5989 23904 2636060 6415123 2636060 8 3 18 0 840 38163 8 US-CO 2021. 04. 26. 12:06:49 USA 2199458
2021-03-07 CT 285330 428 12257 null 2021.03.04. 11:59:00 bcc0f7bc8c2bf77eec31b25f8b59d510f679d3e7 2021.03.04. 11:59:00 7704 12257 285330 6520366 285330 9 0 0 0 0 0 9 USA-CT 2021. 04. 26. 12:06:49 USA
2021-03-07 DC 41419 150 16 null 2021.03.06. 12:00:00 a3aa0d623d538807fb9577ad64354f48cf728cc8 2021.03.06. 12:00:00 1030 41419 1261363 41419 11 0 0 0 146 5726 11 USA-DC 2021. 04. 26. 12:06:49 USA 29570 38
2021-03-07 DE 88354 104 null 2021.03.06. 18:00:00 059d870e689d5cc19c35f5eb398214d7d9856373 2021.03.06. 18:00:00 1473 633424 1431942 633424 10 9 0 917 215 5867 10 US-DE 2021. 04. 26. 12:06:49 USA 545070 13

Az adatok elérése

Azure Notebooks

A Azure Blob Storage üzemeltetett különböző adathalmaz-fájlformátumok URL-címei:

CSV: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.csv

JSON: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.json

JSONL: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.jsonl

Parketta: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.parquet

Töltse le az adathalmazfájlt a Pandasban található HTTP URL-címről letölthető beépített funkcióval. A Pandas számos fájlformátumhoz rendelkezik olvasóval:

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_parquet.html

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html

import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt

df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.parquet ")
df.head(10)

df.dtypes

df.groupby('state').first().filter(['date','positive', 'death'])

df.groupby(df.state).agg({'state': 'count','positive_increase': 'sum','death_increase': 'sum'})

df_NY=df[df['state'] == 'NY']
df_NY.plot(kind='line',x='date',y="positive",grid=True)
df_NY.plot(kind='line',x='date',y="positive_increase",grid=True)
df_NY.plot(kind='line',x='date',y="death",grid=True)
df_NY.plot(kind='line',x='date',y="death_increase",grid=True)

df_US=df.groupby(df.date).agg({'positive': 'sum','positive_increase': 'sum','death':'sum','death_increase': 'sum'}).reset_index()

df_US.plot(kind='line',x='date',y="positive",grid=True)
df_US.plot(kind='line',x='date',y="positive_increase",grid=True)
df_US.plot(kind='line',x='date',y="death",grid=True)
df_US.plot(kind='line',x='date',y="death_increase",grid=True)



Azure Databricks

A minta nem érhető el ehhez a platformhoz/csomagkombinációhoz.

Azure Synapse

A minta nem érhető el ehhez a platformhoz/csomagkombinációhoz.

Következő lépések

Tekintse meg a többi adathalmazt az Open Datasets katalógusban.