COVID-nyomkövetési projekt
A COVID-követési projekt adatkészlete a tesztek, a megerősített esetek, a kórházi kezelések és a páciensek eredményeinek legutóbbi adatait tartalmazza az Egyesült Államok minden államára és tartományára vonatkozóan.
Erről az adatkészletről további információt a GitHub-adattár projektben talál.
Megjegyzés
A Microsoft "adott módon" biztosítja az Azure Open Datasets szolgáltatást. A Microsoft nem vállal kifejezett vagy vélelmezett garanciát vagy feltételeket az adathalmazok Ön általi használatára vonatkozóan. A helyi jogszabályok által megengedett mértékben a Microsoft kizár minden felelősséget az adathalmazok Ön általi használatából eredő károkért vagy veszteségekért, beleértve a közvetlen, következményi, különleges, közvetett, incidenses vagy büntető jellegű károkat is.
Az adatkészletet a Microsoft forrásadataihoz tartozó eredeti feltételek szerint szolgáltatjuk. A készlet tartalmazhat Microsofttól származó adatokat.
Adathalmazok
Az adathalmaz módosított verziói CSV-, JSON-, JSON-Lines és Parquet-fájlokként is elérhetők.
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.csv
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.json
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.jsonl
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.parquet
Minden módosított verzióban fel van tüntetve az ISO 3166-os alcsoportkód és a betöltési idő, és kisbetűs oszlopneveket használnak, elválasztóként pedig aláhúzás karaktert.
Nyers adatok: 'https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/covid_tracking/latest/daily.json'
A módosított és nyers adatok előző verziói: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/
https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/covid_tracking/
Adatmennyiség
Minden adatkészlet naponta frissül. 2020. május 13-án 4100 sort tartalmaztak (CSV 574 MB, JSON 1,8 MB, JSONL 1,8 MB, Parquet 334 kB).
Adatforrás
Ezeket az adatokat eredetileg az Atlantic COVID Tracking projektje részeként tették közzé. A nyers adatok a COVID Tracking GitHub-adattárból vannak betöltve a states_daily_4p_et.csv fájl használatával. Erről az adatkészletről, beleértve a COVID Tracking Project API-ból származó eredetét is, tekintse meg a GitHub-adattár projektben.
Adatminőség
A COVID Tracking Project az egyes állapotok adatminőségét osztályozja, és további információkat nyújt az adatok minőségének értékeléséről. További információ: COVID Tracking Project data (Covid Tracking Project-adatok) oldal. A GitHub-adattárban található adatok az API-hoz képest egy órás késéssel jelenhetnek meg, ezért a legfrissebb adatokhoz az API-t szükséges használni.
Licencelési és használati jogosultságok hozzárendelése
Az adatok licencelése az Apache License 2.0 feltételei szerint történik.
Az adatok felhasználásának meg kell őriznie az összes szerzői jogi, szabadalmi, védjegy- és hozzárendelési közleményt.
Kapcsolattartó
A COVID-19 Data Lake-ben ezzel vagy más adatkészletekkel kapcsolatos kérdéseivel vagy visszajelzéseivel kapcsolatban lépjen kapcsolatba a következővel askcovid19dl@microsoft.com: .
Oszlopok
Name | Adattípus | Egyedi | Értékek (minta) | Description |
---|---|---|---|---|
dátum | dátum | 420 | 2020-11-10 2021-01-30 | Az a dátum, amelyre a napi összegek össze lettek gyűjtve. |
date_checked | sztring | 9,487 | 2020-12-01T00:00:00Z 2020-09-01T00:00:00Z | Elavult |
Halál | smallint | 7,327 | 2 5 | A COVID-19 következtében eddig elhunyt személyek teljes száma. |
death_increase | smallint | 429 | 1 2 | Elavult |
Fips | smallint | 56 | 26 55 | Az állam népszámlálási FIPS kódja. |
fips_code | sztring | 60 | 53 25 | Az állam népszámlálási FIPS kódja. |
hash | sztring | 20,780 | 63df8cccd23a5476bab2d8111b138e4c9becd35e c606cd6990f16086b5382e12d84f6206172d493d | Ennek a rekordnak a kivonata |
Kórházba | int | 7,641 | 89995 4 | Elavult |
hospitalized_cumulative | int | 7,641 | 89995 4 | A COVID-19 következtében eddig kórházba került személyek teljes száma, beleértve az azóta felgyógyultakat és elhunytakat is. |
hospitalized_currently | smallint | 3,886 | 8 13 | Az ezen a napon COVID-19 miatt kórházban lévő személyek száma. |
hospitalized_increase | smallint | 615 | 1 2 | Elavult |
in_icu_cumulative | smallint | 2,295 | 990 220 | A COVID-19 következtében eddig intenzív osztályra került személyek teljes száma, beleértve az azóta felgyógyultakat és elhunytakat is. |
in_icu_currently | smallint | 1,643 | 2 8 | Az ezen a napon COVID-19 miatt intenzív osztályon ápolt személyek teljes száma. |
iso_country | sztring | 1 | USA | ISO 3166 ország vagy régió kódja |
iso_subdivision | sztring | 57 | US-UM US-WA | ISO 3166-alosztály kódja |
last_update_et | időbélyeg | 9,487 | 2020-12-01 00:00:00 2020-09-01 00:00:00 | A napi adatok legutóbbi frissítésének időpontja |
load_time | időbélyeg | 1 | 2021-04-26 00:06:49.883000 | A dátum és idő, amikor az adatok be lettek töltve az Azure-ba a forrásból |
negatív | int | 10,864 | 305972 2140 | Azoknak a személyeknek a teljes száma, akiken eddig negatív COVID-19-tesztet végeztek. |
negative_increase | int | 7,328 | 6 17 | Elavult |
on_ventilator_cumulative | smallint | 677 | 411 412 | A COVID-19 következtében eddig lélegeztetőgépre került személyek teljes száma, beleértve az azóta felgyógyultakat és elhunytakat is. |
on_ventilator_currently | smallint | 837 | 4 10 | A COVID-19 következtében a mai napon lélegeztetőgépen lévő személyek száma. |
függőben | smallint | 944 | 2 17 | A még meghatározandó eredményű tesztek száma. |
pos_neg | int | 18,282 | 2140 2 | Elavult |
pozitív | int | 16,837 | 2 1 | Azoknak a személyeknek a teljes száma, akiken eddig pozitív COVID-19-tesztet végeztek. |
positive_increase | smallint | 4,754 | 1 2 | Elavult |
Vissza | int | 8,286 | 29 19 | A COVID-19-ből eddig felépült személyek teljes száma. |
állapot | sztring | 56 | MI PA | Az állam kétbetűs kódja. |
összesen | int | 18,283 | 2140 2 | Elavult |
total_test_results | int | 18,648 | 2140 3 | Az állam által megadott összes teszteredmény |
total_test_results_increase | int | 13,463 | 1 2 | Elavult |
Előnézet
dátum | állapot | pozitív | hospitalized_currently | hospitalized_cumulative | on_ventilator_currently | data_quality_grade | last_update_et | hash | date_checked | Halál | Kórházba | összesen | total_test_results | pos_neg | Fips | death_increase | hospitalized_increase | negative_increase | positive_increase | total_test_results_increase | fips_code | iso_subdivision | load_time | iso_country | negatív | in_icu_cumulative | on_ventilator_cumulative | Vissza | in_icu_currently |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
2021-03-07 | AK | 56886 | 33 | 1293 | 2 | null | 2021.03.05. 03:59:00 | dc4bccd4bb885349d7e94d6fed058e285d4be164 | 2021.03.05. 03:59:00 | 305 | 1293 | 56886 | 1731628 | 56886 | 2 | 0 | 0 | 0 | 0 | 0 | 2 | US-AK | 2021. 04. 26. 12:06:49 | USA | |||||
2021-03-07 | AL | 499819 | 494 | 45976 | null | 2021.03.07. 11:00:00 | 997207b430824ea40b8eb8506c19a93e07bc972e | 2021.03.07. 11:00:00 | 10148 | 45976 | 2431530 | 2323788 | 2431530 | 1 | -1 | 0 | 2087 | 408 | 2347 | 1 | US-AL | 2021. 04. 26. 12:06:49 | USA | 1931711 | 2676 | 1515 | 295690 | ||
2021-03-07 | AR | 324818 | 335 | 14926 | 65 | null | 2021. 03. 07. 12:00:00 | 50921aeefba3e30d31623aa495b47fb2ecc72fae | 2021. 03. 07. 12:00:00 | 5319 | 14926 | 2805534 | 2736442 | 2805534 | 5 | 22 | 11 | 3267 | 165 | 3380 | 5 | US-AR | 2021. 04. 26. 12:06:49 | USA | 2480716 | 1533 | 315517 | 141 | |
2021-03-07 | AS | 0 | null | 2020. 12. 01. 12:00:00 | 96d23f888c995b9a7f3b4b864de6414f45c728ff | 2020. 12. 01. 12:00:00 | 0 | 2140 | 2140 | 2140 | 60 | 0 | 0 | 0 | 0 | 0 | 60 | US-AS | 2021. 04. 26. 12:06:49 | USA | 2140 | ||||||||
2021-03-07 | AZ | 826454 | 963 | 57907 | 143 | null | 2021. 03. 07. 12:00:00 | 0437a7a96f4471666f775e63e86923eb5cbd8cdf | 2021. 03. 07. 12:00:00 | 16328 | 57907 | 3899464 | 7908105 | 3899464 | 4 | 5 | 44 | 13678 | 1335 | 45110 | 4 | US-AZ | 2021. 04. 26. 12:06:49 | USA | 3073010 | 273 | |||
2021-03-07 | CA | 3501394 | 4291 | null | 2021. 03. 07. 02:59:00 | 63c5c0fd2daef2fb65150e9db486de98ed3f7b72 | 2021. 03. 07. 02:59:00 | 3501394 | 49646014 | 3501394 | 6 | 258 | 0 | 0 | 3816 | 133186 | 6 | US-CA | 2021. 04. 26. 12:06:49 | USA | 1159 | ||||||||
2021-03-07 | CO | 436602 | 326 | 23904 | null | 2021.03.07. 1:59:00 | 444746cda3a596f183f3fa3269c8cab68704e819 | 2021.03.07. 1:59:00 | 5989 | 23904 | 2636060 | 6415123 | 2636060 | 8 | 3 | 18 | 0 | 840 | 38163 | 8 | US-CO | 2021. 04. 26. 12:06:49 | USA | 2199458 | |||||
2021-03-07 | CT | 285330 | 428 | 12257 | null | 2021.03.04. 11:59:00 | bcc0f7bc8c2bf77eec31b25f8b59d510f679d3e7 | 2021.03.04. 11:59:00 | 7704 | 12257 | 285330 | 6520366 | 285330 | 9 | 0 | 0 | 0 | 0 | 0 | 9 | USA-CT | 2021. 04. 26. 12:06:49 | USA | ||||||
2021-03-07 | DC | 41419 | 150 | 16 | null | 2021.03.06. 12:00:00 | a3aa0d623d538807fb9577ad64354f48cf728cc8 | 2021.03.06. 12:00:00 | 1030 | 41419 | 1261363 | 41419 | 11 | 0 | 0 | 0 | 146 | 5726 | 11 | USA-DC | 2021. 04. 26. 12:06:49 | USA | 29570 | 38 | |||||
2021-03-07 | DE | 88354 | 104 | null | 2021.03.06. 18:00:00 | 059d870e689d5cc19c35f5eb398214d7d9856373 | 2021.03.06. 18:00:00 | 1473 | 633424 | 1431942 | 633424 | 10 | 9 | 0 | 917 | 215 | 5867 | 10 | US-DE | 2021. 04. 26. 12:06:49 | USA | 545070 | 13 |
Az adatok elérése
Azure Notebooks
A Azure Blob Storage üzemeltetett különböző adathalmaz-fájlformátumok URL-címei:
Töltse le az adathalmazfájlt a Pandasban található HTTP URL-címről letölthető beépített funkcióval. A Pandas számos fájlformátumhoz rendelkezik olvasóval:
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_parquet.html
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html
import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt
df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.parquet ")
df.head(10)
df.dtypes
df.groupby('state').first().filter(['date','positive', 'death'])
df.groupby(df.state).agg({'state': 'count','positive_increase': 'sum','death_increase': 'sum'})
df_NY=df[df['state'] == 'NY']
df_NY.plot(kind='line',x='date',y="positive",grid=True)
df_NY.plot(kind='line',x='date',y="positive_increase",grid=True)
df_NY.plot(kind='line',x='date',y="death",grid=True)
df_NY.plot(kind='line',x='date',y="death_increase",grid=True)
df_US=df.groupby(df.date).agg({'positive': 'sum','positive_increase': 'sum','death':'sum','death_increase': 'sum'}).reset_index()
df_US.plot(kind='line',x='date',y="positive",grid=True)
df_US.plot(kind='line',x='date',y="positive_increase",grid=True)
df_US.plot(kind='line',x='date',y="death",grid=True)
df_US.plot(kind='line',x='date',y="death_increase",grid=True)
Azure Databricks
A minta nem érhető el ehhez a platformhoz/csomagkombinációhoz.
Azure Synapse
A minta nem érhető el ehhez a platformhoz/csomagkombinációhoz.
Következő lépések
Tekintse meg a többi adathalmazt az Open Datasets katalógusban.