Projekt COVID Tracking

Datová sada projektu COVID Tracking poskytuje nejnovější údaje ohledně testů, potvrzených případů, hospitalizací a výsledky léčby pacientů ze všech států a teritorií USA.

Další informace o této datové sadě najdete v úložišti projektu GitHub.

Poznámka

Microsoft poskytuje otevřené datové sady Azure na základě "tak, jak jsou". Společnost Microsoft neposkytuje žádné záruky, výslovné ani předpokládané, záruky ani podmínky týkající se vašeho používání datových sad. V rozsahu povoleném vašimi místními zákony se společnost Microsoft zříká veškeré odpovědnosti za případné škody nebo ztráty, včetně přímých, následných, zvláštních, nepřímých, náhodných nebo trestních, vyplývajících z vašeho používání datových sad.

Na tuto datovou sadu se vztahují původní podmínky, které Microsoft přijal se zdrojovými daty. Datová sada může obsahovat data pocházející z Microsoftu.

Datové sady

Upravené verze této datové sady jsou k dispozici ve formátech CSV, JSON, JSON-Lines a Parquet.

Do všech upravených verzí byly přidány kódy území podle ISO 3166 a časy načtení. Pro názvy sloupců jsou použita malá písmena s podtržítky jako oddělovači.

Nezpracovaná data: 'https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/covid_tracking/latest/daily.json'

Předchozí verze upravených a nezpracovaných dat: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/

https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/covid_tracking/

Objem dat

Všechny datové sady se denně aktualizují. K 13. květnu 2020 obsahovaly 4 100 řádků (CSV 574 kB, JSON 1,8 MB, JSONL 1,8 MB, Parquet 334 kB).

Zdroj dat

Tato data byla původně publikována projektem COVID Tracking na webu The Atlantic. Nezpracovaná data se ingestují z úložiště COVID Tracking GitHub pomocí souborustates_daily_4p_et.csv. Další informace o této datové sadě, včetně jejího původu z rozhraní API projektu COVID Tracking, najdete v úložišti projektu GitHub.

Kvalita dat

Projekt COVID Tracking hodnotí kvalitu dat pro každý stát a poskytuje další informace o jejich hodnocení kvality dat. Další informace najdete na stránce s daty projektu COVID Tracking. Data v úložišti GitHub mohou být za rozhraním API o hodinu zpožděná. Abyste měli přístup k nejnovějším datům, je třeba používat rozhraní API.

Přiřazení licenčních a užívových práv

Tato data jsou licencována podle podmínek a ujednání apache License 2.0.

Při každém použití těchto dat musí být zachována veškerá oznámení o autorských právech, patentech, ochranných známkách a přiřazení.

Kontakt

V případě jakýchkoli dotazů nebo zpětné vazby k této nebo jiným datovým sadám v datovém jezeře COVID-19 kontaktujte askcovid19dl@microsoft.com.

Sloupce

Name Datový typ Jedinečná Hodnoty (ukázka) Popis
date date 420 2020-11-10 2021-01-30 Datum, ze kterého pochází shromážděné denní souhrny
date_checked řetězec 9,487 2020-12-01T00:00:00Z 2020-09-01T00:00:00Z Zastaralé
Smrti smallint 7,327 2 5 Celkový počet lidí, kteří zatím zemřeli v důsledku COVID-19
death_increase smallint 429 1 2 Zastaralé
Fips smallint 56 26 55 Kód FIPS sčítání lidu daného státu
fips_code řetězec 60 53 25 Kód FIPS sčítání lidu daného státu
hash řetězec 20,780 63df8cccd23a5476bab2d811b138e4c9becd35e c606cd6990f16086b5382e12d84f6206172d493d Hodnota hash tohoto záznamu
Hospitalizován int 7,641 89995 4 Zastaralé
hospitalized_cumulative int 7,641 89995 4 Celkový počet lidí, kteří zatím kvůli COVID-19 byli hospitalizováni, včetně těch, kteří se již uzdravili nebo kteří zemřeli
hospitalized_currently smallint 3,886 8 13 Celkový počet lidí, kteří jsou k dnešnímu dni kvůli COVID-19 hospitalizováni
hospitalized_increase smallint 615 1 2 Zastaralé
in_icu_cumulative smallint 2,295 990 220 Celkový počet lidí, kteří zatím kvůli COVID-19 byli hospitalizováni na jednotce intenzivní péče, včetně těch, kteří se již uzdravili nebo kteří zemřeli
in_icu_currently smallint 1,643 2 8 Celkový počet lidí, kteří jsou k dnešnímu dni kvůli COVID-19 na jednotce intenzivní péče
iso_country řetězec 1 USA Kód ISO 3166 země nebo oblasti
iso_subdivision řetězec 57 US-UM US-WA Kód ISO 3166 nižší územní jednotky
last_update_et časové razítko 9,487 2020-12-01 00:00:00 2020-09-01 00:00:00 Čas poslední aktualizace dat dne
load_time časové razítko 1 2021-04-26 00:06:49.883000 Datum a čas načtení dat ze zdroje do Azure
negativní int 10,864 305972 2140 Celkový počet lidí, kteří zatím mají negativní výsledek testu na COVID-19
negative_increase int 7,328 6 17 Zastaralé
on_ventilator_cumulative smallint 677 411 412 Celkový počet lidí, kteří zatím kvůli COVID-19 museli být napojeni na ventilátor, včetně těch, kteří se již uzdravili nebo kteří zemřeli
on_ventilator_currently smallint 837 4 10 Počet lidí, kteří jsou k dnešnímu dni kvůli COVID-19 napojeni na ventilátor
pending smallint 944 2 17 Počet testů s ještě neurčeným výsledkem
pos_neg int 18,282 2140 2 Zastaralé
pozitivní int 16,837 2 1 Celkový počet lidí, kteří zatím mají pozitivní výsledek testu na COVID-19
positive_increase smallint 4,754 1 2 Zastaralé
Obnovit int 8,286 29 19 Celkový počet lidí, kteří se zatím uzdravili z COVID-19
state řetězec 56 MI PA Dvoumístný kód státu
celkem int 18,283 2140 2 Zastaralé
total_test_results int 18,648 2140 3 Celkový počet státem poskytnutých výsledků testů
total_test_results_increase int 13,463 1 2 Zastaralé

Preview

date state pozitivní hospitalized_currently hospitalized_cumulative on_ventilator_currently data_quality_grade last_update_et hash date_checked Smrti Hospitalizován celkem total_test_results pos_neg Fips death_increase hospitalized_increase negative_increase positive_increase total_test_results_increase fips_code iso_subdivision load_time iso_country negativní in_icu_cumulative on_ventilator_cumulative Obnovit in_icu_currently
2021-03-07 AK 56886 33 1293 2 null 5. 3. 2021 3:59:00 dc4bccd4bb885349d7e94d6fed058e285d4be164 5. 3. 2021 3:59:00 305 1293 56886 1731628 56886 2 0 0 0 0 0 2 US-AK 26.4.2021 0:06:49 USA
2021-03-07 AL 499819 494 45976 null 7. 3. 2021 11:00:00 997207b430824ea40b8eb8506c19a93e07bc972e 7. 3. 2021 11:00:00 10148 45976 2431530 2323788 2431530 1 -1 0 2087 408 2347 1 US-AL 26.4.2021 0:06:49 USA 1931711 2676 1515 295690
2021-03-07 AR 324818 335 14926 65 null 7. 3. 2021 0:00:00 50921aeefba3e30d31623aa495b47fb2ecc72fae 7. 3. 2021 0:00:00 5319 14926 2805534 2736442 2805534 5 22 11 3267 165 3380 5 US-AR 26.4.2021 0:06:49 USA 2480716 1533 315517 141
2021-03-07 AS 0 null 1.12.2020 0:00:00 96d23f888c995b9a7f3b4b864de6414f45c728ff 1.12.2020 0:00:00 0 2140 2140 2140 60 0 0 0 0 0 60 US-AS 26.4.2021 0:06:49 USA 2140
2021-03-07 AZ 826454 963 57907 143 null 7.3.2021 0:00:00 0437a7a96f4471666f775e63e86923eb5cbd8cdf 7.3.2021 0:00:00 16328 57907 3899464 7908105 3899464 4 5 44 13678 1335 45110 4 US-AZ 26.4.2021 0:06:49 USA 3073010 273
2021-03-07 CA 3501394 4291 null 7.3.2021 2:59:00 63c5c0fd2daef2fb65150e9db486de98ed3f7b72 7.3.2021 2:59:00 3501394 49646014 3501394 6 258 0 0 3816 133186 6 US-CA 26.4.2021 0:06:49 USA 1159
2021-03-07 CO 436602 326 23904 null 7.3.2021 1:59:00 444746cda3a596f183f3fa3269c8cab68704e819 7.3.2021 1:59:00 5989 23904 2636060 6415123 2636060 8 3 18 0 840 38163 8 US-CO 26.4.2021 0:06:49 USA 2199458
2021-03-07 CT 285330 428 12257 null 4.3.2021 23:59:00 bcc0f7bc8c2bf77eec31b25f8b59d510f679d3e7 4.3.2021 23:59:00 7704 12257 285330 6520366 285330 9 0 0 0 0 0 9 US-CT 26.4.2021 0:06:49 USA
2021-03-07 DC 41419 150 16 null 6. 3. 2021 0:00:00 a3aa0d623d538807fb9577ad64354f48cf728cc8 6. 3. 2021 0:00:00 1030 41419 1261363 41419 11 0 0 0 146 5726 11 US-DC 26.4.2021 0:06:49 USA 29570 38
2021-03-07 DE 88354 104 null 6. 3. 2021 18:00:00 059d870e689d5cc19c35f5eb398214d7d9856373 6. 3. 2021 18:00:00 1473 633424 1431942 633424 10 9 0 917 215 5867 10 US-DE 26.4.2021 0:06:49 USA 545070 13

Přístup k datům

Azure Notebooks

Adresy URL různých formátů souborů datových sad hostovaných na Azure Blob Storage:

CSV: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.csv

JSON: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.json

JSONL: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.jsonl

Parketové: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.parquet

Stáhněte si soubor datové sady pomocí integrované funkce stahování z adresy URL http v Pandasu. Pandas má čtečky pro různé formáty souborů:

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_parquet.html

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html

import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt

df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.parquet ")
df.head(10)

df.dtypes

df.groupby('state').first().filter(['date','positive', 'death'])

df.groupby(df.state).agg({'state': 'count','positive_increase': 'sum','death_increase': 'sum'})

df_NY=df[df['state'] == 'NY']
df_NY.plot(kind='line',x='date',y="positive",grid=True)
df_NY.plot(kind='line',x='date',y="positive_increase",grid=True)
df_NY.plot(kind='line',x='date',y="death",grid=True)
df_NY.plot(kind='line',x='date',y="death_increase",grid=True)

df_US=df.groupby(df.date).agg({'positive': 'sum','positive_increase': 'sum','death':'sum','death_increase': 'sum'}).reset_index()

df_US.plot(kind='line',x='date',y="positive",grid=True)
df_US.plot(kind='line',x='date',y="positive_increase",grid=True)
df_US.plot(kind='line',x='date',y="death",grid=True)
df_US.plot(kind='line',x='date',y="death_increase",grid=True)



Azure Databricks

Ukázka není pro tuto kombinaci platformy a balíčku k dispozici.

Azure Synapse

Ukázka není pro tuto kombinaci platformy a balíčku k dispozici.

Další kroky

Zobrazte zbývající datové sady v katalogu Open Datasets.