Projekt COVID Tracking
Datová sada projektu COVID Tracking poskytuje nejnovější údaje ohledně testů, potvrzených případů, hospitalizací a výsledky léčby pacientů ze všech států a teritorií USA.
Další informace o této datové sadě najdete v úložišti projektu GitHub.
Poznámka
Microsoft poskytuje otevřené datové sady Azure na základě "tak, jak jsou". Společnost Microsoft neposkytuje žádné záruky, výslovné ani předpokládané, záruky ani podmínky týkající se vašeho používání datových sad. V rozsahu povoleném vašimi místními zákony se společnost Microsoft zříká veškeré odpovědnosti za případné škody nebo ztráty, včetně přímých, následných, zvláštních, nepřímých, náhodných nebo trestních, vyplývajících z vašeho používání datových sad.
Na tuto datovou sadu se vztahují původní podmínky, které Microsoft přijal se zdrojovými daty. Datová sada může obsahovat data pocházející z Microsoftu.
Datové sady
Upravené verze této datové sady jsou k dispozici ve formátech CSV, JSON, JSON-Lines a Parquet.
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.csv
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.json
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.jsonl
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.parquet
Do všech upravených verzí byly přidány kódy území podle ISO 3166 a časy načtení. Pro názvy sloupců jsou použita malá písmena s podtržítky jako oddělovači.
Nezpracovaná data: 'https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/covid_tracking/latest/daily.json'
Předchozí verze upravených a nezpracovaných dat: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/
https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/covid_tracking/
Objem dat
Všechny datové sady se denně aktualizují. K 13. květnu 2020 obsahovaly 4 100 řádků (CSV 574 kB, JSON 1,8 MB, JSONL 1,8 MB, Parquet 334 kB).
Zdroj dat
Tato data byla původně publikována projektem COVID Tracking na webu The Atlantic. Nezpracovaná data se ingestují z úložiště COVID Tracking GitHub pomocí souborustates_daily_4p_et.csv. Další informace o této datové sadě, včetně jejího původu z rozhraní API projektu COVID Tracking, najdete v úložišti projektu GitHub.
Kvalita dat
Projekt COVID Tracking hodnotí kvalitu dat pro každý stát a poskytuje další informace o jejich hodnocení kvality dat. Další informace najdete na stránce s daty projektu COVID Tracking. Data v úložišti GitHub mohou být za rozhraním API o hodinu zpožděná. Abyste měli přístup k nejnovějším datům, je třeba používat rozhraní API.
Přiřazení licenčních a užívových práv
Tato data jsou licencována podle podmínek a ujednání apache License 2.0.
Při každém použití těchto dat musí být zachována veškerá oznámení o autorských právech, patentech, ochranných známkách a přiřazení.
Kontakt
V případě jakýchkoli dotazů nebo zpětné vazby k této nebo jiným datovým sadám v datovém jezeře COVID-19 kontaktujte askcovid19dl@microsoft.com.
Sloupce
Name | Datový typ | Jedinečná | Hodnoty (ukázka) | Popis |
---|---|---|---|---|
date | date | 420 | 2020-11-10 2021-01-30 | Datum, ze kterého pochází shromážděné denní souhrny |
date_checked | řetězec | 9,487 | 2020-12-01T00:00:00Z 2020-09-01T00:00:00Z | Zastaralé |
Smrti | smallint | 7,327 | 2 5 | Celkový počet lidí, kteří zatím zemřeli v důsledku COVID-19 |
death_increase | smallint | 429 | 1 2 | Zastaralé |
Fips | smallint | 56 | 26 55 | Kód FIPS sčítání lidu daného státu |
fips_code | řetězec | 60 | 53 25 | Kód FIPS sčítání lidu daného státu |
hash | řetězec | 20,780 | 63df8cccd23a5476bab2d811b138e4c9becd35e c606cd6990f16086b5382e12d84f6206172d493d | Hodnota hash tohoto záznamu |
Hospitalizován | int | 7,641 | 89995 4 | Zastaralé |
hospitalized_cumulative | int | 7,641 | 89995 4 | Celkový počet lidí, kteří zatím kvůli COVID-19 byli hospitalizováni, včetně těch, kteří se již uzdravili nebo kteří zemřeli |
hospitalized_currently | smallint | 3,886 | 8 13 | Celkový počet lidí, kteří jsou k dnešnímu dni kvůli COVID-19 hospitalizováni |
hospitalized_increase | smallint | 615 | 1 2 | Zastaralé |
in_icu_cumulative | smallint | 2,295 | 990 220 | Celkový počet lidí, kteří zatím kvůli COVID-19 byli hospitalizováni na jednotce intenzivní péče, včetně těch, kteří se již uzdravili nebo kteří zemřeli |
in_icu_currently | smallint | 1,643 | 2 8 | Celkový počet lidí, kteří jsou k dnešnímu dni kvůli COVID-19 na jednotce intenzivní péče |
iso_country | řetězec | 1 | USA | Kód ISO 3166 země nebo oblasti |
iso_subdivision | řetězec | 57 | US-UM US-WA | Kód ISO 3166 nižší územní jednotky |
last_update_et | časové razítko | 9,487 | 2020-12-01 00:00:00 2020-09-01 00:00:00 | Čas poslední aktualizace dat dne |
load_time | časové razítko | 1 | 2021-04-26 00:06:49.883000 | Datum a čas načtení dat ze zdroje do Azure |
negativní | int | 10,864 | 305972 2140 | Celkový počet lidí, kteří zatím mají negativní výsledek testu na COVID-19 |
negative_increase | int | 7,328 | 6 17 | Zastaralé |
on_ventilator_cumulative | smallint | 677 | 411 412 | Celkový počet lidí, kteří zatím kvůli COVID-19 museli být napojeni na ventilátor, včetně těch, kteří se již uzdravili nebo kteří zemřeli |
on_ventilator_currently | smallint | 837 | 4 10 | Počet lidí, kteří jsou k dnešnímu dni kvůli COVID-19 napojeni na ventilátor |
pending | smallint | 944 | 2 17 | Počet testů s ještě neurčeným výsledkem |
pos_neg | int | 18,282 | 2140 2 | Zastaralé |
pozitivní | int | 16,837 | 2 1 | Celkový počet lidí, kteří zatím mají pozitivní výsledek testu na COVID-19 |
positive_increase | smallint | 4,754 | 1 2 | Zastaralé |
Obnovit | int | 8,286 | 29 19 | Celkový počet lidí, kteří se zatím uzdravili z COVID-19 |
state | řetězec | 56 | MI PA | Dvoumístný kód státu |
celkem | int | 18,283 | 2140 2 | Zastaralé |
total_test_results | int | 18,648 | 2140 3 | Celkový počet státem poskytnutých výsledků testů |
total_test_results_increase | int | 13,463 | 1 2 | Zastaralé |
Preview
date | state | pozitivní | hospitalized_currently | hospitalized_cumulative | on_ventilator_currently | data_quality_grade | last_update_et | hash | date_checked | Smrti | Hospitalizován | celkem | total_test_results | pos_neg | Fips | death_increase | hospitalized_increase | negative_increase | positive_increase | total_test_results_increase | fips_code | iso_subdivision | load_time | iso_country | negativní | in_icu_cumulative | on_ventilator_cumulative | Obnovit | in_icu_currently |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
2021-03-07 | AK | 56886 | 33 | 1293 | 2 | null | 5. 3. 2021 3:59:00 | dc4bccd4bb885349d7e94d6fed058e285d4be164 | 5. 3. 2021 3:59:00 | 305 | 1293 | 56886 | 1731628 | 56886 | 2 | 0 | 0 | 0 | 0 | 0 | 2 | US-AK | 26.4.2021 0:06:49 | USA | |||||
2021-03-07 | AL | 499819 | 494 | 45976 | null | 7. 3. 2021 11:00:00 | 997207b430824ea40b8eb8506c19a93e07bc972e | 7. 3. 2021 11:00:00 | 10148 | 45976 | 2431530 | 2323788 | 2431530 | 1 | -1 | 0 | 2087 | 408 | 2347 | 1 | US-AL | 26.4.2021 0:06:49 | USA | 1931711 | 2676 | 1515 | 295690 | ||
2021-03-07 | AR | 324818 | 335 | 14926 | 65 | null | 7. 3. 2021 0:00:00 | 50921aeefba3e30d31623aa495b47fb2ecc72fae | 7. 3. 2021 0:00:00 | 5319 | 14926 | 2805534 | 2736442 | 2805534 | 5 | 22 | 11 | 3267 | 165 | 3380 | 5 | US-AR | 26.4.2021 0:06:49 | USA | 2480716 | 1533 | 315517 | 141 | |
2021-03-07 | AS | 0 | null | 1.12.2020 0:00:00 | 96d23f888c995b9a7f3b4b864de6414f45c728ff | 1.12.2020 0:00:00 | 0 | 2140 | 2140 | 2140 | 60 | 0 | 0 | 0 | 0 | 0 | 60 | US-AS | 26.4.2021 0:06:49 | USA | 2140 | ||||||||
2021-03-07 | AZ | 826454 | 963 | 57907 | 143 | null | 7.3.2021 0:00:00 | 0437a7a96f4471666f775e63e86923eb5cbd8cdf | 7.3.2021 0:00:00 | 16328 | 57907 | 3899464 | 7908105 | 3899464 | 4 | 5 | 44 | 13678 | 1335 | 45110 | 4 | US-AZ | 26.4.2021 0:06:49 | USA | 3073010 | 273 | |||
2021-03-07 | CA | 3501394 | 4291 | null | 7.3.2021 2:59:00 | 63c5c0fd2daef2fb65150e9db486de98ed3f7b72 | 7.3.2021 2:59:00 | 3501394 | 49646014 | 3501394 | 6 | 258 | 0 | 0 | 3816 | 133186 | 6 | US-CA | 26.4.2021 0:06:49 | USA | 1159 | ||||||||
2021-03-07 | CO | 436602 | 326 | 23904 | null | 7.3.2021 1:59:00 | 444746cda3a596f183f3fa3269c8cab68704e819 | 7.3.2021 1:59:00 | 5989 | 23904 | 2636060 | 6415123 | 2636060 | 8 | 3 | 18 | 0 | 840 | 38163 | 8 | US-CO | 26.4.2021 0:06:49 | USA | 2199458 | |||||
2021-03-07 | CT | 285330 | 428 | 12257 | null | 4.3.2021 23:59:00 | bcc0f7bc8c2bf77eec31b25f8b59d510f679d3e7 | 4.3.2021 23:59:00 | 7704 | 12257 | 285330 | 6520366 | 285330 | 9 | 0 | 0 | 0 | 0 | 0 | 9 | US-CT | 26.4.2021 0:06:49 | USA | ||||||
2021-03-07 | DC | 41419 | 150 | 16 | null | 6. 3. 2021 0:00:00 | a3aa0d623d538807fb9577ad64354f48cf728cc8 | 6. 3. 2021 0:00:00 | 1030 | 41419 | 1261363 | 41419 | 11 | 0 | 0 | 0 | 146 | 5726 | 11 | US-DC | 26.4.2021 0:06:49 | USA | 29570 | 38 | |||||
2021-03-07 | DE | 88354 | 104 | null | 6. 3. 2021 18:00:00 | 059d870e689d5cc19c35f5eb398214d7d9856373 | 6. 3. 2021 18:00:00 | 1473 | 633424 | 1431942 | 633424 | 10 | 9 | 0 | 917 | 215 | 5867 | 10 | US-DE | 26.4.2021 0:06:49 | USA | 545070 | 13 |
Přístup k datům
Azure Notebooks
Adresy URL různých formátů souborů datových sad hostovaných na Azure Blob Storage:
Stáhněte si soubor datové sady pomocí integrované funkce stahování z adresy URL http v Pandasu. Pandas má čtečky pro různé formáty souborů:
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_parquet.html
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html
import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt
df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.parquet ")
df.head(10)
df.dtypes
df.groupby('state').first().filter(['date','positive', 'death'])
df.groupby(df.state).agg({'state': 'count','positive_increase': 'sum','death_increase': 'sum'})
df_NY=df[df['state'] == 'NY']
df_NY.plot(kind='line',x='date',y="positive",grid=True)
df_NY.plot(kind='line',x='date',y="positive_increase",grid=True)
df_NY.plot(kind='line',x='date',y="death",grid=True)
df_NY.plot(kind='line',x='date',y="death_increase",grid=True)
df_US=df.groupby(df.date).agg({'positive': 'sum','positive_increase': 'sum','death':'sum','death_increase': 'sum'}).reset_index()
df_US.plot(kind='line',x='date',y="positive",grid=True)
df_US.plot(kind='line',x='date',y="positive_increase",grid=True)
df_US.plot(kind='line',x='date',y="death",grid=True)
df_US.plot(kind='line',x='date',y="death_increase",grid=True)
Azure Databricks
Ukázka není pro tuto kombinaci platformy a balíčku k dispozici.
Azure Synapse
Ukázka není pro tuto kombinaci platformy a balíčku k dispozici.
Další kroky
Zobrazte zbývající datové sady v katalogu Open Datasets.