Delen via


COVID-traceringsproject

De COVID Tracking Project-gegevensset levert de laatste aantallen tests, bevestigde gevallen, ziekenhuisopnamen en patiƫntresultaten van alle Amerikaanse staten en territoriums.

Zie de GitHub-opslagplaats van het project voor meer informatie over deze gegevensset.

Notitie

Microsoft biedt Azure Open Datasets op basis van 'zoals is'. Microsoft geeft geen garanties, uitdrukkelijk of impliciet, garanties of voorwaarden met betrekking tot uw gebruik van de gegevenssets. Voor zover toegestaan volgens uw lokale wetgeving, wijst Microsoft alle aansprakelijkheid af voor eventuele schade of verliezen, waaronder directe, gevolgschade, speciale, indirecte, incidentele of strafbare gegevenssets, die het gevolg zijn van uw gebruik van de gegevenssets.

Deze gegevensset wordt geleverd onder de oorspronkelijke voorwaarden dat Microsoft de brongegevens heeft ontvangen. De gegevensset kan gegevens bevatten die afkomstig zijn van Microsoft.

Gegevenssets

Gewijzigde versies van de gegevensset zijn beschikbaar als CSV, JSON, JSON-Lines en Parquet.

Aan alle gewijzigde versies zijn ISO 3166-onderverdelingscodes en laadtijden toegevoegd. Ook worden voor de gegevenssets kolomnamen in kleine letters gescheiden door onderstrepingstekens gebruikt.

Onbewerkte gegevens: 'https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/covid_tracking/latest/daily.json'

Vorige versies van gewijzigde en onbewerkte gegevens: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/

https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/covid_tracking/

Gegevensvolume

Alle gegevenssets worden dagelijks bijgewerkt. Vanaf 13 mei 2020 bevatten de gegevenssets 4100 rijen (CSV 574 kB, JSON 1,8 MB, JSONL 1,8 MB, Parquet 334 kB).

Gegevensbron

Deze gegevens zijn oorspronkelijk gepubliceerd door het COVID Tracking Project at the Atlantic. Onbewerkte gegevens worden opgenomen uit de GitHub-opslagplaats voor COVID Tracking met behulp van het states_daily_4p_et.csv-bestand. Zie de GitHub-opslagplaats van het project voor meer informatie over deze gegevensset, inclusief de oorsprong van de COVID Tracking Project-API.

Gegevenskwaliteit

COVID Tracking Project beoordeelt de gegevenskwaliteit voor elke status en biedt meer informatie over hun beoordeling van de kwaliteit van de gegevens. Zie de gegevenspagina van het COVID Tracking Project voor meer informatie. Gegevens in de GitHub-opslagplaats kunnen een uur achterlopen op de API; gebruik van de API is nodig om toegang te krijgen tot de meest recente gegevens.

Licentie- en gebruiksrechten toewijzen

Deze gegevens worden gelicentieerd onder de voorwaarden van de Apache License 2.0.

Elk gebruik van de gegevens moet alle copyright-, patent-, handelsmerk- en toeschrijvingsaanduidingen behouden.

Contactpersoon

Neem voor vragen of feedback over deze of andere gegevenssets in covid-19 Data Lake contact op askcovid19dl@microsoft.com.

Kolommen

Naam Gegevenstype Uniek Waarden (voorbeeld) Beschrijving
datum datum 420 2020-11-10 2021-01-30 Datum waarvoor de dagtotalen zijn verzameld.
date_checked tekenreeks 9,487 2020-12-01T00:00:00Z 2020-09-01T00:00:00Z Afgeschaft
dood smallint 7,327 2 5 Totaalaantal personen dat tot dusverre aan COVID-19 is overleden.
death_increase smallint 429 1 2 Afgeschaft
Fips smallint 56 26 55 FIPS-code volkstelling voor de staat.
fips_code tekenreeks 60 53 25 FIPS-code volkstelling voor de staat.
hekje tekenreeks 20,780 63df8cccd23a5476bab2d811b138e4c9becd35e c606cd6990f16086b5382e12d84f6206172d493d Een hash voor deze record
Ziekenhuis int 7,641 89995 4 Afgeschaft
hospitalized_cumulative int 7,641 89995 4 Totaalaantal personen dat tot dusverre in het ziekenhuis werd opgenomen in verband met COVID-19, inclusief personen die sindsdien zijn hersteld of overleden.
hospitalized_currently smallint 3,886 8 13 Aantal personen in een ziekenhuis voor COVID-19 op deze dag.
hospitalized_increase smallint 615 1 2 Afgeschaft
in_icu_cumulative smallint 2,295 990 220 Totaalaantal personen dat tot dusverre op de intensivecareafdeling werd opgenomen in verband met COVID-19, inclusief personen die sindsdien zijn hersteld of overleden.
in_icu_currently smallint 1,643 2 8 Totaalaantal personen op een IC-afdeling voor COVID-19 op deze dag.
iso_country tekenreeks 1 VS ISO 3166-land- of regiocode
iso_subdivision tekenreeks 57 US-UM US-WA ISO 3166-onderverdelingscode
last_update_et timestamp 9,487 2020-12-01 00:00:00 2020-09-01 00:00:00 De laatste keer dat de gegevens van de dag zijn bijgewerkt
load_time timestamp 1 2021-04-26 00:06:49.883000 Datum en tijd waarop de gegevens vanuit de bron in Azure zijn geladen
negatief int 10,864 305972 2140 Totaalaantal personen dat tot dusverre negatief is getest op COVID-19.
negative_increase int 7,328 6 17 Afgeschaft
on_ventilator_cumulative smallint 677 411 412 Totaalaantal personen dat tot dusverre in verband met COVID-19 aan een beademingsapparaat heeft gelegen, inclusief personen die zijn hersteld of overleden.
on_ventilator_currently smallint 837 4 10 Aantal personen dat op deze dag in verband met COVID-19 aan een beademingsapparaat ligt.
in behandeling smallint 944 2 17 Aantal tests waarvan de resultaten nog moeten worden vastgesteld.
pos_neg int 18,282 2140 2 Afgeschaft
positief int 16,837 2 1 Totaalaantal personen dat tot dusverre positief is getest op COVID-19.
positive_increase smallint 4,754 1 2 Afgeschaft
beter int 8,286 29 19 Totaalaantal personen dat tot dusverre van COVID-19 is hersteld.
staat tekenreeks 56 MI PA Code van twee letters voor de staat.
total int 18,283 2140 2 Afgeschaft
total_test_results int 18,648 2140 3 Totaalaantal testresultaten dat door de staat is aangeleverd
total_test_results_increase int 13,463 1 2 Afgeschaft

Preview uitvoeren

datum staat positief hospitalized_currently hospitalized_cumulative on_ventilator_currently data_quality_grade last_update_et hekje date_checked dood Ziekenhuis total total_test_results pos_neg Fips death_increase hospitalized_increase negative_increase positive_increase total_test_results_increase fips_code iso_subdivision load_time iso_country negatief in_icu_cumulative on_ventilator_cumulative beter in_icu_currently
2021-03-07 AK 56886 33 1293 2 Nul 3-5-2021 3:59:00 uur dc4bccd4bb885349d7e94d6fed058e285d4be164 3-5-2021 3:59:00 uur 305 1293 56886 1731628 56886 2 0 0 0 0 0 2 US-AK 26-4-2021 12:06:49 uur VS
2021-03-07 AL 499819 494 45976 Nul 3-7-2021 11:00:00 uur 997207b430824ea40b8eb8506c19a93e07bc972e 3-7-2021 11:00:00 uur 10148 45976 2431530 2323788 2431530 1 -1 0 2087 408 2347 1 US-AL 26-4-2021 12:06:49 uur VS 1931711 2676 1515 295690
2021-03-07 AR 324818 335 14926 65 Nul 3-7-2021 12:00:00 uur 50921aeefba3e30d31623aa495b47fb2ecc72fae 3-7-2021 12:00:00 uur 5319 14926 2805534 2736442 2805534 5 22 11 3267 165 3380 5 US-AR 26-4-2021 12:06:49 uur VS 2480716 1533 315517 141
2021-03-07 AS 0 Nul 12-1-2020 12:00:00 uur 96d23f888c995b9a7f3b4b864de6414f45c728ff 12-1-2020 12:00:00 uur 0 2140 2140 2140 60 0 0 0 0 0 60 US-AS 26-4-2021 12:06:49 uur VS 2140
2021-03-07 AZ 826454 963 57907 143 Nul 3-7-2021 12:00:00 uur 0437a7a96f4471666f775e63e86923eb5cbd8cdf 3-7-2021 12:00:00 uur 16328 57907 3899464 7908105 3899464 4 5 44 13678 1335 45110 4 US-AZ 26-4-2021 12:06:49 uur VS 3073010 273
2021-03-07 CA (consistentie en beschikbaarheid) 3501394 4291 Nul 3-7-2021 2:59:00 uur 63c5c0fd2daef2fb65150e9db486de98ed3f7b72 3-7-2021 2:59:00 uur 3501394 49646014 3501394 6 258 0 0 3816 133186 6 US-CA 26-4-2021 12:06:49 uur VS 1159
2021-03-07 CO 436602 326 23904 Nul 3-7-2021 1:59:00 uur 444746cda3a596f183f3fa3269c8cab68704e819 3-7-2021 1:59:00 uur 5989 23904 2636060 6415123 2636060 8 3 18 0 840 38163 8 US-CO 26-4-2021 12:06:49 uur VS 2199458
2021-03-07 CT 285330 428 12257 Nul 3-4-2021 11:59:00 uur bcc0f7bc8c2bf77eec31b25f8b59d510f679d3e7 3-4-2021 11:59:00 uur 7704 12257 285330 6520366 285330 9 0 0 0 0 0 9 US-CT 26-4-2021 12:06:49 uur VS
2021-03-07 DC 41419 150 16 Nul 3-6-2021 12:00:00 uur a3aa0d623d538807fb9577ad64354f48cf728cc8 3-6-2021 12:00:00 uur 1030 41419 1261363 41419 11 0 0 0 146 5726 11 US-DC 26-4-2021 12:06:49 uur VS 29570 38
2021-03-07 DE 88354 104 Nul 3-6-2021 18:00:00 uur 059d870e689d5cc19c35f5eb398214d7d9856373 3-6-2021 18:00:00 uur 1473 633424 1431942 633424 10 9 0 917 215 5867 10 VS-DE 26-4-2021 12:06:49 uur VS 545070 13

Toegang tot gegevens

Azure Notebooks

URL's van verschillende bestandsindelingen voor gegevenssets die worden gehost in Azure Blob Storage:

CSV: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.csv

JSON: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.json

JSONL: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.jsonl

Parquet: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.parquet

Download het gegevenssetbestand met behulp van de ingebouwde mogelijkheid downloaden van een HTTP-URL in Pandas. Pandas heeft lezers voor verschillende bestandsindelingen:

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_parquet.html

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html

import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt

df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.parquet ")
df.head(10)

df.dtypes

df.groupby('state').first().filter(['date','positive', 'death'])

df.groupby(df.state).agg({'state': 'count','positive_increase': 'sum','death_increase': 'sum'})

df_NY=df[df['state'] == 'NY']
df_NY.plot(kind='line',x='date',y="positive",grid=True)
df_NY.plot(kind='line',x='date',y="positive_increase",grid=True)
df_NY.plot(kind='line',x='date',y="death",grid=True)
df_NY.plot(kind='line',x='date',y="death_increase",grid=True)

df_US=df.groupby(df.date).agg({'positive': 'sum','positive_increase': 'sum','death':'sum','death_increase': 'sum'}).reset_index()

df_US.plot(kind='line',x='date',y="positive",grid=True)
df_US.plot(kind='line',x='date',y="positive_increase",grid=True)
df_US.plot(kind='line',x='date',y="death",grid=True)
df_US.plot(kind='line',x='date',y="death_increase",grid=True)



Azure Databricks

Voorbeeld niet beschikbaar voor deze combinatie van platform/pakket.

Azure Synapse

Voorbeeld niet beschikbaar voor deze combinatie van platform/pakket.

Volgende stappen

Bekijk de rest van de gegevenssets in de catalogus Open Datasets.